Jump to content
Jips

5 карт ASUS RX580 4GB DUAL. Отваливается рандомные карты.

Recommended Posts

5 карт ASUS RX580 4GB DUAL. Отваливается рандомные карты. 2 блока питания, 1 - 1квт, 2 - 800 вт. Мать GA-B250-HD3P, 3 PCIe, 2 маленьких разъема. Дрова были как Blockchain так и самые новые. Райзера 006С, есть синхронизатор блоков. Сейчас решил попробовать запускать по 1 карте. Поставил систему, винт, карту и райзер на БП 800 вт, полет нормальный. Добавил вторую карту и райзер, полет нормальный. Решил подключить второй БП на 1 квт. Воткнул синхронизатор. Итого:

  1. 2 карты, система, 2 райзера, винт, синхронизатор (если он вообще что то требует из мощности)
  2. 1 карта, 1 райзер и синхронизатор. 

Итог: карта на блоке 1 квт может стартануть с нормальных хешрейтом, но через 2 - 10 минут отваливается. Что делать? БП оба новые, из коробки. Я уже 3 недели запустить 5 карт не могу. Самый успешный вариант был на 2х других блоках питания по 700 вт. Смог запустить 4 карты из 5, ферма проработала 150 часов. Без перерыва. 

 

P. S. карты с памятью ELPIDA, Тайминги из темы. Хешрейт 29.5 на каждой карте. По одной карты работают на ура, хоть сколько. Ошибок по памяти 0. За 150 часов на одной карте было 2 ошибки и все. 

 

Подскажите, помогите чем можете. Сил моих нет.

Share this post


Link to post
Share on other sites

обновить биос, режимы pcie gen2, gen3 попробовать. 
Можно поробовать ОС поствить другую если 10 стоит то на 7 например.
Для перестраховки бы померять напряжения. Хоть БП и новый были случаи когда с коробки были небольшие просадки  а при  больших нагрузках могут быть больше или вовсе при первом включении сгорал, редко но случай на практике был. Скорее всего ошибаюсь но я бы проверил...

Share this post


Link to post
Share on other sites

да и без разгона прогони сначала, вангую стабильно будет. были у меня асусы, пл перекручен

Edited by xxALEXANDRxx

Share this post


Link to post
Share on other sites
9 часов назад, xxALEXANDRxx сказал:

да и без разгона прогони сначала, вангую стабильно будет. были у меня асусы, пл перекручен

 

Если дело в разгоне, как объяснить, что буквально позавчера работало 4 карты 150 часов без проблем на 2х блоках по 700 Вт, а сегодня не работают даже 3 карты на блоках общим объемом 1800 Вт? И самое главное. По одной они работают и стартуют на ура. 

9 часов назад, Вадим Канивец сказал:

обновить биос, режимы pcie gen2, gen3 попробовать. 
Можно поробовать ОС поствить другую если 10 стоит то на 7 например.
Для перестраховки бы померять напряжения. Хоть БП и новый были случаи когда с коробки были небольшие просадки  а при  больших нагрузках могут быть больше или вовсе при первом включении сгорал, редко но случай на практике был. Скорее всего ошибаюсь но я бы проверил...

Биос обновил, на версию F8. Появилось несколько параметров, в том числе и декодирование свыше 4GB и PCI GEN2 и PCI GEN3. С PCI GEN2 пробовал - не помогло. 

Share this post


Link to post
Share on other sites

если ошибок по памяти нет, а хеш пропадает, то дело в питании или в райзерах. 2 исключено. когда я пл большой на них ставил, фермы зависали через время. собери без разгона все 5, дай поработать. подкрути разгон и посмотри что дальше, пл не трогай. вылет драйвера видика ошибок сыпать не будет, а хеш падает.

Share this post


Link to post
Share on other sites
В 09.03.2018 в 00:38, xxALEXANDRxx сказал:

если ошибок по памяти нет, а хеш пропадает, то дело в питании или в райзерах. 2 исключено. когда я пл большой на них ставил, фермы зависали через время. собери без разгона все 5, дай поработать. подкрути разгон и посмотри что дальше, пл не трогай. вылет драйвера видика ошибок сыпать не будет, а хеш падает.

ПЛ - это что значит. Я нубяра, не силен в формулировках.

 

Смог запустить 4 карты. Думаю дело в БП. Провода, которые идут прям из БП вместе с главным питанием держат карты, а провода которые втыкаются в БП почему то нет(

Share this post


Link to post
Share on other sites
4 часа назад, Jips сказал:

ПЛ - это что значит. Я нубяра, не силен в формулировках.

ПЛ = Пауэр Лимит (power limit) - это предел энергопотребления видеокарты.

Share this post


Link to post
Share on other sites

Если есть ещё блоки питания, то можно попробовать заменить. У меня бывали пару раз проблемы с блоками питания. Заменили и всё окей. Ещё обычно желтые провода темнеют, если карта вылетает.

Share this post


Link to post
Share on other sites

@TheIllusiveMan  по любому что-то подобное.

@Jips смотри питание. Пять карт это 700 в соло и под киловатт в дуале, если не даунвольтил еще больше. Какой-то из твоих блоков тебя имеет.https://forum.bits.media/index.php?/topic/60240-неуловимая-перезагрузка-фермы/ вот тоже и у меня в ом же составе и с теми же проблемами. Это был БП чем не самый главный и новый.

Edited by cleopoison

Share this post


Link to post
Share on other sites
52 минуты назад, TheIllusiveMan сказал:

@Jips БП Aerocool или что-то подобное?

Другое, не помню точно. 

 

41 минуту назад, cleopoison сказал:

@TheIllusiveMan  по любому что-то подобное.

@Jips смотри питание. Пять карт это 700 в соло и под киловатт в дуале, если не даунвольтил еще больше. Какой-то из твоих блоков тебя имеет.https://forum.bits.media/index.php?/topic/60240-неуловимая-перезагрузка-фермы/ вот тоже и у меня в ом же составе и с теми же проблемами. Это был БП чем не самый главный и новый.

Запусти по новой 4 карты. 5ая не поднимается. В системе она есть, но если запустить, то она показывает 0 хешрейт и сбрасывает дрова. Сейчас пока подключено 5, но работают 4 карты стабильно уже 4 часа 31 минуту. 

 

Как я запустил все:

  1. Повешал на основной 2 карты с райзерами и систему, на второстепенный 3 карты с райзерами. Итог: 2 карты на основном запустились, 3 нет. Хешрейт у них 0. 3 райзера на второстепенном были подключены одним проводом.
  2. Подключил все так же за исключением райзеров. Повешал на отдельные провода. Итог: 4 карты стартанули и работают, 1 хешрейт 0. Та самая, которая подключена тройным проводом. Завтра попробую поменять провод, может дело в нём. Сражу отпишусь. Не расходимся.

Share this post


Link to post
Share on other sites

Блять. Я уже не знаю что делать. Моргнул свет. После перезапуска не запускаются уже 2 карты. Что делать я не ебу. Кто нибудь может сказать порядок действий? Как попробовать запускать

Share this post


Link to post
Share on other sites

2 часа работы и было установлено следующее, а именно что нихуя не установлено. 

 

Краткие обозначения:

GPU№ - номер видеокарты

Знаки +\- обозначение работает карта или нет

 

До отключения света:

GPU0 +

GPU1 +

GPU2 +

GPU3 -

GPU4 +

 

Включаю комп, там такая картина:

GPU0 +

GPU1 -

GPU2 +

GPU3 -

GPU4 +

 

Что было сделано. Я переткнул провод питающий райзер GPU1 в GPU2 или GPU4, точно не помню, и провод питающий GPU3 (на него можно повесить 3 sata, подсоединён был 2 разъем) я переткнул на разъем ближе к блоку питания (если понятно, а то я вообще не знаю как объяснить иначе). Итог такой:

 

GPU0 +

GPU1 +

GPU2 +

GPU3 +

GPU4 +

 

держит 5 карт 13 минут. Не расходимся. Продолжаю наблюдение.

Edited by Jips
Подправил текст

Share this post


Link to post
Share on other sites

Вопрос. ПЛ (Power limit) нужно вообще трогать? Если да, то на сколько повышать\понижать его надо?

Share this post


Link to post
Share on other sites

@Jips 

- Если отвалилась карта, выключи риг, выдерни из розетки или щелкни выключателем на блоке (т.е. обесточь риг), после включения отвалившиеся карты появятся. О чудеса :)

- что у тебя в логах системы, вангую kernel power 41 ?!

16 часов назад, Jips сказал:

Вопрос. ПЛ (Power limit) нужно вообще трогать? Если да, то на сколько повышать\понижать его надо?

На, пользуйся .

- успокойся, покури, напиши спокойно что у тебя за блоки (не ври нам тут, мы тебя поругаем и все) и распиши что и как подключено, только подробно.

Безымянный.jpg

Share this post


Link to post
Share on other sites
8 часов назад, cleopoison сказал:

@Jips 

- Если отвалилась карта, выключи риг, выдерни из розетки или щелкни выключателем на блоке (т.е. обесточь риг), после включения отвалившиеся карты появятся. О чудеса :)

- что у тебя в логах системы, вангую kernel power 41 ?!

На, пользуйся .

- успокойся, покури, напиши спокойно что у тебя за блоки (не ври нам тут, мы тебя поругаем и все) и распиши что и как подключено, только подробно.

Безымянный.jpg

Так, по настройкам биоса, тайминги отсюда, 1167/2020, если ставить больше 2020 - то валятся ошибки, старался разогнать, что бы ошибок не было. Блока 2, оба Aerocool (Извините, если где сказал, что не они, ошибся) первый, второй. 2 карты, 2 райзера, винт и мать подключены к первому, 3 карты, 3 райзера и проц. ко второму. Все подключено отдельными кабелями. Есть синхронизатор блоков питания, этот. Вроде все. ПО разгону держат 29.5 MH\s

Share this post


Link to post
Share on other sites

@Jips Кстати ДА @Rastishka дело говорит, мать то точно гавно, я то сразу не заметил. Плюсик ему и читай ссылки.

Share this post


Link to post
Share on other sites

Добрый день, многоуважаемые. Все пошло по пизде, вот буквально вчера в 1.37 по моему времени (+7 часовой пояс). Сбросилась до 0 Mh\s одна видеокарта, никаких физических контактов с фермой не было, стоит в изолированном помещении. После перезагрузки, стартуют все пять, но по истечению времени отваливается одна - GPU3. Кто нибудь знает для блоков питания, где провода можно отсоединять, продаются провода отдельно? Если да, то может кто что порекомендует?  

 

Сразу скажу, что по ссылкам, которые были представлены, было сделано все, разница лишь в том, что там биос F9, а у меня стоит F8. 

Edited by Jips
Дописывал

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...