Перейти к публикации
iruliuya

Кульбиты с RX580 и Claymore, помогите!

Рекомендованные сообщения

(изменено)

Добрый день, друзья!

Сейчас вы меня запинаете, что таких тем миллион, НО. Я уже все облазил и меня уже трусит от советов.

Значит ситуация такая, собственно фееричная. Ну как обычно, мне везет с настройкой и с ловлей глюков. 

Буду описывать все детально, может у кого-то было, может кто даст дельный совет.

Есть 3 карты MSI RX580 Armor 8GB. ASIC 70%, 71.2%, 71%. Чип Micron.

2 БП AEROCOOL, по 700W, 2 карты подключены на 1 блок, 1 карта и все что с материнкой на второй блок.

ОЗУ 4 GB, Проц Celeron какой-то (2.9 ггц).

Поставил винду 8.1, Driver Pack установил дрова необходимые, без драйвера видюхи, потом поставил дрова видюхи для майнинга, пропатчил патчером, пошил таймингом:

Цитата

777000000000000022AA1C0073626C41B0551016BA0D260B0060060004061420EA8940AA030000001914292EB22E3B16

В помещении ~5-10 градусов где они настраивались.

Начинаю выявлять максимальные частоты на каждой карте и сую их по очереди. В итоге определил что настройки по разгону у них совпадают и можно поставить галку "Синхронизировать настройки одинаковых GPU" (да-да. уже что-то необычное, я обычно эту галку избегал, потому-что все карты индивидуальны, но решил ее поставить так как ни разу с чипом Micron не сталикивался, да и ASIC quality почти одинаковый у всех).

В Afterburner забиваю следующие настройки: 

Core Voltage -90

Power Limit: -0

Core Clock 1160

Memory Clock: 2180.

Открываю HW Info и вижу что GPU Error не сыпятся ни с одной из карт и это круто. 

Запустил, крутятся - эфир+декред. Эфир в сумме 92 мегахеша (по 30-31 с карты), декред 2700.

Пойду спать подумал я. Все это дело работает с 12 ночи до 11 утра. Все ОК.

 

Гашу ферму что бы унести ее в другое место, приношу.

В новом помещении внутри +24-26. Подключаю в точности до разъемов молексов на райзерах, как было на тестах во время сборки, запускаю - через 10 минут ферма выключается полностью и лежит. Тупо будто по питанию что-то.

Настройки спящего режима я естественно отключил сразу, обновления тоже сразу отключил.

Начал крутить настройки в афтербернете. В Power Limit перепробовал все значения, и на +54 и +6. В Core Voltage тоже покрутил и 0 делал и -120 и ничего не менялось. Core Clock крутил максиму до 1260 с шагом по 20 - в общем не помогло ничего. Выключается с интервалом 10-30 минут.

Подумал я возможно где-то контакт плохой или по питанию. Замеряю прибором - в сети 238 вольт. Это хорошо. Разобрал всю ферму, очень хорошо все подключил, питание карт до щелчков, питание материнки всю ерунду короче максимально плотно соединил. Карты в райзерах стоят ровно, все ок. Запускаю. Супер. Уже не ложится беспричинно. 

Далее следующая эпопея: запускаю claymore, он работает 8 часов со скоростью 92 мегахеша в сумме, и резко выдает: 

 

Цитата

01:20:43:123    b4c    em hbt: 16, dm hbt: 40719, fm hbt: 94, 
01:20:43:123    b4c    watchdog - thread 0 (gpu0), hb time 266
01:20:43:139    b4c    watchdog - thread 1 (gpu0), hb time 125
01:20:43:154    b4c    watchdog - thread 2 (gpu1), hb time 172
01:20:43:170    b4c    watchdog - thread 3 (gpu1), hb time 31
01:20:43:170    b4c    watchdog - thread 4 (gpu2), hb time 92203
01:20:43:186    b4c    WATCHDOG: GPU 2 hangs in OpenCL call, exit
01:20:43:186    b4c    watchdog - thread 5 (gpu2), hb time 92391
01:20:43:186    b4c    WATCHDOG: GPU 2 hangs in OpenCL call, exit
01:20:43:326    b4c    Quit, please wait...
01:20:54:423    b4c    Restarting OK, exit...

Ребутается майнер и вешается и началось снова. Вешается так, что невозможно закрыть никак. Приходится перезагружать систему и после этого получать сообщение что ваша система работала с ошибкой, отправить/не отправить отчет.

Где-то на форумах узнал что в тот момент как вешается карта в графике температуры карт в афтербернере можно получить код ошибки (511 или что-то такое) - нет. Такого небыло.

Чуть понизил разгон до Core Clock 2100 MHz (такой большой шаг что бы уже наверняка), вроде крутится. Ухожу снова спать, через 3 часа приходит сообщение, что майнер лег.

Открываю логи вижу что? вот что:

Цитата

04:15:19:908    ec0    watchdog - thread 0 (gpu0), hb time 78
04:15:19:908    ec0    watchdog - thread 1 (gpu0), hb time 172
04:15:19:908    ec0    watchdog - thread 2 (gpu1), hb time 87781
04:15:19:924    ec0    WATCHDOG: GPU 1 hangs in OpenCL call, exit
04:15:19:924    ec0    watchdog - thread 3 (gpu1), hb time 87875
04:15:19:924    ec0    WATCHDOG: GPU 1 hangs in OpenCL call, exit
04:15:19:939    ec0    watchdog - thread 4 (gpu2), hb time 47
04:15:19:939    ec0    watchdog - thread 5 (gpu2), hb time 125
04:15:20:064    ec0    Quit, please wait...
04:15:31:019    ec0    Restarting OK, exit...

 

ну и майнер висит вот так:

Цитата

05:05:20:077    bc    Check and remove old log files...
05:05:20:077    bc    args: -epool eth-eu1.nanopool.org:9999 -esm 0 -ewal 0x9476b37b9d29b544e91a004ed94706dd6331f22d.slm/[email protected] -epsw x -dpool dcr.suprnova.cc:3252 -dwal sxxs78.slm -dpsw x -dcri 28 
05:05:20:093    bc    
05:05:20:108    bc    ЙНННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННН»
05:05:20:108    bc    є     Claymore's Dual ETH + DCR/SC/LBC/PASC GPU Miner v10.6      є
05:05:20:108    bc    ИННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННННј
05:05:20:124    bc    
05:05:20:124    bc    b471 
05:05:20:352    bc    ETH: 1 pool is specified
05:05:20:352    bc    Main Ethereum pool is eth-eu1.nanopool.org:9999
05:05:20:367    bc    DCR: 1 pool is specified
05:05:20:383    bc    Main Decred pool is dcr.suprnova.cc:3252
05:05:53:164    144    
05:06:25:899    144    
05:06:58:665    144    
05:07:31:454    144    
05:08:04:250    144    
05:08:36:950    144    
05:09:09:636    144    
05:09:42:418    144    
05:10:15:179    144    
05:10:47:974    144    
05:10:47:974    144    Miner cannot initialize for 5 minutes, need to restart miner!
05:10:47:989    144    ADL: Cannot find any AMD adapters
05:10:49:224    144    Restarting OK, exit...


 

Включаю комп, при запуске снова вижу ошибку что система нестабильна, думаю ОК.

Думаю раз висит майнер и не перезапускается, надо обновить его (вдруг мой 10.2 резко устарел?). Качаю свежий (Claymore's Dual Ethereum+Decred_Siacoin_Lbry_Pascal AMD+NVIDIA GPU Miner v10.6), забиваю настройки.

Ситуация та же. Дальше мысли пошли в сторону декреда. Может у меня интенсивность большая. Играю со значениями -dcri 28 - 21 - не помогает. Оставил 28.

Надоело, сношу все дрова через DDU, ребутаюсь, ставлю снова дрова, ребутаюсь, ставлю патч - НИЧЕГО НЕ ИЗМЕНИЛОСЬ, С%КА думаю, что ж ты будешь делать. Теперь думаю что что-то с таймингами не то. Открываю Polaris, тыкаю кнопку One Click Time Patching (или как-то так), зашиваю во все три карты. Ситуация не меняется. Все так же как и было. Посидел подумал, протер монитор тряпочкой, через час появляется следующая ошибка:

Цитата

WATCHDOG: GPU 2 hangs in OpenCL call, exit

думаю переразогнал 2 карту (хотя как я это сделал, если GPU Errors небыло), гашу ее через Claymore, определяю в афтербернере какая она там по счету, уменьшаю разгон до стока - запускаю и о чудо пока работает!

Через два часа я получаю:

Цитата

WATCHDOG: GPU 1 hangs in OpenCL call, exit

ОК! Меняю в сток настройки для GPU1.

Работает. Работает уже 2 часа, но скорость 79 мегахешей и это как-то грустно, после того как я видел там 31,5.

 

Еще не прошивал биос материнки, оставил как был сток из магазина.

Отключил все лишние устройства в биосе, типа звуковой карты, LPT и COM портов.

В msconfig отключил службы которые не связаны с Microsoft и не нужны в автозапуске.

Еще переустановил Afterburner, но и это не помогло.

В планах вставлять карты по одной прямо в материнку и смотреть на результат.

Потом я собираюсь переустановить винду с нуля.

Кто что скажет? У меня уже иступление эмоций и истерика скоро будет...

Изменено пользователем iruliuya

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
18 минут назад, iruliuya сказал:

Поставил винду 8.1

Почему именно её? Уже вызывает вопросы...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, ushba сказал:

Почему именно её? Уже вызывает вопросы...

у меня 2 рига собраны на ней и успешно работают, я и накатил эту же систему сюда.

Изменено пользователем iruliuya

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Какие кульбиты, обычная/стандартная настройка как и у всех, только много лишних движений делаешь. Частоту памяти убирай / напряжение добавляй на зависающих гпу вот и весь секрет. Отсутствие ошибок в HW вообще ниочём не говорит, это очень косвенный признак, на некотрых таймингах там всегда 0 и при этом карта переразогнана по самые помидоры и падает каждые 5 мин.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ничего тут страшного нет - стандартный переразгон

Начинай с небольшого разгона и постепенно увеличивай (напряжение только то что -96 ставь, остальную напругу не трогай, только если не останется других вариантов). И отключи декред на время тестов

Изменено пользователем prorok

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

По памяти 2180 - реально много для Микрона. Стабильно на 2050 - 2070  будет работать - и хорошо.

Даунвольт -90   - не догма, добавляй по 12-18 милливольт, пока не найдёшь  стабильную точку.
Ну, и температуру ядра не доводи до 70 градусов...

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

В АВ даунвольт вообще очень посредственный, -100мв это ниочём, даунвольтни клэймором посильнее.

Изменено пользователем AlexShmalex

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
38 минут назад, prorok сказал:

ничего тут страшного нет - стандартный переразгон

 

+1. Поставь 1900mhz и шагами по 50 до 2050. Где стабильней там и оставайся.

не выдают абсолютно все карты такие по 30 mhs и с этим придется пока что смириться :cray:

и даунвольт можно побоильше сделать. -150 в MSI afterburner по моему самое оно.

28-29mhs но стабильных по моему хороший результат.

 

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Добавлю, что чем лучше охлаждаешь тем лучше гонится. Больше 20 в помещении это парилка

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
1 час назад, AlexShmalex сказал:

Какие кульбиты, обычная/стандартная настройка как и у всех, только много лишних движений делаешь. Частоту памяти убирай / напряжение добавляй на зависающих гпу вот и весь секрет. Отсутствие ошибок в HW вообще ниочём не говорит, это очень косвенный признак, на некотрых таймингах там всегда 0 и при этом карта переразогнана по самые помидоры и падает каждые 5 мин.

вот этого я не знал. почему-то думал, что нужно гнать, пока ошибки не посыпятся. а тут нет ошибок и я даже немного удивлен был. такая частота памяти и нет ошибок.

 

1 час назад, ushba сказал:

По памяти 2180 - реально много для Микрона. Стабильно на 2050 - 2070  будет работать - и хорошо.

Даунвольт -90   - не догма, добавляй по 12-18 милливольт, пока не найдёшь  стабильную точку.
Ну, и температуру ядра не доводи до 70 градусов...

 

спасибо за инфу. такое впечателние что микрон редко кому попадается, и я тот самый счастливчик

 

11 минуту назад, Btckrug сказал:

Добавлю, что чем лучше охлаждаешь тем лучше гонится. Больше 20 в помещении это парилка

пока нет варианта к сожалению попробовать в более холодном месте. но там реально парилка, в помещении стало около 30-32. хотя помещение маленькое.

 

 

ИТОГ: спасибо, всем, кто откликнулся. благодаря вам я почерпнул больше информации о микроне

Сейчас выставил:

CV: -87

PL: +50

CC: 1160 MHz

MC: 2070 MHz

 

час работы - полет стабильный. может будет все нормально, по результатам отпишусь

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Переразгон же обычный, о каких кульбитах речь? 

СТавь 1045 ядро 2000 память к примеру и тестируй стабильность.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

в общем прошло время. я потестировал. результат - ничего не изменилось

в данный момент риг перенесен в помещение с температурой 10-12 градусов.

 

В 27.01.2018 в 11:57, iruliuya сказал:

вот этого я не знал. почему-то думал, что нужно гнать, пока ошибки не посыпятся. а тут нет ошибок и я даже немного удивлен был. такая частота памяти и нет ошибок.

 

спасибо за инфу. такое впечателние что микрон редко кому попадается, и я тот самый счастливчик

 

пока нет варианта к сожалению попробовать в более холодном месте. но там реально парилка, в помещении стало около 30-32. хотя помещение маленькое.

 

 

ИТОГ: спасибо, всем, кто откликнулся. благодаря вам я почерпнул больше информации о микроне

Сейчас выставил:

CV: -87

PL: +50

CC: 1160 MHz

MC: 2070 MHz

 

час работы - полет стабильный. может будет все нормально, по результатам отпишусь

 

описанные выше частоты не помогли для работы. риг проработал 7 часов и лег.

сейчас температуры карт не перегреваются, т.к. выставил в клейморе -tt 70. Без него в новом помещении греется 74-76 градусов.

потом я уменьшил интенсивность декреда: -dcri 24 (стояло 28). Проработало 2 часа и легло, отвалился GPU1.

 

Цитата

19:46:01:699    964    sent: 225
19:46:05:559    3b4    em hbt: 16, dm hbt: 16, fm hbt: 94, 
19:46:05:559    3b4    watchdog - thread 0 (gpu0), hb time 16
19:46:05:575    3b4    watchdog - thread 1 (gpu0), hb time 109
19:46:05:590    3b4    watchdog - thread 2 (gpu1), hb time 75594
19:46:05:590    3b4    WATCHDOG: GPU 1 hangs in OpenCL call, exit
19:46:05:590    3b4    watchdog - thread 3 (gpu1), hb time 75500
19:46:05:590    3b4    WATCHDOG: GPU 1 hangs in OpenCL call, exit
19:46:05:606    3b4    watchdog - thread 4 (gpu2), hb time 78
19:46:05:606    3b4    watchdog - thread 5 (gpu2), hb time 156
19:46:05:606    3b4    watchdog - thread 6 (gpu3), hb time 156
19:46:05:622    3b4    watchdog - thread 7 (gpu3), hb time 94
19:46:05:903    3b4    Quit, please wait...
19:46:16:862    3b4    Restarting OK, exit...

Ну и повис майнер.

 

Перезапустил, вот, что сейчас в логах майнера.

Цитата

20:00:09:319    9e8    ETH: GPU0 27.546 Mh/s, GPU1 27.577 Mh/s, GPU2 27.623 Mh/s, GPU3 27.606 Mh/s
20:00:09:324    9e8     DCR - Total Speed: 2648.430 Mh/s, Total Shares: 1(0+1+0+0), Rejected: 1(0+1+0+0)
20:00:09:329    9e8     DCR: GPU0 661.093 Mh/s, GPU1 661.840 Mh/s, GPU2 662.947 Mh/s, GPU3 662.550 Mh/s
20:00:09:333    9e8    Incorrect ETH shares: none
20:00:09:338    9e8    1 minute average ETH total speed: 109.292 Mh/s
20:00:09:345    9e8    Pool switches: ETH - 0, DCR - 0
20:00:09:350    9e8    Current ETH share target: 0x000000006df37f67 (diff: 10000MH), epoch 166(2.30GB)
Current DCR share target: 0x0000000003fffc00 (diff: 274GH), block #208497
20:00:09:382    9e8    GPU0 t=65C fan=31%%, GPU1 t=67C fan=41%%, GPU2 t=66C fan=34%%, GPU3 t=61C fan=31%%

 

 

Вот, что в конфиге:

Цитата

setx GPU_FORCE_64BIT_PTR 0
setx GPU_MAX_HEAP_SIZE 100
setx GPU_USE_SYNC_OBJECTS 1
setx GPU_MAX_ALLOC_PERCENT 100
setx GPU_SINGLE_ALLOC_PERCENT 100
EthDcrMiner64.exe -epool eth-eu1.nanopool.org:9999 -esm 0 -ewal 0x9476b37b9d29b544e91a004ed94706dd6331f22d.slm/[email protected] -epsw x -dpool dcr.suprnova.cc:3252 -dwal sxxs78.slm -dbg 1 -dpsw x -dcri 24

 

image.thumb.png.60eb89d957d7007394f0fe92f040001c.png

 

 

я уже думаю может БП не тянут? Все-таки на одном хвосте две карты. Немного греются. Совсем слегка.

какие еще предложения?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Очень горячие карты, а вентиляторы еле крутят, настройте нормально кривую.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
4 минуты назад, Alexpo сказал:

Очень горячие карты, а вентиляторы еле крутят, настройте нормально кривую.

чем метод настройки кривой лучше, чем параметр -tt 70?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
5 минут назад, iruliuya сказал:

чем метод настройки кривой лучше, чем параметр -tt 70?

 

Ничем, на некотрых картах ниже 50С по чипу идёт полное отключение вентиляторов и -tt не срабатывает. Вот тогда АБ нужен, а вообще надо минимум 70% вентиляторы держать даже в лютом минусе.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
1 минуту назад, AlexShmalex сказал:

 

Ничем, на некотрых картах ниже 50С по чипу идёт полное отключение вентиляторов и -tt не срабатывает. Вот тогда АБ нужен, а вообще надо минимум 70% вентиляторы держать даже в лютом минусе.

что же будет летом, когда в помещении +28-32? На 100% крутить постоянно вентиляторы?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
3 минуты назад, iruliuya сказал:

что же будет летом, когда в помещении +28-32? На 100% крутить постоянно вентиляторы?

Это единственно верный вариант так то, иначе питальник умрёт быстрей чем ты думаешь, что удивляет?

Изменено пользователем AlexShmalex

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

у меня Клеймор не хочет раскручивать вентиляторы , а с АБ норм жужжит в соло 52 градуса, в дуале 62.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
Цитата

3:47:30:290    a54     DCR: GPU0 664.335 Mh/s, GPU1 668.028 Mh/s, GPU2 0.000 Mh/s, GPU3 664.158 Mh/s
03:47:30:290    358    WATCHDOG: GPU 2 hangs in OpenCL call, exit
03:47:30:290    358    watchdog - thread 6 (gpu3), hb time 78
03:47:30:306    358    watchdog - thread 7 (gpu3), hb time 16
03:47:30:447    358    Quit, please wait...
03:47:41:401    358    Restarting OK, exit...

 

ну вот. то же самое. отвалилось. при температурах:

image.thumb.png.7602d2c02019c1a87d06c35abe1d6cc4.png

 

настройка АБ:

image.thumb.png.36e6e93e6f28c9a2bd8ba67a9da2fdd3.png

 

еще какие есть варианты?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Переустановил систему, поставил Win 7. 

С БП выходит разъем доп питания карты, по одной сопле с каждого БП. Купил разъмы молекс -> 8 pin. Подключил по карте на соплю. Запустил, пока полтора часа крутится.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не помогло. Начало вешаться наглухо. Прошил другие тайминги. Проработало 3,5 часа - повисло наглухо.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

если у тебя ферма виснет при дуале, может для начала попробовать её стабилизировать в соло

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×