Добрый день всем кто может помочь! Несколько раз в сутки перестает работать ферма, возобновляется после принудительной перезагрузки (т.е. вилку из штекера и обратно)))! Блок питания на 2360W, пять карт (все работают через рэйзеры), с одной карты (390) были убраны заводский кулера и поставил обычные (может быть тут проблема), разгон карт не делал! В файле txt есть такие записи Got incorrect temperature 511, ignore или Failed to get fan speed infо (Понимаю что написано о проблеме с температурой и скоростью кулеров, но не знаю как это исправить), либо вот такая ошибка WATCHDOG: GPU 1 hangs in OpenCL call, exit ! Установлена программа Speed Fan. Она контролирует температуру хорошо, но в какой-то момент виснит вся система и после просмотра файла txt вижу такие ошибки как я описал! Если нужны еще данные, говорите! Всем спасибо за помощь!
P.S. Не пишите что я задаю глупые вопросы (хоть это может быть и правда), я рад что у Вас куча опыта за спиной, но у меня его нет! Если это обговаривалось где-то на форуме, то извините, но я не нашел этого (если можете дайте ссылку)!