Скорее всего ткну пальцем в небо, но бывает такое чудо, как неработающий (должным образом) удлинитель с кнопкой (он же сетевой разветвитель, пилот и т.п.). Сам с месяц искал причину периодических (от часа до трёх суток) Kernel-power 'ов в райзерах, бп, проводах и прочей обвязке. Причиной оказался "пилот" с кнопкой отключения обоих контактов и предохранителем. Не разбирался кто из них сходил с ума, выпаял из цепи предохранитель, сменил кнопку и отправил его трудиться в телевизионную группу.
Ну и словцо про коды ошибок в "ZECMINER" 0.3.4b.
Вылеты карт (по моему опыту) случались исключительно из-за дисбаланса напряжение-частота (при оптимизации тепловыделения настройками Afterburner). Так вот, написал себе по батнику на каждую карту в выбранном пуле\монете (параметр батника --cuda_devices). И смотрел какая карта рапортует ошибки (ну и менял её параметры). Профит: при отвале одной карты (батника) - остальные работают (только отрубается замер потребления), в отличие от батника на весь риг.