Перейти к содержанию

Ошибка HW


kezavrik

Рекомендуемые сообщения

Друзья, помогите, пожалуйста, уже намучился, никак не могу понять в чем проблема.

Имеется ферма из двух видеокарт AMD Radeon r9 280x (DC2T-3GD5), все работает нормально, но всегда на одной из двух видеокарт через какой-либо промежуток времени начинают вылазить HW от 1 до 4, причем вторая видюха нормально функционирует

 

вот конфиг 

 

cgminer --scrypt -w 256 --thread-concurrency 8192 --gpu-fan 100 --gpu-engine 1040 --gpu-memclock 1450 -d 0 -d 1 -g 2 --intensity 13 -o x -u x -p x

 

 

Раньше --thread-concurrency стояло 8191 при таком значении ошибки вылетали через 1-2 часа, менял на 8190 не помогло, поменял потом 8192 и радости моей не было предела, стабильно работала без ошибок часов 10-12, но потом с утра проснувшись, смотрю снова 2 ошибки. Оставил майниться лайты на койнотроне вообще за ночь набежало 5 ошибок

Но сегодня с утра, я конкретно оболдел, вылезло 19 ошибок, причем все на той же злополучной видеокарте.. Помогите пожалуйста.

 

PS одна карта выдает 720кхеш (которая работает нормально), а другая, у которой выскакивают ошибки чуть поменьше (710-715)

 

PPS значения --gpu-engine и memclock особо сильно изменениям не подвергались, небольшие изменения значений

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

Рецепта нет,   смотреть надо индивидуально.

Попробуй например память до 1500 поднять, или вместо TC 8192 поставить shaders 2048

Ссылка на комментарий
Поделиться на другие сайты

Рецепта нет,   смотреть надо индивидуально.

Попробуй например память до 1500 поднять, или вместо TC 8192 поставить shaders 2048

 

Спасибо, поднял пока память, посмотрим.

А не может быть такое, что видеокарта слегка бракованная или может быть со слотом что-то? 

 

 

PS вылезла ошибка.. ставлю shaders...

upd с шейдерами на обоих по 150-200 ошибок

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

у той которая сыпет ошибки ставь --thread-concurrency 10000 навскидку пока..и погляди

Ссылка на комментарий
Поделиться на другие сайты

у той которая сыпет ошибки ставь --thread-concurrency 10000 навскидку пока..и погляди

 

при запуске сразу выдает это

h_1393175051_3726474_5a731c60e3.png

если поставить thread-concurrency 819то получается то же самое

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

setx GPU_MAX_ALLOC_PERCENT 100

setx GPU_USE_SYNC_OBJECTS 1

Изменено пользователем poiuty
Ссылка на комментарий
Поделиться на другие сайты

у той которая сыпет ошибки ставь --thread-concurrency 10000 навскидку пока..и погляди

 

 

setx GPU_MAX_ALLOC_PERCENT 100

setx GPU_USE_SYNC_OBJECTS 1

 

поставил, cgminer запустился нормально, будем посмотреть. спасибо

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

у той которая сыпет ошибки ставь --thread-concurrency 10000 навскидку пока..и погляди

 

не помогло, ошибка вылетела где-то через час

 

ради интереса поставил t-c 0, и cgminer в бине показал значение "22400", но при этом одна видеокарта работает как обычно, а у другой (проблемной) скорость 20-30 кх/c (!!!), это что за прикол такой

 

на ночь сегодня поставил со значением t-c 15k так 10 ошибок выдало за 7 часов

 

ps может быть майнер староват 3.5.0? Я ведь брал карты 2 недели назад и мой друг, который их брал 15 декабря, говорит, что у меня типа новое поколение и тд тп (они реально различались по внешнему виду)

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

HW обычно из-за переразгона вылазят. Уменьшай частоту ядра постепенно (по 10 мгц) пока не перестанут появляться. И ещё t-c лучше ставить 8191 для этих карт

Ссылка на комментарий
Поделиться на другие сайты

HW обычно из-за переразгона вылазят. Уменьшай частоту ядра постепенно (по 10 мгц) пока не перестанут появляться. И ещё t-c лучше ставить 8191 для этих карт

 

хорошо, будем пробовать

насчет t-c не знаю, после того как я поставил 8192 (до темы на форуме) ошибки стали появляться позже с 8191 уже через полчаса были, а с 8192 через час-полтора-два

Ссылка на комментарий
Поделиться на другие сайты

В общем изменял настройки ошибки все равно вылетают, вот самые лучшие результаты:

 

 

733-734 - скорость на 1-ой карте - 0 HW
705-706 - 2-ая - 2 HW за 11 часов
--thread-concurrency 8192,8192 --gpu-engine 1060,1030 --gpu-memclock 1500,1450
 
732 - 0 HW
708 - 1 HW через 7 часов 
--thread-concurrency 8192,8191 -gpu-engine 1060,1030 --gpu-memclock 1500,1500

 

 

PS на первой карте ошибки вообще не вылетают

PPS дрова 13.12, win7 x64, мать ASUS Z87-A, оперативки 8 гигов

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

@kezavrik, напругу чуть добавь на вторую карту..

 

извините за глупый вопрос, но под напругой имеется ввиду t-c? если да, то я ставил 11200 и ошибки начинали вылетать через 3-4 часа уже

Ссылка на комментарий
Поделиться на другие сайты

У меня 4 таких карты, майнят 760 каждая попробуй как у меня --thread-concurrency 8192 --gpu-engine 1090,1090 --gpu-memclock 1500,1500

Ссылка на комментарий
Поделиться на другие сайты

У меня 4 таких карты, майнят 760 каждая попробуй как у меня --thread-concurrency 8192 --gpu-engine 1090,1090 --gpu-memclock 1500,1500

 

GPU-Z показывает что у меня GPU Clock 1070, даже не знаю стоит ли ставить.. при том, чем больше gpu-engine у меня, тем быстрее вылетают ошибки

ладно.. попробую)

Ссылка на комментарий
Поделиться на другие сайты

мое наблюдение по поводу HW, может будет полезно. 

прикупилась лишняя видюха, в ферме места не было, пришлось собрать под нее побыстрому говнокомп из первого попавшегося бэу железа(его у меня достаточно). 

Так вот, на говно железе при -i 20 на видюхе полезли HW. исчезали только при -i14. ну ведь так не годится. и давай я мучать и тренд-конкуренцию и разгоны и павер тюны, пофигу. Подумал а не в железе ли дело, сунул карту в ферму-ошибок нет.

понеслась -блоки питания ставил разные от 450ватт), в итоге поцепил 850ватт с фермы, -пофик, память разную, процы,  пофик - тоесть проблема в мамке, т.к итоге подобрал говномать и семпрон 8 милетней давности на плате наибюджетнейшой того времени MSI, и 550ватном бэу бп инвин ) и все пошло без HW. карты выдает без ошибок свои положенные кхэши.

 

к чему я все это, многие пишут, что если видюха дает HW, значит или переразгон или видюхе хана. можно бится с этим долго, и видюху идти сдавать в магазин, но вот вам третий вариант - мать говно\не подходит для майна. размышляйте

Изменено пользователем dragodsm
Ссылка на комментарий
Поделиться на другие сайты

мое наблюдение по поводу HW, может будет полезно. 

прикупилась лишняя видюха, в ферме места не было, пришлось собрать под нее побыстрому говнокомп из первого попавшегося бэу железа(его у меня достаточно). 

Так вот, на говно железе при -i 20 на видюхе полезли HW. исчезали только при -i14. ну ведь так не годится. и давай я мучать и тренд-конкуренцию и разгоны и павер тюны, пофигу. Подумал а не в железе ли дело, сунул карту в ферму-ошибок нет.

понеслась -блоки питания ставил разные от 450ватт), в итоге поцепил 850ватт с фермы, -пофик, память разную, процы,  пофик - тоесть проблема в мамке, т.к итоге подобрал говномать и семпрон 8 милетней давности на плате наибюджетнейшой того времени MSI, и 550ватном бэу бп инвин ) и все пошло без HW. карты выдает без ошибок свои положенные кхэши.

 

к чему я все это, многие пишут, что если видюха дает HW, значит или переразгон или видюхе хана. можно бится с этим долго, и видюху идти сдавать в магазин, но вот вам третий вариант - мать говно\не подходит для майна. размышляйте

 

спасибо за ответ, уже давно пришел к выводу (да и владельцев крупных ферм также было), что ошибки сыпятся из-за слота PCI-E x16 3.0

и дело правда не в разгоне, у меня видюшка, которая стоит в слоте x2 пашет разогнанная на макс без ошибок вообще. ради интереса также разогнал свою проблемную, так она через 10 минут в SICK ушла и даже на частотах НИЖЕ стандартных все равно идут ошибки, а в другой слот вставить пока нет возможности

 

 

@kezavrik, напряжение на вторую карту имеется ввиду..на 0.01-0.02в

 

 

увеличение и уменьшение не помогло(

Изменено пользователем kezavrik
Ссылка на комментарий
Поделиться на другие сайты

@kezavrik, может в Биос-е матери поковыряться... перевести все PCIE в режим 1х? или что нить подобное...

Ссылка на комментарий
Поделиться на другие сайты

@kezavrik, может в Биос-е матери поковыряться... перевести все PCIE в режим 1х? или что нить подобное...

 

а разве можно так сделать? в биос пока не залазил, но смотрел обзоры не нашел в них ничего похожего на это

Ссылка на комментарий
Поделиться на другие сайты

а можно ли сделать так, чтобы в лог писалось, когда появилась ошибка и причина ее?

 

в cgminer добавил 

2>%time:~0,2%-%time:~3,2%_%DATE:/=%.log

 

 

но в логе все тоже самое что и в майнере

Ссылка на комментарий
Поделиться на другие сайты

 

@kezavrik, может в Биос-е матери поковыряться... перевести все PCIE в режим 1х? или что нить подобное...

 

Единственное, что нашел в биосе связанное с PCI-E это скорость, есть 3 выбора: auto, gen1, gen2. Выбирал и gen1 и gen2. Не помогло, буду наверное ставить более новый биос

Ссылка на комментарий
Поделиться на другие сайты

@kezavrik,кстати до сих пор балуюсь с настройками карт..замечено следующее.. на 7870 если в один поток и ставить TC от 8193 до примерно 11000...тоже вылазят ошибки.. Делаю больше 13000 ошибок нет. В двухпоточном режиме на 8193 нормально работает..

Ссылка на комментарий
Поделиться на другие сайты

@Lion74, так я уже какой только tc не перепробовал, все равно летят ошибки

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Similar Topics

    • Элизабет Уоррен: Одобрение биржевых фондов на биткоин — большая ошибка

      Сенатор от штата Массачусетс, самый активный критик криптовалют в американском парламенте, заявила, что решение Комиссии по ценным бумагам и биржам США (SEC) может нанести урон финансовой системе страны. Элизабет Уоррен (Elizabeth Warren) считает, что ведомство слишком опрометчиво одобрила запуск ETF на биткоин, совершив большую ошибку.   «Без ответа осталось много вопросов: как мы защитим обычных инвесторов от потери с трудом заработанных сбережений? Сможем ли сохранить нашу финансов

      в Новости криптовалют

    • Брайан Армстронг: «Причиной краха FTX не может быть бухгалтерская ошибка»

      Генеральный директор Coinbase Брайан Армстронг раскритиковал заявление бывшего главы FTX о том, что причиной краха биржи стала «бухгалтерская ошибка» на $8 млрд. Он считает, что средства были украдены. Брайан Армстронг (Brian Armstrong) написал в Твиттере, что миллиарды долларов никак не могли просто ускользнуть от внимания основателя и бывшего генерального директора FTX Сэма Бэнкман-Фрида (Sam Bankman-Fried), который окончил Массачусетский технологический институт со степенью в области физ

      в Новости криптовалют

    • Сэм Бэнкман-Фрид: «Заявление на банкротство FTX ― моя самая большая ошибка»

      Бывший генеральный директор биржи FTX, которая находится в процессе банкротства, заявил, что сильнее всего он жалеет именно о подаче заявления по статье 11 Кодекса США о банкротстве. Сэм Бэнкман-Фрид (Sam Bankman-Fried) поделился в Твиттере своими мыслями о регуляторах, этике и действиях Alameda. Основатель FTX признал, что сделал множество ошибок, но крупнейшей стало заявление на банкротство.   «Я облажался множество раз. Но знаете мою крупнейшую ошибку? Все мне говорили подавать п

      в Новости криптовалют

    • Кубики («Ошибка игрока»)

      УГУ Просто для примера - возьмите монету и подбрасывайте. Если вы будете её год подбрасывать примерно 10 раз в минуту и вам хоть раз выпадет подряд 15 орлов или решек - дайте мне знать))

      в Флейм

    • В Solana исправлена приводившая к остановке работы сети ошибка

      Разработчики Solana сообщили, что исправили ошибку, которая уже несколько раз приводила к остановке работы блокчейна. В статье в блоге разработчики объяснили, что баг заключался в функции постоянных одноразовых транзакций. При определенном стечении обстоятельств ошибка позволяла дважды обрабатывать неудачную одноразовую транзакцию. Это приводило к отсутствию консенсуса – одни валидаторы отклоняли последующий блок, а другие принимали его.   «Функция постоянных одноразовых транзакций

      в Новости криптовалют

×
×
  • Создать...