Перейти к публикации
shura2002

Квест "найди предателя" или история глюкавой фермы

Рекомендованные сообщения

Всем доброго времени суток. Сейчас будет много букв и загадочной магии )

История началась с того, что завелась у меня фермочка из 6 разных красных карт - сборная солянка из разных 570х и 580х. Карты прошились, упаковались в просторную стойку и мирно себе работали месяца полтора. Нужно уточнить, что ферма первая, и как каждый самоуверенный новичек-дыбил я решил, что нефиг для опытов искать нормальный БП и двух аэрокалов vx750 должно бы с головой хватить на 6 карт с сумарным жором до киловата(по факту - чуть больше 700вт на эфире и 960в дуале) из розетки. Однако в процессе закупок/сборок активно читал умный форум, заглядывал на хлипенькие провода аэрокалов и прикинул, что 3 карты на одном кале - это слишком. Времени небыло, а с серверным блоком возится мозгов пока не хватало. В итоге появился у меня чудный китайский Kenweiipc KW-1300PG - ну а чего - доступен тут и сейчас, 1.2кВт по +12В и всё в одну линию. Втыкать все карты в один блок я тоже слегка побоялся, как итог - ферма запитана с 2х блоков - китаец кормит мать и 4шт рх570, аэрокал кормит 2шт рх580, кушает эта братия 960Вт с розетки в дуале. Работало это добро месяца полтора на найсе и моего вмешательства не требовало от слова совсем(еще пара недель до этого - учился и настраивал - тоже работало 24х7). И вот в один чудный момент я глянул на пул - ферма вместо 180Мх дает 50... странно, ну ок, коннектимся - квадратный экран с мелким разрешением, все рх570 с кодом 43, рх580 работают на номинальных частотах памяти. Сносим дрова, ставим заново, и всё сново хорошо. Пару дней поработало и опять такая напасть. Ну я знатный тормоз теоретик, думаю - деградация чипа 830мВ уже маловато для частоты 1150МГц, накинул всем по 6-12мВ и пошел восвояси. А зря пошел - меньше суток этой фигне понадобилось чтоб опять лишить меня спокойной жизни. Времени особо небыло, а меня начала посещать мысль, что чипы не при делах и это всё БП мне жизнь портят. Вырубил дуал, минус 200 с хвостом ватт в минус - жизнь хороша. Через пару дней жизнь оставалась хороша, но уж больно малопрофитна. Игрался с dcri в клейморе с переменным успехом я недельку, а может и две. И вот, на прошлых выходных меня это всё окончательно достало и пошел я по прямому пути. Эксперимент 1й - 950мВ(+120 от обычного режима) на все карты, дуал на полную производительность - отвал дров за первые 10 минут. Эксперимент второй - 570е(4шт, все на китайском 1.2кВт блоке) на полную катушку, 580е(2шт, обе на аэрокале) в 830мВ и dcri=0(считай декред отключен) - час, два, три - полет нормальный, ложимся спать, виновник найден - аэрокал получает приговор и ждет своей замены. Думаете всё? я тоже так думал. утром опять отвал. Но виновника то мы знаем - перекидываем 5ю карту с аэрокала на китайбп и мирно занимаемся своими делами. Двое суток эта связка работала, я регулярно заглядывал и радовался. Через двое суток - опять отвал дров. На часах начало 12го ночи воскресенья, я злой выключаю всё нафиг и беру другой аэрокал(ага, я ведь их две штуки купил изначально), меняю блок, запускаю и иду спать. Ну в принципе логично - мы то знаем, что проблема в 2м блоке, знаем, что он месяца два суммарно нормально прожил, значит его близнец переживет еще месяцок, пока едет емерсон а я клепаю новый корпус и развожу провода. Ага - не с моим счастьем - утром всё как всегда - дрова отвалились, 580е работают, 570е с 43й ошибкой. Пока я подавлял в себе желание выкинуть весь риг в окно, руки принесли старую асус P5-GZ(или чет типа того) на два слота с процом и памятью, накопали в ящике старый ноутбучный винт, на котором уже была винда и нужный софт, втыкаю райзера 580х(2шт) и аэрокал в эту маму, доп питание в 580е, запускаю обе фермы и еду на работу. Ну опять же - логично ведь, ну отвалится аэрокал - остальные 4 карты будут работать , хоть не так обидно будет. Днем захожу на найс, гляжу в стату и... ну вы догадались... мимо!.. не догадались ) отвалилась ферма с 4мя рх570 на одном китайском блоке. Я в шоке.

На сегодня имеем две независимые недофермы:

1. 4 рх570 на асроке 81про бтц + Kenweiipc KW-1300PG + ссд на 60гб - сегодня уже в сингле работает, в дуале с dcri=3 отвалилась 2 раза за утро.

2. 2 рх 580 на аэрокале VX750 + старая мама на 775й сокет + старый ноутбучный винт - два дня работает без проблем.

 

Посоветуйте чего-нить, ибо я уже в замешательстве. Думаю следующим шагом в первую недоферму поставить 2 аэрокала на 4 карты, во вторую китайца и надеяться, что упадет вторая. Но очень надеюсь, что тут будут идеи получше )

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А тем временем история продолжается. 4х карточный вариант прожил пару дней и успешно отвалился час назад

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Попробуй метод исключения применить для поиска.  

Не забудь проверить разъемы 6 пин и молекс на предмет плохого(обгоревшего)  контакта.  Всегда начинаю искать шпиона по разъемам.  Обычно там и нахожу. 

Вообще, метод исключения решает практически всегда.  Важно не торопиться, проводить достаточные по аптайму тесты.

И замерь напряжение на блоках.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Жора777  Спасибо. Разъемы уже по нескольку раз перепроверил - сам параною про питание всегда. 

Напряжение замерял сразу - аэрокал дает 10.8В по 12 линии, но с ним отлично ужились 2 580е в отдельной системе. китайбп дает 12.2 вне зависимости от того, как его нагрузить.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

И снова продолжение. Больше часа в соло эфире 4х карточный обрубок уже не живет.пока не доехал до него пробую -ethi 6

Только что это чудо отвалило драйвера без запущеного майнинга. Просто сидел я в тимке, читал доку по клею, дрова и отвалились

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
В 31.10.2017 в 19:16, shura2002 сказал:

Но очень надеюсь, что тут будут идеи получше )

Купить хорошие блоки питания. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
31 минуту назад, e46btc сказал:

Купить хорошие блоки питания. 

Уже ) Я ж дурак, но не отморозок ) но пока доедет, пока провода, итд, итп - еще неделька, а то и две. И чем дальше, тем больше я склонен думать, что это не БП.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@shura2002 Забудьте про деградации и прочую чушь. Сделайте нормально питание и все будет работать.  У вас что карты особенные?  У меня за 2 года ничего не деградировало в RX серии, а про R9 так вообще молчу, особенно про 7970

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Дык я про нее и не думаю ) но за ответ в любом случае спасибо. Я очень надеюсь, что это китайбп чудит. Вчера собрал стойку, сегодня перекину карты на нее и перетасую блоки. Если китайбп - зашибись, эмерсон мне выйдет бесплатно, ибо на это чудо даже гарантия есть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@shura2002 ничего не знаю про китайское гэ и если честно даже не интересно.  На нормальном железе фермы работают месяцами без зависонов, ребуты только когда отключают электроэнергию, я уже не помню когда логинился туда, в клейморе сессии бывают по 3000+ часов, все работает само.   Но каждый сам выбирает что использовать, качественные вещи для надежной или стабильной работы, или играть в китайскую лотерею.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

судя по аптайму в 30+ часов вредитель был найден, блоки временно реабилитированы(до приезда эмерсона и распайки онного)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
8 часов назад, shura2002 сказал:

судя по аптайму в 30+ часов вредитель был найден, блоки временно реабилитированы(до приезда эмерсона и распайки онного)

 

И кто же оказался вредителем?

Так-то издано повелось, что в 99% случаев, отвал драйвера происходит или из-за переразгона карты, или из-за недостаточного питания на определенном уровне нагрузки = несоответствии уровней питания и разгона.

Поэтому вначале ферму нужно тестить в дефолтном состоянии, используя только встроенные механизмы разгона (буст).

И только потом, убедившись в начальной работоспособности всей сборки, переходить к тюнингу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
8 часов назад, shura2002 сказал:

судя по аптайму в 30+ часов вредитель был найден, блоки временно реабилитированы(до приезда эмерсона и распайки онного)

Вредителя в студию!

:D

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Uliss Вы удивительный человек. Вот сколько форум читаю - прямо Ванга - всегда правы. Но не в этот раз ))) Всё оказалось печально и просто до безобразия - после перетасовки блоков, я окончательно поверил в невиновность питалова, времени было не больше часа и просто от балды решил сменить винду. Вот собственно и всё - железо работает 3е сутки без вопросов. Выключал ли я автоматические апдейты на старой винде? Я не помню. На этот раз выключил точно. Что там могло еще так предательски чудить - даже не представляю. Но факт остается фактом - смена винды привела к 100% стабильной работе. И вот сам не верю в то, что пишу - не логично это. Буду собирать всё обратно в одну стойку в старый конфиг - если че вылезет - обязательно напишу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
1 минуту назад, shura2002 сказал:

Но факт остается фактом - смена винды привела к 100% стабильной работе.

 

Возьми себе за правило делать Акронисом снимок чистой установленной и настроенной системы со всеми дровами, кроме видеокарт.

В этом случае переход на чистую ОС занимает буквально 5 минут и можно дальше продолжать эксперименты с дровами и настройками, отбросив все прежние изменения и корявые деинсталляции ПО и дров.

Дрова АМД нормально обновляются только снизу вверх, а при переходе на более старые нужно руками (или автоматизацией) удалять некоторые библиотеки и инф-файлы из системы. Чистка реестра - обязательно. Поэтому Акронис - рулит!

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
8 минут назад, shura2002 сказал:

@Uliss Вы удивительный человек. Вот сколько форум читаю - прямо Ванга - всегда правы. Но не в этот раз ))) Всё оказалось печально и просто до безобразия - после перетасовки блоков, я окончательно поверил в невиновность питалова, времени было не больше часа и просто от балды решил сменить винду. Вот собственно и всё - железо работает 3е сутки без вопросов. Выключал ли я автоматические апдейты на старой винде? Я не помню. На этот раз выключил точно. Что там могло еще так предательски чудить - даже не представляю. Но факт остается фактом - смена винды привела к 100% стабильной работе. И вот сам не верю в то, что пишу - не логично это. Буду собирать всё обратно в одну стойку в старый конфиг - если че вылезет - обязательно напишу.

Сфигале "не логично"?
Зачастую, после перетыкания железа, особенно видях, приходится тупо удалять драйвера и ставить заново.
А иногда - переустанавливать и винду.
Я чет тупанул, и эту тему упустил из вида, давая подсказку.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Uliss Спасибо ) Этот пункт есть в роадмапе - обязательно куплю отдельную ССД для хранения образов. Но сначала нормальные блоки и избавление от каркаса из гипсового профиля - задолбался я пальцы резать.

1 час назад, pev5691 сказал:

Сфигале "не логично"?
Зачастую, после перетыкания железа, особенно видях, приходится тупо удалять драйвера и ставить заново.
А иногда - переустанавливать и винду.
Я чет тупанул, и эту тему упустил из вида, давая подсказку.

Прикол в том, что этот конфиг месяца полтора работал без моего участия, ничего не менялось и не тюнилось. Просто в один день отвалились дрова на машине с аптаймом за 500часов. Но в любом случае спасибо за участие.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
55 минут назад, shura2002 сказал:

избавление от каркаса из гипсового профиля - задолбался я пальцы резать.

 

Выточи в ножовочном полотне пропил в форме V и пройди все профили - сними заусенцы от просечки.

Или просто разрежь вдоль изоляцию одиночного провода 0,5мм2 сними  и наклей на те острые грани.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У меня был квест при подклчюении 8 карт на asus h270. Включаю, всего 6. Тыркаю-пыркаю, все-равно 6. Сняты были райзера с рабочих ферм, то есть 2*4, захотел в одном риге 8. В общем задолабался, уже когда раздобыл новый райзер, выяснил что один работать не хочет. Попутно ещё m2 оказался не способным работать с этой картой. В общем этот m2 сейчас пашет в другом риге, и райзер тоже в другом. Чудяса. Индивидуальная непереносимость какая-то.

 

Теперь фразы проверь на другом риге не воспринимаю всерьёз. ))

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
19 часов назад, Uliss сказал:

Выточи в ножовочном полотне пропил в форме V и пройди все профили - сними заусенцы от просечки.

Или просто разрежь вдоль изоляцию одиночного провода 0,5мм2 сними  и наклей на те острые грани.

мысль хорошая. Так и сделаю, но с алюминием уже ) Я тут по месту нашел бютжетного поставщика уголка 15х15х1.5 с порезкой. т.е. собирать на гипсовом профиле уже не быстрее, разница в цене самого профиля в пару раз, но в абсолютных цифрах - ниочем.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, shura2002 сказал:

Я тут по месту нашел бютжетного поставщика уголка 15х15х1.5 с порезкой. т.е. собирать на гипсовом профиле уже не быстрее

 

Если еще угловой кондуктор для сверловки сделать  - вообще чудно будет.

Преимущество "гипсового" профиля только в его дешевизне и возможности сборкибез расходников, одним  просечным клепальником.

Для люминя нужны или винты с гайками или вытяжные заклепки и вытяжной клепальник.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я профиль клепал 3.2мм вытяжными заклепками, люминий планирую аналогично. Про просечный клепальник раньше не слышал - забавная фигня, спасибо )

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×