Jump to content
DeathOfPower

Ремонт Antminer T17/S17

Recommended Posts

По е T17е, подскажите пожалуйста, выдает ошибку ERROR TEMP LOST.

Я правильно понимаю, что скорее всего дело в чипах на которых висят термодатчики?

И какие (по номерам) это чипы?

Заранее спасибо

Share this post


Link to post
Share on other sites

Здравствуйте. Кто ставил прошивку от мск на т17е? 

Share this post


Link to post
Share on other sites

Добрый день.

Chain[2]: find 0 asic, times 0

Какова самая распространенная причина, при которой одна из плат не видит сразу все чипы? 

Периодически после n ребутов, плата стартует.

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Задаю вопрос тк отдаю в ремонт две платы с данной неисправностью уже не в первый раз за весьма немалые деньги, каждый раз ремонтник путанно объясняет какой там 3,14здец и как все сложно, потому он ремонтировал их целый месяц, но после ремонта они работают 1-2 месяца и все по новой. Гарантия естественно 1 неделя.  

Заранее спасибо.

Edited by trinadsatiy

Share this post


Link to post
Share on other sites

@trinadsatiy на плате чипы сидят, условно "последовательно": отвалился первый - не видно всех остальных. не работает хоть один - отключается вся плата

основные причины - плохой отвод тепла, приводящий к выгоранию чипа либо обламывание ножек его контактов из-за "дребезга" радиатора в воздушном потоке и т.п.
почему при включении/выключении - экстратоки (?)

n ребутов - повезло, но если причина первая, то чип будет скорее всего "красным" (на расширенных прошивках)

сложность диагностики в таком случае - точно определить, который из чипов в гриде сдох, остальное дело несложной техники.

 

уважаемый @Splinter поправит, если я ошибаюсь

Edited by hogopogo

Share this post


Link to post
Share on other sites

@hogopogo Спасибо за ответ

Контролька отключает платы, где 0 чипов, потому в расширенных настройках все чипы по этим платам зелёные, но с N/A вместо HW и без частоты/напряжения.

Я сталкивался с ситуацией, когда не работал 1-2 чипа, тогда лог писал что find 76 asic of 78, times 0 или как-то так, то есть явно указывал, что проблема в 1-2 чипах. При этом, кстати, плата тоже отключалась от майнинга.

Потому в данной ситуации, когда он вообще 0 находит и подумал, что дело не в каком-то одном чипе, а скорее в чем-то более общем, например, не поступает питание куда-то или что-то подобное.

Share this post


Link to post
Share on other sites

@hogopogo По моемому вот также сбивчиво и тот мастер отвечает ))

@trinadsatiy 

Основная, самая частая причина - потеря контакта чипа(ов) с контактными площадками на плате в следствии появления микротрещин в пайке. Это следствие 2-х факторов: вибрации и термоциклирования. Из физики помним, нагреваясь материалы расширяются, охлаждаясь - сжимаются. К сожалению битмайн, кроме прочей кучи технологических ошибок, сделал роковую - использовал низкотемпературный висмутовый припой. Он не эластичен и хрупок, плюс имеет низкую температуру плавления, порядка 120 гр.

Итак термоциклирование - перезагрузки приводят к быстрому охлаждению и нагреву платы, что в сочетании с вибрацией приводит к постепенному разрушению пайки. Все же помнят что если много раз сгибать-разгибать металлическую пластину она в итоге разрушится в месте изгиба. Тут тоже самое в миниатюре.

Что касается повторных ремонтов. К сожалению сделать раз и навсегда врядли выйдет. А вот срок между ремонтами уже зависит от рук и моральных принципов мастера.

Можно сделать супербыстро если найти реальное место потери контакта (что кстати чертовски сложно т.к. дефект плавающий и стабильно поймать его почти невозможно - он проявляется и исчезает почти мгновенно) - "перекатать отвалившийся чип". Но дело в том что плата полностью эксплуатируется в одних условиях и состояние припоя на всей плате также одинаковое плюс минус. Т.е. следующая микротрещина может дать о себе знать хоть на следующий день, а может через неделю.

Способ средней затратности - пропайка всей платы. Снимаются радиаторы, плата тщательно чистится, наносится флюс на все чипы и пропаивается. В этом же процессе сразу и меняются подгоревшие чипы - чипы которые могут майнить даже хорошо, но от перегрева начавшие разрушаться и разрушать плату под собой (прогарать). На годовалой плате таких чипов обычно в среднем порядка 10-20 % (но может и не быть вовсе - как повезет).

Ну и хардкор способ - снять все чипы, зачистить их и посадочные места от старого припоя и накатать новый свинцовый припой. К сожалению нет статистики по таким ремонтам и даже не видел реальных мастеров кто так делает. Все об этом говорят, но похоже никто такого не видел. Может есть единицы кто этим занимается. Но это очень трудозатратно (читай - дорого), и тут есть риски ушатать плату оканчательно - мастер должен быть очень опытным и с хорошим оборудованием. Еще есть теоретический момент, который ставит под сомнение данный метод. Висмут соединяясь со свинцом образует эвтектическую смесь, а по простому температура плавления такой смеси меньше чем каждого из металлов по отдельности. А зачистить абсолютно идеально от старого припоя не возможно. Тонкая граница в месте пайки будет содержать как раз именно такую смесь. Так что теоретически это может только ухудшить ситуацию. Тут стоит опираться на статистику но ее к сожалению нет.

1 час назад, trinadsatiy сказал:

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Из объяснения совершенно логично напрашивается ответ на ваше недоумение. У нагретой платы контакты расширились (микроскопически конечно же) и этого достаточно чтобы образовать электромеханический контакт (как в кнопке - одна пластинка прижалась к другой) и устройство работает. Но вы решили его перезагрузить, контакт остыл, материалы сжались и контакт пропал или "моросит". Майнеры уже давно придумали способ "прикуривать" такие платы - они подогревают их перед стартом теплым выхлопом другого аппарата. Или тырят у жены фен и проделывают тот же фокус. Ну или способ попроще - запустить аппарат как есть и дать ему прогреться и сделать перезагрузку - если помещение не холодное и платы не успевают остыть то неисправная плата может завестись. Лайфхаки так сказать )

Edited by Splinter

Share this post


Link to post
Share on other sites

@Splinter Большое спасибо за столь развернутое объяснение. 

Мой вопрос больше был в том, что может ли повреждение контакта одного чипа приводить к ошибке  find 0 asic? В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

Спасибо заранее.

Share this post


Link to post
Share on other sites
17 минут назад, trinadsatiy сказал:

В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Ваше понимание не верно. Это нормально, т.к. чтобы понять и расшифровать это сообщение в логе надо знать принцип построения хэшплаты. Чипы соединяются между собой в одну длинную цепочку - чейн (chein) - по принципу елочной гирлянды (советской, где лампочки были включены последовательно). А количество увиденных в логе чипов уже зависит от того где пропал контакт на чипе. Цепочка может прерваться так, что не будет мешать чипам, находящимся до места обрыва - тогда в логе увидим, например, 27 из 30. Это значит что сигнал доходит до 27-го чипа но дальше обрывается. Чипы с 28 по 30 могут быть совершенно исправными. Хотя может быть и неисправным 28-ой чип, а 29-30 исправными.

В другом случае обрыв может произойти так, что чип будет "глушить" шину данных и в итоге мы получаем тот самый асик 0. Т.е., например, проблема гдето на 27 чипе, он глушит шину по сигналу ri - ответ от чипов, и все - тишина. Т.е. если асик 0, то это не значит, что умерли все чипы на плате и не значит, что проблема в первом чипе. Это значит что проблема равновероятно в любом чипе.

17 минут назад, trinadsatiy сказал:

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

А вот это предположение совершенно верно.

Edited by Splinter

Share this post


Link to post
Share on other sites

@Splinter Теперь все ясно. 

Еще раз спасибо за разжевывание.

Хотел поставить плюсик, но видимо статус не позволяет, нет такой опции. 

Share this post


Link to post
Share on other sites

Всем привет. Подскажите, возможно ли проверять с помощью блока питания самого асика чипы на хэшплате? После включения, аппарат как только понимает, что есть битые чипы, перестает подавать напряжение на хэш-плату и соответственно чипы не проверить. Или я неправ? (аппарат t17e)

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

  • Similar Topics

    • Ремонт: Bitmain Antminer S7, S9, L3+

      Официальный сайт | Antminer. Все модели. Вопросы, помощь, обсуждение.   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы.   Статьи на bits.media:   Полезное:   (!) FAQ (часто задаваемые вопросы)   -Как найти в продаже разъемы питания, какая маркиров

      in ASIC/FPGA майнеры

    • Bitmain Antminer S9 - 13,5-14,0 Th/s

      Частенько натыкаюсь на китайских поставщиков Antminer S9, предлагающих б/у машинки. Предложения самые разные, ну и размышления по этому поводу соответственно тоже. Интересно мнение форумчан - опыт таких покупок, ну и насколько это рискованно и оправдано.  

      in ASIC/FPGA майнеры

    • Antminer L3+

      Доброй ночи! пожалуйста помогите кто знает с antminer l3+  работает 1.5 недели, все было хорошо.  В один момент вижу, что он выключен пришел его перезагрузил и началось   Вообщем выдает ошибку socket connect failed. connection refused то иногда включается и показывает на второй плате 21 чип место 71  много раз перезагружал, перекинул с другого асика блок питания он все равно так   не майнит уходит в ошибку   что делать подскажите пожалуйста, асику всего полторы недели скрины приложил

      in ASIC/FPGA майнеры

    • Integrated Ventures приобрела у Bitmain 4 800 ASIC-майнеров Antminer S19J

      Американская компания Integrated Ventures объявила о покупке 4 800 ASIC-майнеров Antminer S19J у китайского производителя Bitmain. Стоимость сделки составила более $34 млн. Посредником между Integrated Ventures и Bitmain выступила компания Wattum Management, она же разместит майнеры на своих площадках и поможет запустить устройства в работу. Поставки начнутся в следующему году – каждый месяц компания из Пенсильвании будет получать по 400 устройств. После завершения поставок хэшрейт компан

      in Новости криптовалют

    • Восстановление control board Antminer L3, L3+, D3 без программатора

      Восстановление слетевшей control board Antminer L3, L3+, D3  без программатора используя microsd. В 17м или 18м году накрылась контролька у L3+.Умерла nand.На кнопки и microsd никак не реагировала. Суть восстановления такая. 1 Отпаиваем нанд феном или паяльником,главное чтобы не было короткого на контактах. 2 Скачиваем Tools and Instructions to Image SD card.zip с сайта битмайн и распаковываем.Образ S2S4S5S7-img.img записываем на sd.Я записывал HDDRawCopy1.10Portable. 3

      in ASIC/FPGA майнеры

×
×
  • Create New...