Jump to content
DeathOfPower

Ремонт Antminer T17/S17

Recommended Posts

По е T17е, подскажите пожалуйста, выдает ошибку ERROR TEMP LOST.

Я правильно понимаю, что скорее всего дело в чипах на которых висят термодатчики?

И какие (по номерам) это чипы?

Заранее спасибо

Share this post


Link to post
Share on other sites

Здравствуйте. Кто ставил прошивку от мск на т17е? 

Share this post


Link to post
Share on other sites

Добрый день.

Chain[2]: find 0 asic, times 0

Какова самая распространенная причина, при которой одна из плат не видит сразу все чипы? 

Периодически после n ребутов, плата стартует.

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Задаю вопрос тк отдаю в ремонт две платы с данной неисправностью уже не в первый раз за весьма немалые деньги, каждый раз ремонтник путанно объясняет какой там 3,14здец и как все сложно, потому он ремонтировал их целый месяц, но после ремонта они работают 1-2 месяца и все по новой. Гарантия естественно 1 неделя.  

Заранее спасибо.

Edited by trinadsatiy

Share this post


Link to post
Share on other sites

@trinadsatiy на плате чипы сидят, условно "последовательно": отвалился первый - не видно всех остальных. не работает хоть один - отключается вся плата

основные причины - плохой отвод тепла, приводящий к выгоранию чипа либо обламывание ножек его контактов из-за "дребезга" радиатора в воздушном потоке и т.п.
почему при включении/выключении - экстратоки (?)

n ребутов - повезло, но если причина первая, то чип будет скорее всего "красным" (на расширенных прошивках)

сложность диагностики в таком случае - точно определить, который из чипов в гриде сдох, остальное дело несложной техники.

 

уважаемый @Splinter поправит, если я ошибаюсь

Edited by hogopogo

Share this post


Link to post
Share on other sites

@hogopogo Спасибо за ответ

Контролька отключает платы, где 0 чипов, потому в расширенных настройках все чипы по этим платам зелёные, но с N/A вместо HW и без частоты/напряжения.

Я сталкивался с ситуацией, когда не работал 1-2 чипа, тогда лог писал что find 76 asic of 78, times 0 или как-то так, то есть явно указывал, что проблема в 1-2 чипах. При этом, кстати, плата тоже отключалась от майнинга.

Потому в данной ситуации, когда он вообще 0 находит и подумал, что дело не в каком-то одном чипе, а скорее в чем-то более общем, например, не поступает питание куда-то или что-то подобное.

Share this post


Link to post
Share on other sites

@hogopogo По моемому вот также сбивчиво и тот мастер отвечает ))

@trinadsatiy 

Основная, самая частая причина - потеря контакта чипа(ов) с контактными площадками на плате в следствии появления микротрещин в пайке. Это следствие 2-х факторов: вибрации и термоциклирования. Из физики помним, нагреваясь материалы расширяются, охлаждаясь - сжимаются. К сожалению битмайн, кроме прочей кучи технологических ошибок, сделал роковую - использовал низкотемпературный висмутовый припой. Он не эластичен и хрупок, плюс имеет низкую температуру плавления, порядка 120 гр.

Итак термоциклирование - перезагрузки приводят к быстрому охлаждению и нагреву платы, что в сочетании с вибрацией приводит к постепенному разрушению пайки. Все же помнят что если много раз сгибать-разгибать металлическую пластину она в итоге разрушится в месте изгиба. Тут тоже самое в миниатюре.

Что касается повторных ремонтов. К сожалению сделать раз и навсегда врядли выйдет. А вот срок между ремонтами уже зависит от рук и моральных принципов мастера.

Можно сделать супербыстро если найти реальное место потери контакта (что кстати чертовски сложно т.к. дефект плавающий и стабильно поймать его почти невозможно - он проявляется и исчезает почти мгновенно) - "перекатать отвалившийся чип". Но дело в том что плата полностью эксплуатируется в одних условиях и состояние припоя на всей плате также одинаковое плюс минус. Т.е. следующая микротрещина может дать о себе знать хоть на следующий день, а может через неделю.

Способ средней затратности - пропайка всей платы. Снимаются радиаторы, плата тщательно чистится, наносится флюс на все чипы и пропаивается. В этом же процессе сразу и меняются подгоревшие чипы - чипы которые могут майнить даже хорошо, но от перегрева начавшие разрушаться и разрушать плату под собой (прогарать). На годовалой плате таких чипов обычно в среднем порядка 10-20 % (но может и не быть вовсе - как повезет).

Ну и хардкор способ - снять все чипы, зачистить их и посадочные места от старого припоя и накатать новый свинцовый припой. К сожалению нет статистики по таким ремонтам и даже не видел реальных мастеров кто так делает. Все об этом говорят, но похоже никто такого не видел. Может есть единицы кто этим занимается. Но это очень трудозатратно (читай - дорого), и тут есть риски ушатать плату оканчательно - мастер должен быть очень опытным и с хорошим оборудованием. Еще есть теоретический момент, который ставит под сомнение данный метод. Висмут соединяясь со свинцом образует эвтектическую смесь, а по простому температура плавления такой смеси меньше чем каждого из металлов по отдельности. А зачистить абсолютно идеально от старого припоя не возможно. Тонкая граница в месте пайки будет содержать как раз именно такую смесь. Так что теоретически это может только ухудшить ситуацию. Тут стоит опираться на статистику но ее к сожалению нет.

1 час назад, trinadsatiy сказал:

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Из объяснения совершенно логично напрашивается ответ на ваше недоумение. У нагретой платы контакты расширились (микроскопически конечно же) и этого достаточно чтобы образовать электромеханический контакт (как в кнопке - одна пластинка прижалась к другой) и устройство работает. Но вы решили его перезагрузить, контакт остыл, материалы сжались и контакт пропал или "моросит". Майнеры уже давно придумали способ "прикуривать" такие платы - они подогревают их перед стартом теплым выхлопом другого аппарата. Или тырят у жены фен и проделывают тот же фокус. Ну или способ попроще - запустить аппарат как есть и дать ему прогреться и сделать перезагрузку - если помещение не холодное и платы не успевают остыть то неисправная плата может завестись. Лайфхаки так сказать )

Edited by Splinter

Share this post


Link to post
Share on other sites

@Splinter Большое спасибо за столь развернутое объяснение. 

Мой вопрос больше был в том, что может ли повреждение контакта одного чипа приводить к ошибке  find 0 asic? В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

Спасибо заранее.

Share this post


Link to post
Share on other sites
17 минут назад, trinadsatiy сказал:

В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Ваше понимание не верно. Это нормально, т.к. чтобы понять и расшифровать это сообщение в логе надо знать принцип построения хэшплаты. Чипы соединяются между собой в одну длинную цепочку - чейн (chein) - по принципу елочной гирлянды (советской, где лампочки были включены последовательно). А количество увиденных в логе чипов уже зависит от того где пропал контакт на чипе. Цепочка может прерваться так, что не будет мешать чипам, находящимся до места обрыва - тогда в логе увидим, например, 27 из 30. Это значит что сигнал доходит до 27-го чипа но дальше обрывается. Чипы с 28 по 30 могут быть совершенно исправными. Хотя может быть и неисправным 28-ой чип, а 29-30 исправными.

В другом случае обрыв может произойти так, что чип будет "глушить" шину данных и в итоге мы получаем тот самый асик 0. Т.е., например, проблема гдето на 27 чипе, он глушит шину по сигналу ri - ответ от чипов, и все - тишина. Т.е. если асик 0, то это не значит, что умерли все чипы на плате и не значит, что проблема в первом чипе. Это значит что проблема равновероятно в любом чипе.

17 минут назад, trinadsatiy сказал:

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

А вот это предположение совершенно верно.

Edited by Splinter

Share this post


Link to post
Share on other sites

@Splinter Теперь все ясно. 

Еще раз спасибо за разжевывание.

Хотел поставить плюсик, но видимо статус не позволяет, нет такой опции. 

Share this post


Link to post
Share on other sites

Всем привет. Подскажите, возможно ли проверять с помощью блока питания самого асика чипы на хэшплате? После включения, аппарат как только понимает, что есть битые чипы, перестает подавать напряжение на хэш-плату и соответственно чипы не проверить. Или я неправ? (аппарат t17e)

Share this post


Link to post
Share on other sites

Всем доброго времени суток! Такой вопрос: умерла одна плата t17e похожая ситуация как у пользователя trinadsatiy "0 asic" показывает. Подаю питание 18В а на БП показывает ток 0.05А и пропадает напруга. Взял исправные платы провел те же манипуляции безрезультатно. Думал в БП дело, подключал разные устройства и вентиляторы от 5-30В и током до 10А все исправно работает. А вот с хэш платой все молчит, и проверить больше никак не могу и не чем. Может кто сталкивался? Подключаю все верно, полярность не перепутал, вроде глаза и руки прямые)))

Share this post


Link to post
Share on other sites

Подскажите маркировку чипов в т17

Share this post


Link to post
Share on other sites
2 часа назад, dizelekss сказал:

Подскажите маркировку чипов в т17

BM1397AG

Последняя буква может быть другая. AG самые универсальные, держат частоту 720 как в T17 42th.

Share this post


Link to post
Share on other sites

@Splinter спасибо

Share this post


Link to post
Share on other sites

подскажите пожалуйста что за ошибка 

[2021/05/09 20:13:20] INFO: Initializing hash boards

[2021/05/09 20:13:20] INFO: chain[2] - Initializing

[2021/05/09 20:13:20] INFO: chain[1] - Initializing

[2021/05/09 20:13:20] INFO: chain[0] - Initializing

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:687 chain[2] - Voltage is different, cur=293 mV tgt=17000 mV

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:471 chain[2] - Failed to set start up voltage

[2021/05/09 20:13:33] INFO: chain[2] - Shutting down the chain

[2021/05/09 20:13:33] ERROR: driver-btm-base.c:356 chain[2] - Initialization failed

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:687 chain[1] - Voltage is different, cur=287 mV tgt=17000 mV

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:471 chain[1] - Failed to set start up voltage

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

  • Similar Topics

    • Ремонт: Bitmain Antminer S7, S9, L3+

      Официальный сайт | Antminer. Все модели. Вопросы, помощь, обсуждение.   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы.   Статьи на bits.media:   Полезное:   (!) FAQ (часто задаваемые вопросы)   -Как найти в продаже разъемы питания, какая маркиров

      in ASIC/FPGA майнеры

    • Antminer L3+

      Доброй ночи! пожалуйста помогите кто знает с antminer l3+  работает 1.5 недели, все было хорошо.  В один момент вижу, что он выключен пришел его перезагрузил и началось   Вообщем выдает ошибку socket connect failed. connection refused то иногда включается и показывает на второй плате 21 чип место 71  много раз перезагружал, перекинул с другого асика блок питания он все равно так   не майнит уходит в ошибку   что делать подскажите пожалуйста, асику всего полторы недели скрины приложил

      in ASIC/FPGA майнеры

    • Bitmain AntMiner APW3-12-1600

      Ниже приведено техническое описание нового продукта от компании BITMAIN - AntMiner APW3-12-1600     Блок питания BITMAIN AntMiner серии APW3-12-1600, специально изготовлен для майнинга и сочетает в себе высокую эффективность преобразования и отличные динамические показатели в силу плотной упаковки. Также блок отлично защищен от коротких замыканий, перегревов, низкого напряжения и перегрузок.   БП сочетает в себе уникальные характеристики которые делают его идеальным

      in Блоки питания, ИБП, силовая часть

    • Bitmain Antminer S9 - 13,5-14,0 Th/s

      Частенько натыкаюсь на китайских поставщиков Antminer S9, предлагающих б/у машинки. Предложения самые разные, ну и размышления по этому поводу соответственно тоже. Интересно мнение форумчан - опыт таких покупок, ну и насколько это рискованно и оправдано.  

      in ASIC/FPGA майнеры

    • Antminer. Все модели. Вопросы, помощь, обсуждение

      В этой теме обсуждается вся линейка продукции компании BITMAIN. А также все вопросы, связанные с использованием, настройкой, модернизацией и прочие околоANTовые вопросы.   Основные продукты:     Antminer S7 Он и правда существует!!! - https://forum.bits.media/index.php?/topic/18603-antminer-s1-s2-s3-s3-s4-s5-c1-s7-voprosy-pomosch-obsuzhdenie/page-542?p=309969&do=findComment&comment=309969   Прошивки официальные:   Образы прошивок для всех майнеров с BB

      in ASIC/FPGA майнеры

×
×
  • Create New...