Jump to content
rldep

Немножко внутренностей L3+ (фото) и замеры напряжений на чипах

Recommended Posts

Выкладываю фотки платы Antminer L3+

 

Плата по организации похожа на плату Antminer S7, как я ее видел на фотках и в описаниях.

 

Питание чипов организовано последовательно, цепочкой в 12 звеньев. В каждом звене 6 чипов (параллельно).

 

Напряжение на выходе дросселя составляет около 10,5 вольт (прибор стрелочный, точнее не показывает). При инициализации/рестарте майнера напряжение снимается.

 

Напряжения на звеньях последовательной цепочки - примерно 0,85 вольта (прибор стрелочный, ну вы поняли).

 

Фотки не удалось выложить в оригинальном размере и качестве (слишком большой размер), но старался при сжатии не сильно испортить.

 

 

post-14853-0-50068700-1498506226_thumb.jpg

post-14853-0-34528100-1498506227_thumb.jpg

post-14853-0-69093900-1498506228_thumb.jpg

post-14853-0-60256300-1498506229_thumb.jpg

post-14853-0-51735500-1498506255_thumb.jpg

Share this post


Link to post
Share on other sites

... а теперь о том, зачем я полез внутрь майнера )))

 

одна из четырех плат стала сбоить - показывает неполное количество чипов (от 1 до 20), нулевой хэшрейт, и вынуждает майнер перезагружаться.

 

Напряжение на выходе дросселя такое же, как у исправной платы - около 10,5 вольт

 

Промерил напряжения на чипах.

 

В момент, когда на чипы подано напряжение, но майнинг вероятно, еще не запущен - везде примерно по 0,85 вольт. как положено.

 

А потом, видимо при запуске майнинга - на крайнем левом звене цепи (самое ближнее к земле) - становится примерно 0,5 - 0,6 вольта. Что-то в этом звене не так, просаживается напряжение.

 

 

Вот на этом моменте мне уже нужна помощь - я не знаю, как диагностировать неисправный чип и как его обойти.

Edited by rldep

Share this post


Link to post
Share on other sites

выпаивай по одному

Share this post


Link to post
Share on other sites

Может дороги резать по питанию, чтобы не выпаивать все?

 

Еще осциллографом можно посмотреть форму в разных точках.

 

Надо еще электролиты проверять и что там формирует питалово? какой-то драйвер по-центру? его бы протестить, на видяхах они иногда просто так перестают работать.

Edited by vvvb1

Share this post


Link to post
Share on other sites

@vvvb1, кстати да, в каждой цепочке присутствует LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

Share this post


Link to post
Share on other sites

LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

 

post-5592-0-49127000-1498530788_thumb.jpg

Share this post


Link to post
Share on other sites

Пятиногие стабилизаторы на 1,8v, установленные в каждом звене цепочки, по всей видимости формируют напряжение для управляющих сигналов, как я понял с разных форумов. При следующем эксперименте замерю напряжение на их выходах, но похоже к падению напряжения на питании асик-чипов они отношения не имеют...

Share this post


Link to post
Share on other sites

У нас такая же история уже аж с двумя майнерами

и на обоих именно 2ая плата теряет чипы с 72 до 20-30 чипов остается

Share this post


Link to post
Share on other sites

 

 

У нас такая же история уже аж с двумя майнерами

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

Share this post


Link to post
Share on other sites

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

 

вы попробовали сами спаять?

Share this post


Link to post
Share on other sites

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

Share this post


Link to post
Share on other sites

А озвучьте маркировку выделенного на фото контроллера. 

Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

post-56764-0-23095600-1498645084_thumb.png

Share this post


Link to post
Share on other sites

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

 

Подскажите пожалуйста в Москве есть кто ремонтирует такие платы?

Share this post


Link to post
Share on other sites

@Frozee,

Только Китай.

Share this post


Link to post
Share on other sites

А вы писали в bitmain что они гаварят по этому поводу.

Share this post


Link to post
Share on other sites

 

 

А озвучьте маркировку выделенного на фото контроллера.  Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

 

Не могу разобрать по фоткам, а живьем до аппарата доберусь только дней через 10. Обязательно посмотрю. На выходе DC-DC напряжение совпадает с исправной платой, падение только на одном из звеньев цепочки чипов...

 

 

 

А вы писали в bitmain что они гаварят по этому поводу.

 

Поставщик сказал мне, что гарантийный ремонт - не проблема. Проблема только в том, что аппарат надо оправлять в ремонт целиком, и за время пересылки и ремонта недополученная прибыль превысит стоимость больной платы.

Share this post


Link to post
Share on other sites

не гарантийный ремонт есть, достаем одну плату и отправляем. весь блок отправлять глупо, проще заплатить за ремонт

Share this post


Link to post
Share on other sites

Добавлю свои 5 копеек. На первой фотке термосенсоры, выделенные красным, никакого отношения к реальной температуре чипов не имеют. Они меряют температуру платы. И когда софт показывает, что "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120. Термоинтерфейс, которым приклеены родные радиаторы, убогий до невозможности. Нанесен криво, с пузырями в составе. Неудивительно, что L3+ умирает пачками. 

Мы нашли состав, который должен быть лучше родного на порядок - в понедельник будем испытывать. Кстати, даже Номакон 3Т-15,0, несмотря на то, что имеет силиконовую основу, лучше по качеству, чем родной для теплоотвода. Но радиаторы закрепить на нем проблематично. 

 

Сборка и качество платы - это отдельная песня. Но все равно - можно считать ремонтопригодной. Хоть и технологически достаточно сложно. Выявление помирающих чипов термоскопом тут уже не проходит. Пришлось снифить трафик лог. анализатором и разбирать на составляющие. 

post-56764-0-17907300-1499004044_thumb.jpg

post-56764-0-59177400-1499004096_thumb.jpg

Share this post


Link to post
Share on other sites

 "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120.

 

 

Может там в самом чипе отдельный датчик?

Share this post


Link to post
Share on other sites

Может там в самом чипе отдельный датчик?

 

Там может быть хоть десяток датчиков. Но обработкой температуры и передачей ее на контроллер занимается PIC16f1704, который стоит рядом с ШИМом основного питания - а он ничего не знает о том, что там на чипах. Реверс трафика с чипов точно говорит, что в нем нет ничего, указывающего на температуру. 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

Edited by Hits

Share this post


Link to post
Share on other sites

 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

Share this post


Link to post
Share on other sites

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

post-56764-0-72418300-1499157766_thumb.png

Share this post


Link to post
Share on other sites

 

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

Share this post


Link to post
Share on other sites

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

 

Ну профанация - это, пожалуй, перебор. Я бы сказал, что это максимальная оптимизация производства. Не забывайте, что устройство то, само по себе, максимально дешевое. По моим прикидкам, производитель от реальной цены железа имеет примерно 10 концов чистого профита.

 

Вот давайте, просто гипотетически, представим ситуацию, что мы снимаем показания с 72 датчиков и обрабатываем их до некоего среднего значения.

Поскольку методов снятия температуры не так много, и самый дешевый из них - это уровень падения напряжения на P-N переходе (диод, проще говоря) - то нам нужен достаточно точный и быстрый АЦП на 72 канала минимум, чтоб обрабатывать такое количество диодов - такого устройства на плате нет (да и быть не может - потому что такой АЦП будет стоить как такое устройство целиком).  

 

Либо в каждом чипе должен стоять свой АЦП, который будет "говорить" цифрой в шину реальную температуру своего чипа. Мало того, что в таких горячих устройствах это не реально - надо чем то компенсировать погрешности самого АЦП, в зависимости от внешних условий, так еще АЦП надо обеспечить опорное питание, с очень малой погрешностью. А таких источников питания на плате тоже нет. 

 

Поэтому разработчики пошли обычным путем. Снимаем показания с 2 точек, максимально удаленных друг от друга. По ним строим усредненную таблицу, на которую опирается алгоритм управления кулерами - это как раз максимальные возможности того PIC, что стоит на плате. Судя по тому, что кулера управляются абсолютно линейно - значит в алгоритме не используются даже зачатки ПИД. "Дешево и сердито".  А юзеру в интерфейсе можно показывать "график полета мухи" - все равно подавляющее большинство в этом ровно ничего не понимает и верит на слово про "уникальные разработки управления охлаждением",

Edited by Hits

Share this post


Link to post
Share on other sites

Нужно брать две неисправные платы и чипы с одной на другую подкидывать. Еще керамику по хорошему проверить там где просадка по напряжению.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...