Перейти к публикации
rldep

Немножко внутренностей L3+ (фото) и замеры напряжений на чипах

Рекомендованные сообщения

Выкладываю фотки платы Antminer L3+

 

Плата по организации похожа на плату Antminer S7, как я ее видел на фотках и в описаниях.

 

Питание чипов организовано последовательно, цепочкой в 12 звеньев. В каждом звене 6 чипов (параллельно).

 

Напряжение на выходе дросселя составляет около 10,5 вольт (прибор стрелочный, точнее не показывает). При инициализации/рестарте майнера напряжение снимается.

 

Напряжения на звеньях последовательной цепочки - примерно 0,85 вольта (прибор стрелочный, ну вы поняли).

 

Фотки не удалось выложить в оригинальном размере и качестве (слишком большой размер), но старался при сжатии не сильно испортить.

 

 

post-14853-0-50068700-1498506226_thumb.jpg

post-14853-0-34528100-1498506227_thumb.jpg

post-14853-0-69093900-1498506228_thumb.jpg

post-14853-0-60256300-1498506229_thumb.jpg

post-14853-0-51735500-1498506255_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

... а теперь о том, зачем я полез внутрь майнера )))

 

одна из четырех плат стала сбоить - показывает неполное количество чипов (от 1 до 20), нулевой хэшрейт, и вынуждает майнер перезагружаться.

 

Напряжение на выходе дросселя такое же, как у исправной платы - около 10,5 вольт

 

Промерил напряжения на чипах.

 

В момент, когда на чипы подано напряжение, но майнинг вероятно, еще не запущен - везде примерно по 0,85 вольт. как положено.

 

А потом, видимо при запуске майнинга - на крайнем левом звене цепи (самое ближнее к земле) - становится примерно 0,5 - 0,6 вольта. Что-то в этом звене не так, просаживается напряжение.

 

 

Вот на этом моменте мне уже нужна помощь - я не знаю, как диагностировать неисправный чип и как его обойти.

Изменено пользователем rldep

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

выпаивай по одному

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может дороги резать по питанию, чтобы не выпаивать все?

 

Еще осциллографом можно посмотреть форму в разных точках.

 

Надо еще электролиты проверять и что там формирует питалово? какой-то драйвер по-центру? его бы протестить, на видяхах они иногда просто так перестают работать.

Изменено пользователем vvvb1

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@vvvb1, кстати да, в каждой цепочке присутствует LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

 

post-5592-0-49127000-1498530788_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Пятиногие стабилизаторы на 1,8v, установленные в каждом звене цепочки, по всей видимости формируют напряжение для управляющих сигналов, как я понял с разных форумов. При следующем эксперименте замерю напряжение на их выходах, но похоже к падению напряжения на питании асик-чипов они отношения не имеют...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

У нас такая же история уже аж с двумя майнерами

и на обоих именно 2ая плата теряет чипы с 72 до 20-30 чипов остается

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

У нас такая же история уже аж с двумя майнерами

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

 

вы попробовали сами спаять?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А озвучьте маркировку выделенного на фото контроллера. 

Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

post-56764-0-23095600-1498645084_thumb.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

 

Подскажите пожалуйста в Москве есть кто ремонтирует такие платы?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Frozee,

Только Китай.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

А вы писали в bitmain что они гаварят по этому поводу.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

А озвучьте маркировку выделенного на фото контроллера.  Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

 

Не могу разобрать по фоткам, а живьем до аппарата доберусь только дней через 10. Обязательно посмотрю. На выходе DC-DC напряжение совпадает с исправной платой, падение только на одном из звеньев цепочки чипов...

 

 

 

А вы писали в bitmain что они гаварят по этому поводу.

 

Поставщик сказал мне, что гарантийный ремонт - не проблема. Проблема только в том, что аппарат надо оправлять в ремонт целиком, и за время пересылки и ремонта недополученная прибыль превысит стоимость больной платы.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

не гарантийный ремонт есть, достаем одну плату и отправляем. весь блок отправлять глупо, проще заплатить за ремонт

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Добавлю свои 5 копеек. На первой фотке термосенсоры, выделенные красным, никакого отношения к реальной температуре чипов не имеют. Они меряют температуру платы. И когда софт показывает, что "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120. Термоинтерфейс, которым приклеены родные радиаторы, убогий до невозможности. Нанесен криво, с пузырями в составе. Неудивительно, что L3+ умирает пачками. 

Мы нашли состав, который должен быть лучше родного на порядок - в понедельник будем испытывать. Кстати, даже Номакон 3Т-15,0, несмотря на то, что имеет силиконовую основу, лучше по качеству, чем родной для теплоотвода. Но радиаторы закрепить на нем проблематично. 

 

Сборка и качество платы - это отдельная песня. Но все равно - можно считать ремонтопригодной. Хоть и технологически достаточно сложно. Выявление помирающих чипов термоскопом тут уже не проходит. Пришлось снифить трафик лог. анализатором и разбирать на составляющие. 

post-56764-0-17907300-1499004044_thumb.jpg

post-56764-0-59177400-1499004096_thumb.jpg

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120.

 

 

Может там в самом чипе отдельный датчик?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Может там в самом чипе отдельный датчик?

 

Там может быть хоть десяток датчиков. Но обработкой температуры и передачей ее на контроллер занимается PIC16f1704, который стоит рядом с ШИМом основного питания - а он ничего не знает о том, что там на чипах. Реверс трафика с чипов точно говорит, что в нем нет ничего, указывающего на температуру. 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

Изменено пользователем Hits

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

post-56764-0-72418300-1499157766_thumb.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

 

Ну профанация - это, пожалуй, перебор. Я бы сказал, что это максимальная оптимизация производства. Не забывайте, что устройство то, само по себе, максимально дешевое. По моим прикидкам, производитель от реальной цены железа имеет примерно 10 концов чистого профита.

 

Вот давайте, просто гипотетически, представим ситуацию, что мы снимаем показания с 72 датчиков и обрабатываем их до некоего среднего значения.

Поскольку методов снятия температуры не так много, и самый дешевый из них - это уровень падения напряжения на P-N переходе (диод, проще говоря) - то нам нужен достаточно точный и быстрый АЦП на 72 канала минимум, чтоб обрабатывать такое количество диодов - такого устройства на плате нет (да и быть не может - потому что такой АЦП будет стоить как такое устройство целиком).  

 

Либо в каждом чипе должен стоять свой АЦП, который будет "говорить" цифрой в шину реальную температуру своего чипа. Мало того, что в таких горячих устройствах это не реально - надо чем то компенсировать погрешности самого АЦП, в зависимости от внешних условий, так еще АЦП надо обеспечить опорное питание, с очень малой погрешностью. А таких источников питания на плате тоже нет. 

 

Поэтому разработчики пошли обычным путем. Снимаем показания с 2 точек, максимально удаленных друг от друга. По ним строим усредненную таблицу, на которую опирается алгоритм управления кулерами - это как раз максимальные возможности того PIC, что стоит на плате. Судя по тому, что кулера управляются абсолютно линейно - значит в алгоритме не используются даже зачатки ПИД. "Дешево и сердито".  А юзеру в интерфейсе можно показывать "график полета мухи" - все равно подавляющее большинство в этом ровно ничего не понимает и верит на слово про "уникальные разработки управления охлаждением",

Изменено пользователем Hits

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Нужно брать две неисправные платы и чипы с одной на другую подкидывать. Еще керамику по хорошему проверить там где просадка по напряжению.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×