Перейти к содержанию

Внутренности L3+ (фото) и замеры напряжений на чипах


rldep

Рекомендуемые сообщения

Выкладываю фотки платы Antminer L3+

 

Плата по организации похожа на плату Antminer S7, как я ее видел на фотках и в описаниях.

 

Питание чипов организовано последовательно, цепочкой в 12 звеньев. В каждом звене 6 чипов (параллельно).

 

Напряжение на выходе дросселя составляет около 10,5 вольт (прибор стрелочный, точнее не показывает). При инициализации/рестарте майнера напряжение снимается.

 

Напряжения на звеньях последовательной цепочки - примерно 0,85 вольта (прибор стрелочный, ну вы поняли).

 

Фотки не удалось выложить в оригинальном размере и качестве (слишком большой размер), но старался при сжатии не сильно испортить.

 

 

post-14853-0-50068700-1498506226_thumb.jpg

post-14853-0-34528100-1498506227_thumb.jpg

post-14853-0-69093900-1498506228_thumb.jpg

post-14853-0-60256300-1498506229_thumb.jpg

post-14853-0-51735500-1498506255_thumb.jpg

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 241
  • Создана
  • Последний ответ

Топ авторов темы

Топ авторов темы

Изображения в теме

... а теперь о том, зачем я полез внутрь майнера )))

 

одна из четырех плат стала сбоить - показывает неполное количество чипов (от 1 до 20), нулевой хэшрейт, и вынуждает майнер перезагружаться.

 

Напряжение на выходе дросселя такое же, как у исправной платы - около 10,5 вольт

 

Промерил напряжения на чипах.

 

В момент, когда на чипы подано напряжение, но майнинг вероятно, еще не запущен - везде примерно по 0,85 вольт. как положено.

 

А потом, видимо при запуске майнинга - на крайнем левом звене цепи (самое ближнее к земле) - становится примерно 0,5 - 0,6 вольта. Что-то в этом звене не так, просаживается напряжение.

 

 

Вот на этом моменте мне уже нужна помощь - я не знаю, как диагностировать неисправный чип и как его обойти.

Изменено пользователем rldep
Ссылка на комментарий
Поделиться на другие сайты

Может дороги резать по питанию, чтобы не выпаивать все?

 

Еще осциллографом можно посмотреть форму в разных точках.

 

Надо еще электролиты проверять и что там формирует питалово? какой-то драйвер по-центру? его бы протестить, на видяхах они иногда просто так перестают работать.

Изменено пользователем vvvb1
Ссылка на комментарий
Поделиться на другие сайты

@vvvb1, кстати да, в каждой цепочке присутствует LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

Ссылка на комментарий
Поделиться на другие сайты

LDO-регулятор с маркировкой 4VK4, это по всей видимости LN1134A

 

post-5592-0-49127000-1498530788_thumb.jpg

Ссылка на комментарий
Поделиться на другие сайты

Пятиногие стабилизаторы на 1,8v, установленные в каждом звене цепочки, по всей видимости формируют напряжение для управляющих сигналов, как я понял с разных форумов. При следующем эксперименте замерю напряжение на их выходах, но похоже к падению напряжения на питании асик-чипов они отношения не имеют...

Ссылка на комментарий
Поделиться на другие сайты

У нас такая же история уже аж с двумя майнерами

и на обоих именно 2ая плата теряет чипы с 72 до 20-30 чипов остается

Ссылка на комментарий
Поделиться на другие сайты

 

 

У нас такая же история уже аж с двумя майнерами

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

Ссылка на комментарий
Поделиться на другие сайты

Я видел.

Надо пытаться ремонтировать. Отправка всего майнера по гарантии приведет к большей недополученной прибыли, чем стоимость одной платы.

 

вы попробовали сами спаять?

Ссылка на комментарий
Поделиться на другие сайты

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

Ссылка на комментарий
Поделиться на другие сайты

А озвучьте маркировку выделенного на фото контроллера. 

Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

post-56764-0-23095600-1498645084_thumb.png

Ссылка на комментарий
Поделиться на другие сайты

Достаем платы и в ремонт, зачем эти гадания на кофейной гуще? 

 

Подскажите пожалуйста в Москве есть кто ремонтирует такие платы?

Ссылка на комментарий
Поделиться на другие сайты

 

 

А озвучьте маркировку выделенного на фото контроллера.  Так-то, схемотехнически - это же ШИМ обычный. Не должен он иметь двукратного падения напряжения, если работает в нормальном режиме. Даже если нагрузка превышает его характеристики (ну если, конечно, это не фуфел полный по качеству). В защиту по токомеру упасть - это да. 

 

Не могу разобрать по фоткам, а живьем до аппарата доберусь только дней через 10. Обязательно посмотрю. На выходе DC-DC напряжение совпадает с исправной платой, падение только на одном из звеньев цепочки чипов...

 

 

 

А вы писали в bitmain что они гаварят по этому поводу.

 

Поставщик сказал мне, что гарантийный ремонт - не проблема. Проблема только в том, что аппарат надо оправлять в ремонт целиком, и за время пересылки и ремонта недополученная прибыль превысит стоимость больной платы.

Ссылка на комментарий
Поделиться на другие сайты

не гарантийный ремонт есть, достаем одну плату и отправляем. весь блок отправлять глупо, проще заплатить за ремонт

Ссылка на комментарий
Поделиться на другие сайты

Добавлю свои 5 копеек. На первой фотке термосенсоры, выделенные красным, никакого отношения к реальной температуре чипов не имеют. Они меряют температуру платы. И когда софт показывает, что "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120. Термоинтерфейс, которым приклеены родные радиаторы, убогий до невозможности. Нанесен криво, с пузырями в составе. Неудивительно, что L3+ умирает пачками. 

Мы нашли состав, который должен быть лучше родного на порядок - в понедельник будем испытывать. Кстати, даже Номакон 3Т-15,0, несмотря на то, что имеет силиконовую основу, лучше по качеству, чем родной для теплоотвода. Но радиаторы закрепить на нем проблематично. 

 

Сборка и качество платы - это отдельная песня. Но все равно - можно считать ремонтопригодной. Хоть и технологически достаточно сложно. Выявление помирающих чипов термоскопом тут уже не проходит. Пришлось снифить трафик лог. анализатором и разбирать на составляющие. 

post-56764-0-17907300-1499004044_thumb.jpg

post-56764-0-59177400-1499004096_thumb.jpg

Ссылка на комментарий
Поделиться на другие сайты

 "на плате столько-то градусов, на чипах столько-то" - он безбожно брешет. Когда на плате около 80 градусов по датчикам - на чипах реально 110-120.

 

 

Может там в самом чипе отдельный датчик?

Ссылка на комментарий
Поделиться на другие сайты

Может там в самом чипе отдельный датчик?

 

Там может быть хоть десяток датчиков. Но обработкой температуры и передачей ее на контроллер занимается PIC16f1704, который стоит рядом с ШИМом основного питания - а он ничего не знает о том, что там на чипах. Реверс трафика с чипов точно говорит, что в нем нет ничего, указывающего на температуру. 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

Изменено пользователем Hits
Ссылка на комментарий
Поделиться на другие сайты

 

 

Да и мерил я температуры чипов в нагрузке и без, и температуру платы. И явно вижу, что софт показывает именно температуру платы.

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

Ссылка на комментарий
Поделиться на другие сайты

все четыре значения - это температура платы? Тогда как она измеряется двумя датчиками и при этом имеет четыре разных значения для каждой платы? Или что-то не сходится или я чего-то недопонял в ваших объяснениях.

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

post-56764-0-72418300-1499157766_thumb.png

Ссылка на комментарий
Поделиться на другие сайты

 

 

Если вы про эти 4 значения, что на скрине - то это "дрейф". Разброс показаний от минимальным к максимальным по 2 разным каналам измерений. 

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

Ссылка на комментарий
Поделиться на другие сайты

То есть это профанация, что они измеряют температуру на входе и выходе плат и чипов, и по сути просто меряют температуру плат и выдают  экстремумы одного датчика за показания двух разных датчиков? Я просто пытаюсь разобраться, всё ли я правильно понимаю...

 

Ну профанация - это, пожалуй, перебор. Я бы сказал, что это максимальная оптимизация производства. Не забывайте, что устройство то, само по себе, максимально дешевое. По моим прикидкам, производитель от реальной цены железа имеет примерно 10 концов чистого профита.

 

Вот давайте, просто гипотетически, представим ситуацию, что мы снимаем показания с 72 датчиков и обрабатываем их до некоего среднего значения.

Поскольку методов снятия температуры не так много, и самый дешевый из них - это уровень падения напряжения на P-N переходе (диод, проще говоря) - то нам нужен достаточно точный и быстрый АЦП на 72 канала минимум, чтоб обрабатывать такое количество диодов - такого устройства на плате нет (да и быть не может - потому что такой АЦП будет стоить как такое устройство целиком).  

 

Либо в каждом чипе должен стоять свой АЦП, который будет "говорить" цифрой в шину реальную температуру своего чипа. Мало того, что в таких горячих устройствах это не реально - надо чем то компенсировать погрешности самого АЦП, в зависимости от внешних условий, так еще АЦП надо обеспечить опорное питание, с очень малой погрешностью. А таких источников питания на плате тоже нет. 

 

Поэтому разработчики пошли обычным путем. Снимаем показания с 2 точек, максимально удаленных друг от друга. По ним строим усредненную таблицу, на которую опирается алгоритм управления кулерами - это как раз максимальные возможности того PIC, что стоит на плате. Судя по тому, что кулера управляются абсолютно линейно - значит в алгоритме не используются даже зачатки ПИД. "Дешево и сердито".  А юзеру в интерфейсе можно показывать "график полета мухи" - все равно подавляющее большинство в этом ровно ничего не понимает и верит на слово про "уникальные разработки управления охлаждением",

Изменено пользователем Hits
Ссылка на комментарий
Поделиться на другие сайты

Нужно брать две неисправные платы и чипы с одной на другую подкидывать. Еще керамику по хорошему проверить там где просадка по напряжению.

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти

×
×
  • Создать...