Перейти к содержанию

Ремонт: Bitmain Antminer s7, s9, l3+


Hlorofos
Сообщение добавил Hlorofos

Все полезные ссылки и FAQ можно найти в первом сообщении. Прежде чем задать вопрос, посмотрите там.

Рекомендуемые сообщения

@iddqd2d Наверное вы имели в виду 63 чип а не 62? Если все сигналы действительно идентичны, то логично было бы предположить, что неисправен первый чип. 

Ссылка на комментарий
Поделиться на другие сайты

3 minutes ago, iddqd2d said:

Добрый вечер.

Не определяется 1 плата на S9, в логах пишет "retry Chain[J6] has 0 asic"

замерил все точки под каждым асиком- все показания однородны без критических отклонений.

На 62 чипе нет проверочных пятаков, насколько я понял шина RI она же RX идет от 62 к 0 асику, получается опрос не идет дальше 62 а умирает и уже из этого следует запись в логе "retry Chain[J6] has 0 asic"

напряжения все идентичны с рабочей платой.

пните в нужном направлении.

лог приложил

хешплата v4.21

предложение отправить в ремонт не рассматриваю)

есть руки ослик тестеры и всяк такое.

log.txt 99.12 kB · 1 download

 

6 minutes ago, iddqd2d said:

Добрый вечер.

Не определяется 1 плата на S9, в логах пишет "retry Chain[J6] has 0 asic"

замерил все точки под каждым асиком- все показания однородны без критических отклонений.

На 62 чипе нет проверочных пятаков, насколько я понял шина RI она же RX идет от 62 к 0 асику, получается опрос не идет дальше 62 а умирает и уже из этого следует запись в логе "retry Chain[J6] has 0 asic"

напряжения все идентичны с рабочей платой.

пните в нужном направлении.

лог приложил

хешплата v4.21

предложение отправить в ремонт не рассматриваю)

есть руки ослик тестеры и всяк такое.

log.txt 99.12 kB · 1 download

Если на 1 чипе есть 1.8v ri а с 62 clk 0.9-1v то не сильно прижми радиатор 1го асика, очень часто он бывает  в отвале.

Ссылка на комментарий
Поделиться на другие сайты

@ser_po 0-62 =63

Получается я прав с линией RI и то что 62 чип можно назвать первым ? (в плане опроса)

как то можно его проверить без снятия радиатора (нет термоклея)

Опыта мало в ремонте асиков (

Изменено пользователем iddqd2d
Ссылка на комментарий
Поделиться на другие сайты

@iddqd2d не пудри себе мозги, нумерация с 1-63, так в логах, так и сам считай. Хотя дело твое конечно)

3 минуты назад, iddqd2d сказал:

можно назвать первым ?

Да, response output RO можно считать идет с 63 к первому.

6 минут назад, iddqd2d сказал:

как то можно его проверить без снятия радиатора (нет термоклея)

Как уже писале раннее, путем механического воздействия на радиатор.

Ссылка на комментарий
Поделиться на другие сайты

  @ser_po @alexey7mechanic Спасибо!

Прижал- работает.

Получается просто ребол решит эту проблему или замена ?

Так же есть проблема с соседней платой, она пишет то 60 то 63 асика, мне это говорит о проблеме с питанием 1.8 на 0-2 асиках(я так понял DC-DC один на 3 идет) или есть проблема в 1 из 3-х асиках в виде того же отвала ?

Ссылка на комментарий
Поделиться на другие сайты

1 час назад, iddqd2d сказал:

замерил все точки под каждым асиком- все показания однородны без критических отклонений.

Сферический конь.... Все показания одинаковые и верные? А какие вы показания считаете верными?  Да, и что вы имеете ввиду под показаниями, вольты на вольтметре или осциллограммы, а некоторые и сопротивление мерят, и на диод звонят и интерпретируют показания.

 

1 час назад, iddqd2d сказал:

На 62 чипе нет проверочных пятаков

Тестпоинты стоят перед чипом, т.е. это его входы/выходы, соответственно перед 62-м есть тестпоинты, а вот перед 0-м  - только 2 теспоинта. Хотя обмен по шине двунаправленный, и почти все сигналы это всеже выходы предыдущего чипа. Но с точки зрения диагностики эти сигналы полезны именно как входные сигналы следующего чипа и главный там отклик на эти сигналы от следующего чипа (RI).

1 час назад, iddqd2d сказал:

от 62 к 0 асику

Советую все же на форуме нумеровать их от 1 до 63 иначе вас будут не понимать.  У китайцев в логе они нумеруются то с 0, то с 1. Физические сущности (чипы) принято нумеровать с 1. С нуля нумерую программисты (массив в СИ начинается с нуля), поэтому в логе такая путаница. 

1 час назад, iddqd2d сказал:

насколько я понял шина RI она же RX идет от 62 к 0 асику, получается опрос не идет дальше 62 а умирает и уже из этого следует запись в логе "retry Chain[J6] has 0 asic"

Возможно вы не совсем понимаете. Это творчески переработанный китайцами UART с добавлением арбитража шины в виде сигнала BO (так как UART это точка-точка). CO и RI это соответственно Tx и Rx. Сигналы инверсные и RO за 63-м чипом подтянут к плюсу. Ко всем чипам одновременно по шине приходит запрос (по CO), но ответить должен только один, адрес которого указан в запросе (по RI). Тут выходит на сцену сигнал арбитража шины - BO. Если BO на входе чипа высокий, то он не будет отвечать, так как шина занята.

Итак мы плавно подобрались к вашей проблеме. ASIC = 0 и неисправность 1-го чипа это настолько редкий случай, насколько и неисправность любого другого чипа. Если диагностируете по вольтметру, то в рабочем режиме, если на всех чипах есть клок, RST и CO высокий, то ваш клиен - чип на котором RI переходит из нуля в единицу (надеюсь из данного опуса понятно почему).

Для подтверждения номера диагностированного чипа, как советовали уважаемые коллеги, прижимаете его за радиатор к плате, и как правило плато начинает работать.

 

P.S. Пока писал опус, проблема решилась. Но пусть останется на память

Изменено пользователем Splinter
Ссылка на комментарий
Поделиться на другие сайты

46 минут назад, iddqd2d сказал:

Получается просто ребол решит эту проблему или замена ?

Только замена. Если просто перепаяете и он заработает - то обязательно вернется, а может и до выдачи умрет.

48 минут назад, iddqd2d сказал:

есть проблема с соседней платой, она пишет то 60 то 63 асика, мне это говорит о проблеме с питанием 1.8 на 0-2 асиках(я так понял DC-DC один на 3 идет) или есть проблема в 1 из 3-х асиках в виде того же отвала ?

либо проблема с питанием 1,8 В, только не 1-го домена (чипы объеденены в домены по 3 штуки, домены нумеруются от первого чипа), а 21-го, либо отвал 60-го или 61-го чипа (замеры между этими чипами покажут кто виноват).  Последнее более вероятно. И в доменах нет DC-DC, там LDO (да, в каждом домене).

Ссылка на комментарий
Поделиться на другие сайты

3 часа назад, Splinter сказал:

Убедитесь, что выставляете джамперы верно.

Да именно этот джампер, в это положение. Включаю и просто светятся красный и зеленый светодиоды. пробовал не нескольких контрольках. Не знаю что еще предпринять.

Ссылка на комментарий
Поделиться на другие сайты

26 минут назад, Splinter сказал:

Сферический конь.... Все показания одинаковые и верные? А какие вы показания считаете верными?  Да, и что вы имеете ввиду под показаниями, вольты на вольтметре или осциллограммы, а некоторые и сопротивление мерят, и на диод звонят и интерпретируют показания.

проверял диодной прозвонкой, показания брал из какого то пдф на китайском где были некие "эталонные" показания который отличались по краям платы вдоль.

37 минут назад, Splinter сказал:

Возможно вы не совсем понимаете. Это творчески переработанный китайцами UART с добавлением арбитража шины в виде сигнала BO

это я понял. в топике есть информация о работе. спасибо за подробное объяснение!

 

Ссылка на комментарий
Поделиться на другие сайты

Это стандартная тема по отъему бабла у населения - одни и те же люди пишут и вирусы и антивирусы, но если раньше вирусы были только на компах, то сейчас есть такая рыбная тема, как асики.  А был ли мальчик?

"Хочешь не поймать вирус?  Купи новую прошивку!"

Ссылка на комментарий
Поделиться на другие сайты

Так vnish их сам и пишет в смысле новые прошивки

Ну или его команда

 

Ссылка на комментарий
Поделиться на другие сайты

1 минуту назад, Nagat сказал:

Лежат 200 S9..

Это именно ваше оборудование?  И какая была прошивка до этого "заражения"?

Ссылка на комментарий
Поделиться на другие сайты

@Nagat Ну это ты при увеличил он вроде писал из 900 штук 52 не поднял контрольки накрылись

Ссылка на комментарий
Поделиться на другие сайты

@Nagat 

дип ребутом с двумя кнопками пробовали?

Ссылка на комментарий
Поделиться на другие сайты

@Nagat 

  на заведенном asice зажимаем ipreport иr eset держим 20 секунд , выключаем блок питания не отпуская нажатые кнопки ждем 10 сек не отпуская кнопки ipreport и reset ,,включаем блок питания иеще 20 сек держим ipreport и reset. потом отпускаем и имеем чистую прошивку.

Ссылка на комментарий
Поделиться на другие сайты

так и поступим )), спасибо.

Изменено пользователем Nagat
Ссылка на комментарий
Поделиться на другие сайты

@Nagat 

все делать в изолированной сети потом шустро менять пароли на вебморде и ssh

Ссылка на комментарий
Поделиться на другие сайты

Добрый день! Прочитал последние 70 страниц этой темы, но ответа так и не нашел.

Что делать в ситуации, когда после переустановки J4 в режим read from SD при старте загораются зеленый и красный LED на морде и ничего не происходит. Причем не важно есть ли в слоте SD хоть что-то или нет. 

При этом если загрузиться в режиме read from nand с вставленной sd-картой, то ее видно, она маунтится и все ок т.е. предположение про хреново спаянный разъем отпадает.

Как это вылечить?

Перезаливка прошивки через вебморду не помогает в реанимации, резеты сбросы и т.п. тоже. Не стартует bmminer. 

В логе нонстоп спам: 

Скрытый текст

 

waiting for receive_func to exit!
waiting for pic heart to exit!
bmminer not found= 1376 root       0:00 grep bmminer

bmminer not found, restart bmminer ...
bmminer not found= 1383 root       0:00 grep bmminer

bmminer not found, restart bmminer ...
bmminer not found= 1390 root       0:00 grep bmminer

 

При попытке через ssh вручную запустить bmminer  нонстоп спам:

Скрытый текст

--- enable_pic_dac
killall: bmminer: no process killed
/usr/bin/bmminer: symbol lookup error: /usr/lib/libresolver.so.1: undefined symbol: check_egrep

 

Ссылка на комментарий
Поделиться на другие сайты

Друзья! Предлагаю проблему восстановления плат управления обсуждать в другой теме. Это обширная и актуальная сейчас тема в виду объемов заражения. У кого эта проблема актуально - создайте тему с лаконичным названием. Уже есть пара тем, можно писать там. В этой же теме исторически обсуждается аппаратный ремонт.

@unholyprophet на данный момент решения нет (при условии что вы все делаете верно при попытке прошить с SD)

Ссылка на комментарий
Поделиться на другие сайты

17 минут назад, Splinter сказал:

Друзья! Предлагаю проблему восстановления плат управления обсуждать в другой теме. Это обширная и актуальная сейчас тема в виду объемов заражения. У кого эта проблема актуально - создайте тему с лаконичным названием. Уже есть пара тем, можно писать там. В этой же теме исторически обсуждается аппаратный ремонт.

@unholyprophet на данный момент решения нет (при условии что вы все делаете верно при попытке прошить с SD)

В том то и дело, что это 100% не вирус т.к. вышли из строя всего несколько контролек, а в сети более тысячи антмайнеров. Скорее всего проблема с нандом, только мне бы понять можно ли его вылечить без замены нанда или шаманства с программатором.

Эта тема в закрепе, другая тема по ремонту плат управления может легко утонуть в других обсуждениях.

@Splinter что подразумевается под "все делаю правильно"? Сбрасываю до завода, меняю джампер J4 в положение read from SD, и при старте платы сразу 2 лампочки зеленая и красная независимо есть ли в слоте sd-карта или нет. Часть контролек прошилась с SD и заработала, часть нет. Платы насколько я понимаю одинаковые. Вот и пытаюсь понять это хардварная(помер чип нанда) или софтварная(косяк прошивки) проблема.

18.12.2018 в 19:14, alexey7mechanic сказал:

Может кому то будет нужна прошивка для тестов плат S9 и T9. Знаю много чего еще можно дабавить но и так норм помогает в ремонте плат.

Repair_s9_t9_fw.tar.gz:

https://ru.files.fm/u/9pdh3nmp

https://dropmefiles.com/NC6P5

https://filecloud.me/tzjjpppd8fgi.html

Screenshot from 2018-12-18 17-54-00.png

Screenshot from 2018-12-18 17-54-30.png

Screenshot from 2018-12-18 17-56-26.png

Screenshot from 2018-12-18 17-58-26.png

Как ни странно, но с этой прошивкой всё завелось. Теперь понять бы чем она отличается от родной битмейновской.

з.ы. спасибо за прошивку!

Изменено пользователем unholyprophet
Ссылка на комментарий
Поделиться на другие сайты

2 минуты назад, unholyprophet сказал:

В том то и дело, что это 100% не вирус т.к. вышли из строя всего несколько контролек, а в сети более тысячи антмайнеров. Скорее всего проблема с нандом, только мне бы понять можно ли его вылечить без замены нанда или шаманства с программатором.

Встроенная nand к процессу запуска с SD отношения не имеет, ее вообще может не быть физически, но загрузка с SD должна пойти.

4 минуты назад, unholyprophet сказал:

 что подразумевается под "все делаю правильно"? Сбрасываю до завода, меняю джампер J4 в положение read from SD, и при старте платы сразу 2 лампочки зеленая и красная независимо есть ли в слоте sd-карта или нет.

Если SD записана верно (а по вашим словам с нее прошились остальные майнеры), то вы делаете все верно. Остается только вариант с вирусом.

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Similar Topics

    • Antminer L3, L3+

      Доброй ночи! пожалуйста помогите кто знает с antminer l3+  работает 1.5 недели, все было хорошо.  В один момент вижу, что он выключен пришел его перезагрузил и началось   Вообщем выдает ошибку socket connect failed. connection refused то иногда включается и показывает на второй плате 21 чип место 71  много раз перезагружал, перекинул с другого асика блок питания он все равно так   не майнит уходит в ошибку   что делать подскажите пожалуйста, асику всего полторы недели скрины приложил

      в ASIC/FPGA майнеры

    • блок питания Antminer T21

      Нужен ваш совет . Есть ли какой то способ подключить Bitcoin Miner T21 190T Power supply AC Input voltage  380~415 3610W к одной фазной сети 200 - 230 вольт !? Векторный преобразователь частоты 220 > 380В сможет !? Например - https://spc.com.ua/ru/products/nietz-splc-nz2200-15gs2-vector-frequency-inverter-15kw-ip20-1phase-220v-to-3phase-380v

      в Блоки питания, ИБП, силовая часть

    • Antminer S17, S17pro, S17+, S17e, T17, T17e, T17+

      Официальный сайт | Manual | Прошивка (официальный сайт) | Прошивка (bits.media)   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда,  F.A.Q по майнингу. Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы. Сообщения, не относящиеся к теме обсуждения (оффтоп), удаляются без предупреждения.   Технические характеристики:   Статьи на Bits.me

      в ASIC/FPGA майнеры

    • Antminer S19,-pro, S19j,-pro, S19a, S19i, S19 Hyd, S19pro Hyd, S19pro+ Hyd, T19 Hyd

      Официальный сайт | Manual | Прошивка (официальный сайт) | Прошивка (bits.media)   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда,  F.A.Q по майнингу. Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы. Сообщения, не относящиеся к теме обсуждения (оффтоп), удаляются без предупреждения.   Технические характеристики:   Статьи на Bits.me

      в ASIC/FPGA майнеры

    • Antminer D3. Плата управления.

      Привет всем. во время прошивки отключилось питание. по всей вероятности, покривился бутлоадер. ибо, загрузится с MicroSD карты теперь невозможно. плата не переводится в аварийный режим загрузки с флешки замыканием по диагонали контактов 43 на разъёме Р8 и 3, на разъёме Р9 (или 29,30 NAND) возможно ли восстановить загрузчик через JTEG или как-то ещё? в правом верхнем углу платы, правее NAND, место под разъём MicroUSB, можно ли залить бутлоадер через него? спасибо.  

      в ASIC/FPGA майнеры

×
×
  • Создать...