Перейти к содержанию

Ремонт: Antminer s17/t17


DeathOfPower

Рекомендуемые сообщения

По е T17е, подскажите пожалуйста, выдает ошибку ERROR TEMP LOST.

Я правильно понимаю, что скорее всего дело в чипах на которых висят термодатчики?

И какие (по номерам) это чипы?

Заранее спасибо

Ссылка на комментарий
Поделиться на другие сайты

  • Ответов 872
  • Создана
  • Последний ответ

Топ авторов темы

Добрый день.

Chain[2]: find 0 asic, times 0

Какова самая распространенная причина, при которой одна из плат не видит сразу все чипы? 

Периодически после n ребутов, плата стартует.

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Задаю вопрос тк отдаю в ремонт две платы с данной неисправностью уже не в первый раз за весьма немалые деньги, каждый раз ремонтник путанно объясняет какой там 3,14здец и как все сложно, потому он ремонтировал их целый месяц, но после ремонта они работают 1-2 месяца и все по новой. Гарантия естественно 1 неделя.  

Заранее спасибо.

Изменено пользователем trinadsatiy
Ссылка на комментарий
Поделиться на другие сайты

@trinadsatiy на плате чипы сидят, условно "последовательно": отвалился первый - не видно всех остальных. не работает хоть один - отключается вся плата

основные причины - плохой отвод тепла, приводящий к выгоранию чипа либо обламывание ножек его контактов из-за "дребезга" радиатора в воздушном потоке и т.п.
почему при включении/выключении - экстратоки (?)

n ребутов - повезло, но если причина первая, то чип будет скорее всего "красным" (на расширенных прошивках)

сложность диагностики в таком случае - точно определить, который из чипов в гриде сдох, остальное дело несложной техники.

 

уважаемый @Splinter поправит, если я ошибаюсь

Изменено пользователем hogopogo
Ссылка на комментарий
Поделиться на другие сайты

@hogopogo Спасибо за ответ

Контролька отключает платы, где 0 чипов, потому в расширенных настройках все чипы по этим платам зелёные, но с N/A вместо HW и без частоты/напряжения.

Я сталкивался с ситуацией, когда не работал 1-2 чипа, тогда лог писал что find 76 asic of 78, times 0 или как-то так, то есть явно указывал, что проблема в 1-2 чипах. При этом, кстати, плата тоже отключалась от майнинга.

Потому в данной ситуации, когда он вообще 0 находит и подумал, что дело не в каком-то одном чипе, а скорее в чем-то более общем, например, не поступает питание куда-то или что-то подобное.

Ссылка на комментарий
Поделиться на другие сайты

@hogopogo По моемому вот также сбивчиво и тот мастер отвечает ))

@trinadsatiy 

Основная, самая частая причина - потеря контакта чипа(ов) с контактными площадками на плате в следствии появления микротрещин в пайке. Это следствие 2-х факторов: вибрации и термоциклирования. Из физики помним, нагреваясь материалы расширяются, охлаждаясь - сжимаются. К сожалению битмайн, кроме прочей кучи технологических ошибок, сделал роковую - использовал низкотемпературный висмутовый припой. Он не эластичен и хрупок, плюс имеет низкую температуру плавления, порядка 120 гр.

Итак термоциклирование - перезагрузки приводят к быстрому охлаждению и нагреву платы, что в сочетании с вибрацией приводит к постепенному разрушению пайки. Все же помнят что если много раз сгибать-разгибать металлическую пластину она в итоге разрушится в месте изгиба. Тут тоже самое в миниатюре.

Что касается повторных ремонтов. К сожалению сделать раз и навсегда врядли выйдет. А вот срок между ремонтами уже зависит от рук и моральных принципов мастера.

Можно сделать супербыстро если найти реальное место потери контакта (что кстати чертовски сложно т.к. дефект плавающий и стабильно поймать его почти невозможно - он проявляется и исчезает почти мгновенно) - "перекатать отвалившийся чип". Но дело в том что плата полностью эксплуатируется в одних условиях и состояние припоя на всей плате также одинаковое плюс минус. Т.е. следующая микротрещина может дать о себе знать хоть на следующий день, а может через неделю.

Способ средней затратности - пропайка всей платы. Снимаются радиаторы, плата тщательно чистится, наносится флюс на все чипы и пропаивается. В этом же процессе сразу и меняются подгоревшие чипы - чипы которые могут майнить даже хорошо, но от перегрева начавшие разрушаться и разрушать плату под собой (прогарать). На годовалой плате таких чипов обычно в среднем порядка 10-20 % (но может и не быть вовсе - как повезет).

Ну и хардкор способ - снять все чипы, зачистить их и посадочные места от старого припоя и накатать новый свинцовый припой. К сожалению нет статистики по таким ремонтам и даже не видел реальных мастеров кто так делает. Все об этом говорят, но похоже никто такого не видел. Может есть единицы кто этим занимается. Но это очень трудозатратно (читай - дорого), и тут есть риски ушатать плату оканчательно - мастер должен быть очень опытным и с хорошим оборудованием. Еще есть теоретический момент, который ставит под сомнение данный метод. Висмут соединяясь со свинцом образует эвтектическую смесь, а по простому температура плавления такой смеси меньше чем каждого из металлов по отдельности. А зачистить абсолютно идеально от старого припоя не возможно. Тонкая граница в месте пайки будет содержать как раз именно такую смесь. Так что теоретически это может только ухудшить ситуацию. Тут стоит опираться на статистику но ее к сожалению нет.

1 час назад, trinadsatiy сказал:

Также заметил, что каждый раз неисправность возникала строго после перезагрузки или отключения питания. Условно, если бы не перезагрузил - аппарат работал бы дальше на всех платах.

Из объяснения совершенно логично напрашивается ответ на ваше недоумение. У нагретой платы контакты расширились (микроскопически конечно же) и этого достаточно чтобы образовать электромеханический контакт (как в кнопке - одна пластинка прижалась к другой) и устройство работает. Но вы решили его перезагрузить, контакт остыл, материалы сжались и контакт пропал или "моросит". Майнеры уже давно придумали способ "прикуривать" такие платы - они подогревают их перед стартом теплым выхлопом другого аппарата. Или тырят у жены фен и проделывают тот же фокус. Ну или способ попроще - запустить аппарат как есть и дать ему прогреться и сделать перезагрузку - если помещение не холодное и платы не успевают остыть то неисправная плата может завестись. Лайфхаки так сказать )

Изменено пользователем Splinter
Ссылка на комментарий
Поделиться на другие сайты

@Splinter Большое спасибо за столь развернутое объяснение. 

Мой вопрос больше был в том, что может ли повреждение контакта одного чипа приводить к ошибке  find 0 asic? В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

Спасибо заранее.

Ссылка на комментарий
Поделиться на другие сайты

17 минут назад, trinadsatiy сказал:

В моем понимании логично, что если проблема с одним конкретным чипом, то будет что-то вроде find 77 asic of 78, повреждение же всех 78 чипов как минимум статистически невероятно. Потому я и предположил, что может дело не в одном чипе, а в чем-то более общем.

Ваше понимание не верно. Это нормально, т.к. чтобы понять и расшифровать это сообщение в логе надо знать принцип построения хэшплаты. Чипы соединяются между собой в одну длинную цепочку - чейн (chein) - по принципу елочной гирлянды (советской, где лампочки были включены последовательно). А количество увиденных в логе чипов уже зависит от того где пропал контакт на чипе. Цепочка может прерваться так, что не будет мешать чипам, находящимся до места обрыва - тогда в логе увидим, например, 27 из 30. Это значит что сигнал доходит до 27-го чипа но дальше обрывается. Чипы с 28 по 30 могут быть совершенно исправными. Хотя может быть и неисправным 28-ой чип, а 29-30 исправными.

В другом случае обрыв может произойти так, что чип будет "глушить" шину данных и в итоге мы получаем тот самый асик 0. Т.е., например, проблема гдето на 27 чипе, он глушит шину по сигналу ri - ответ от чипов, и все - тишина. Т.е. если асик 0, то это не значит, что умерли все чипы на плате и не значит, что проблема в первом чипе. Это значит что проблема равновероятно в любом чипе.

17 минут назад, trinadsatiy сказал:

Или все же даже повреждение контакта одного из чипов могут приводить к find 0 asic?

А вот это предположение совершенно верно.

Изменено пользователем Splinter
Ссылка на комментарий
Поделиться на другие сайты

@Splinter Теперь все ясно. 

Еще раз спасибо за разжевывание.

Хотел поставить плюсик, но видимо статус не позволяет, нет такой опции. 

Ссылка на комментарий
Поделиться на другие сайты

Всем привет. Подскажите, возможно ли проверять с помощью блока питания самого асика чипы на хэшплате? После включения, аппарат как только понимает, что есть битые чипы, перестает подавать напряжение на хэш-плату и соответственно чипы не проверить. Или я неправ? (аппарат t17e)

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...

Всем доброго времени суток! Такой вопрос: умерла одна плата t17e похожая ситуация как у пользователя trinadsatiy "0 asic" показывает. Подаю питание 18В а на БП показывает ток 0.05А и пропадает напруга. Взял исправные платы провел те же манипуляции безрезультатно. Думал в БП дело, подключал разные устройства и вентиляторы от 5-30В и током до 10А все исправно работает. А вот с хэш платой все молчит, и проверить больше никак не могу и не чем. Может кто сталкивался? Подключаю все верно, полярность не перепутал, вроде глаза и руки прямые)))

Ссылка на комментарий
Поделиться на другие сайты

2 часа назад, dizelekss сказал:

Подскажите маркировку чипов в т17

BM1397AG

Последняя буква может быть другая. AG самые универсальные, держат частоту 720 как в T17 42th.

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...

подскажите пожалуйста что за ошибка 

[2021/05/09 20:13:20] INFO: Initializing hash boards

[2021/05/09 20:13:20] INFO: chain[2] - Initializing

[2021/05/09 20:13:20] INFO: chain[1] - Initializing

[2021/05/09 20:13:20] INFO: chain[0] - Initializing

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:687 chain[2] - Voltage is different, cur=293 mV tgt=17000 mV

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:471 chain[2] - Failed to set start up voltage

[2021/05/09 20:13:33] INFO: chain[2] - Shutting down the chain

[2021/05/09 20:13:33] ERROR: driver-btm-base.c:356 chain[2] - Initialization failed

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:687 chain[1] - Voltage is different, cur=287 mV tgt=17000 mV

[2021/05/09 20:13:33] ERROR: driver-btm-chain.c:471 chain[1] - Failed to set start up voltage

Ссылка на комментарий
Поделиться на другие сайты

  • 3 недели спустя...

Всем привет питаюсь собрать т17 из кучу плат.  есть 4 абсолютно рабочих плат, назовём их так A. B. C. D. платы абсолютно одинаковые.

Так вот A. B. работают вместе и майнят. Так же C. D. работают вместе. Но нам нужно 3 платы в т17. И проблема такая берем A и B. к нему 

добавляем  платы C или D чтоб получилось 3 платы как положено, и оно не стартует. ругается на разное напряжение. Voltage are different. Will exit.

В чём проблема я понять не могу.

Скрытый текст

Booting Linux on physical CPU 0x0
Linux version 4.6.0-xilinx-gff8137b-dirty (lzq@armdev2) (gcc version 4.8.3 20140320 (prerelease) (Sourcery CodeBench Lite 2014.05-23) ) #25 SMP PREEMPT Fri Nov 23 15:30:52 CST 2018
CPU: ARMv7 Processor [413fc090] revision 0 (ARMv7), cr=18c5387d
CPU: PIPT / VIPT nonaliasing data cache, VIPT aliasing instruction cache
Machine model: Xilinx Zynq
cma: Reserved 16 MiB at 0x0e000000
Memory policy: Data cache writealloc
On node 0 totalpages: 61440
free_area_init_node: node 0, pgdat c0b39280, node_mem_map cde10000
  Normal zone: 480 pages used for memmap
  Normal zone: 0 pages reserved
  Normal zone: 61440 pages, LIFO batch:15
percpu: Embedded 12 pages/cpu @cddf1000 s19776 r8192 d21184 u49152
pcpu-alloc: s19776 r8192 d21184 u49152 alloc=12*4096
pcpu-alloc: [0] 0 [0] 1 
Built 1 zonelists in Zone order, mobility grouping on.  Total pages: 60960
Kernel command line: mem=240M console=ttyPS0,115200 ramdisk_size=33554432 root=/dev/ram rw earlyprintk
PID hash table entries: 1024 (order: 0, 4096 bytes)
Dentry cache hash table entries: 32768 (order: 5, 131072 bytes)
Inode-cache hash table entries: 16384 (order: 4, 65536 bytes)
Memory: 203752K/245760K available (6345K kernel code, 231K rwdata, 1896K rodata, 1024K init, 223K bss, 25624K reserved, 16384K cma-reserved, 0K highmem)
Virtual kernel memory layout:
    vector  : 0xffff0000 - 0xffff1000   (   4 kB)
    fixmap  : 0xffc00000 - 0xfff00000   (3072 kB)
    vmalloc : 0xcf800000 - 0xff800000   ( 768 MB)
    lowmem  : 0xc0000000 - 0xcf000000   ( 240 MB)
    pkmap   : 0xbfe00000 - 0xc0000000   (   2 MB)
    modules : 0xbf000000 - 0xbfe00000   (  14 MB)
      .text : 0xc0008000 - 0xc090c424   (9234 kB)
      .init : 0xc0a00000 - 0xc0b00000   (1024 kB)
      .data : 0xc0b00000 - 0xc0b39fe0   ( 232 kB)
       .bss : 0xc0b39fe0 - 0xc0b71c28   ( 224 kB)
Preemptible hierarchical RCU implementation.
    Build-time adjustment of leaf fanout to 32.
    RCU restricting CPUs from NR_CPUS=4 to nr_cpu_ids=2.
RCU: Adjusting geometry for rcu_fanout_leaf=32, nr_cpu_ids=2
NR_IRQS:16 nr_irqs:16 16
efuse mapped to cf800000
ps7-slcr mapped to cf802000
L2C: platform modifies aux control register: 0x72360000 -> 0x72760000
L2C: DT/platform modifies aux control register: 0x72360000 -> 0x72760000
L2C-310 erratum 769419 enabled
L2C-310 enabling early BRESP for Cortex-A9
L2C-310 full line of zeros enabled for Cortex-A9
L2C-310 ID prefetch enabled, offset 1 lines
L2C-310 dynamic clock gating enabled, standby mode enabled
L2C-310 cache controller enabled, 8 ways, 512 kB
L2C-310: CACHE_ID 0x410000c8, AUX_CTRL 0x76760001
zynq_clock_init: clkc starts at cf802100
Zynq clock init
sched_clock: 64 bits at 333MHz, resolution 3ns, wraps every 4398046511103ns
clocksource: arm_global_timer: mask: 0xffffffffffffffff max_cycles: 0x4ce07af025, max_idle_ns: 440795209040 ns
Switching to timer-based delay loop, resolution 3ns
clocksource: ttc_clocksource: mask: 0xffff max_cycles: 0xffff, max_idle_ns: 537538477 ns
ps7-ttc #0 at cf80a000, irq=18
Console: colour dummy device 80x30
Calibrating delay loop (skipped), value calculated using timer frequency.. 666.66 BogoMIPS (lpj=3333333)
pid_max: default: 32768 minimum: 301
Mount-cache hash table entries: 1024 (order: 0, 4096 bytes)
Mountpoint-cache hash table entries: 1024 (order: 0, 4096 bytes)
CPU: Testing write buffer coherency: ok
CPU0: thread -1, cpu 0, socket 0, mpidr 80000000
Setting up static identity map for 0x100000 - 0x100058
CPU1: failed to boot: -1
Brought up 1 CPUs
SMP: Total of 1 processors activated (666.66 BogoMIPS).
CPU: All CPU(s) started in SVC mode.
devtmpfs: initialized
VFP support v0.3: implementor 41 architecture 3 part 30 variant 9 rev 4
clocksource: jiffies: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 19112604462750000 ns
pinctrl core: initialized pinctrl subsystem
NET: Registered protocol family 16
DMA: preallocated 256 KiB pool for atomic coherent allocations
cpuidle: using governor menu
hw-breakpoint: found 5 (+1 reserved) breakpoint and 1 watchpoint registers.
hw-breakpoint: maximum watchpoint size is 4 bytes.
zynq-ocm f800c000.ps7-ocmc: ZYNQ OCM pool: 256 KiB @ 0xcf880000
vgaarb: loaded
SCSI subsystem initialized
usbcore: registered new interface driver usbfs
usbcore: registered new interface driver hub
usbcore: registered new device driver usb
media: Linux media interface: v0.10
Linux video capture interface: v2.00
pps_core: LinuxPPS API ver. 1 registered
pps_core: Software ver. 5.3.6 - Copyright 2005-2007 Rodolfo Giometti <giometti@linux.it>
PTP clock support registered
EDAC MC: Ver: 3.0.0
Advanced Linux Sound Architecture Driver Initialized.
clocksource: Switched to clocksource arm_global_timer
NET: Registered protocol family 2
TCP established hash table entries: 2048 (order: 1, 8192 bytes)
TCP bind hash table entries: 2048 (order: 2, 16384 bytes)
TCP: Hash tables configured (established 2048 bind 2048)
UDP hash table entries: 256 (order: 1, 8192 bytes)
UDP-Lite hash table entries: 256 (order: 1, 8192 bytes)
NET: Registered protocol family 1
RPC: Registered named UNIX socket transport module.
RPC: Registered udp transport module.
RPC: Registered tcp transport module.
RPC: Registered tcp NFSv4.1 backchannel transport module.
PCI: CLS 0 bytes, default 64
Trying to unpack rootfs image as initramfs...
rootfs image is not initramfs (no cpio magic); looks like an initrd
Freeing initrd memory: 12584K (cceb7000 - cdb01000)
hw perfevents: enabled with armv7_cortex_a9 PMU driver, 7 counters available
futex hash table entries: 512 (order: 3, 32768 bytes)
workingset: timestamp_bits=28 max_order=16 bucket_order=0
jffs2: version 2.2. (NAND) (SUMMARY)  © 2001-2006 Red Hat, Inc.
io scheduler noop registered
io scheduler deadline registered
io scheduler cfq registered (default)
dma-pl330 f8003000.ps7-dma: Loaded driver for PL330 DMAC-241330
dma-pl330 f8003000.ps7-dma:     DBUFF-128x8bytes Num_Chans-8 Num_Peri-4 Num_Events-16
e0000000.serial: ttyPS0 at MMIO 0xe0000000 (irq = 158, base_baud = 6249999) is a xuartps
console [ttyPS0] enabled
xdevcfg f8007000.ps7-dev-cfg: ioremap 0xf8007000 to cf86e000
[drm] Initialized drm 1.1.0 20060810
brd: module loaded
loop: module loaded
CAN device driver interface
gpiod_set_value: invalid GPIO
libphy: MACB_mii_bus: probed
macb e000b000.ethernet eth0: Cadence GEM rev 0x00020118 at 0xe000b000 irq 31 (00:0a:35:00:00:00)
Generic PHY e000b000.etherne:00: attached PHY driver [Generic PHY] (mii_bus:phy_addr=e000b000.etherne:00, irq=-1)
e1000e: Intel(R) PRO/1000 Network Driver - 3.2.6-k
e1000e: Copyright(c) 1999 - 2015 Intel Corporation.
ehci_hcd: USB 2.0 'Enhanced' Host Controller (EHCI) Driver
ehci-pci: EHCI PCI platform driver
usbcore: registered new interface driver usb-storage
mousedev: PS/2 mouse device common for all mice
i2c /dev entries driver
Xilinx Zynq CpuIdle Driver started
sdhci: Secure Digital Host Controller Interface driver
sdhci: Copyright(c) Pierre Ossman
sdhci-pltfm: SDHCI platform and OF driver helper
mmc0: SDHCI controller on e0100000.ps7-sdio [e0100000.ps7-sdio] using ADMA
ledtrig-cpu: registered to indicate activity on CPUs
usbcore: registered new interface driver usbhid
usbhid: USB HID core driver
nand: device found, Manufacturer ID: 0x2c, Chip ID: 0xda
nand: Micron MT29F2G08ABAGAWP
nand: 256 MiB, SLC, erase size: 128 KiB, page size: 2048, OOB size: 128
nand: WARNING: pl35x-nand: the ECC used on your system is too weak compared to the one required by the NAND chip
Bad block table found at page 131008, version 0x01
Bad block table found at page 130944, version 0x01
6 ofpart partitions found on MTD device pl35x-nand
Creating 6 MTD partitions on "pl35x-nand":
0x000000000000-0x000002800000 : "BOOT.bin-env-dts-kernel"
0x000002800000-0x000004800000 : "ramfs"
0x000004800000-0x000005000000 : "configs"
0x000005000000-0x000006000000 : "reserve"
0x000006000000-0x000008000000 : "ramfs-bak"
0x000008000000-0x000010000000 : "reserve1"
NET: Registered protocol family 10
sit: IPv6 over IPv4 tunneling driver
NET: Registered protocol family 17
can: controller area network core (rev 20120528 abi 9)
NET: Registered protocol family 29
can: raw protocol (rev 20120528)
can: broadcast manager protocol (rev 20120528 t)
can: netlink gateway (rev 20130117) max_hops=1
zynq_pm_ioremap: no compatible node found for 'xlnx,zynq-ddrc-a05'
zynq_pm_late_init: Unable to map DDRC IO memory.
Registering SWP/SWPB emulation handler
hctosys: unable to open rtc device (rtc0)
ALSA device list:
  No soundcards found.
RAMDISK: gzip image found at block 0
EXT4-fs (ram0): couldn't mount as ext3 due to feature incompatibilities
EXT4-fs (ram0): mounted filesystem without journal. Opts: (null)
VFS: Mounted root (ext4 filesystem) on device 1:0.
devtmpfs: mounted
Freeing unused kernel memory: 1024K (c0a00000 - c0b00000)
EXT4-fs (ram0): re-mounted. Opts: block_validity,delalloc,barrier,user_xattr
random: dd urandom read with 0 bits of entropy available
ubi0: attaching mtd2
ubi0: scanning is finished
ubi0: attached mtd2 (name "configs", size 8 MiB)
ubi0: PEB size: 131072 bytes (128 KiB), LEB size: 126976 bytes
ubi0: min./max. I/O unit sizes: 2048/2048, sub-page size 2048
ubi0: VID header offset: 2048 (aligned 2048), data offset: 4096
ubi0: good PEBs: 64, bad PEBs: 0, corrupted PEBs: 0
ubi0: user volume: 1, internal volumes: 1, max. volumes count: 128
ubi0: max/mean erase counter: 18/9, WL threshold: 4096, image sequence number: 243014538
ubi0: available PEBs: 0, total reserved PEBs: 64, PEBs reserved for bad PEB handling: 40
ubi0: background thread "ubi_bgt0d" started, PID 708
UBIFS (ubi0:0): background thread "ubifs_bgt0_0" started, PID 711
UBIFS (ubi0:0): recovery needed
UBIFS (ubi0:0): recovery completed
UBIFS (ubi0:0): UBIFS: mounted UBI device 0, volume 0, name "configs"
UBIFS (ubi0:0): LEB size: 126976 bytes (124 KiB), min./max. I/O unit sizes: 2048 bytes/2048 bytes
UBIFS (ubi0:0): FS size: 1396736 bytes (1 MiB, 11 LEBs), journal size 888833 bytes (0 MiB, 5 LEBs)
UBIFS (ubi0:0): reserved for root: 65970 bytes (64 KiB)
UBIFS (ubi0:0): media format: w4/r0 (latest is w4/r0), UUID A0A086A4-06D4-4248-A29E-AC296967A2B9, small LPT model
ubi1: attaching mtd5
ubi1: scanning is finished
ubi1: attached mtd5 (name "reserve1", size 128 MiB)
ubi1: PEB size: 131072 bytes (128 KiB), LEB size: 126976 bytes
ubi1: min./max. I/O unit sizes: 2048/2048, sub-page size 2048
ubi1: VID header offset: 2048 (aligned 2048), data offset: 4096
ubi1: good PEBs: 1020, bad PEBs: 4, corrupted PEBs: 0
ubi1: user volume: 1, internal volumes: 1, max. volumes count: 128
ubi1: max/mean erase counter: 1445/822, WL threshold: 4096, image sequence number: 3389548455
ubi1: available PEBs: 0, total reserved PEBs: 1020, PEBs reserved for bad PEB handling: 36
ubi1: background thread "ubi_bgt1d" started, PID 720
UBIFS (ubi1:0): background thread "ubifs_bgt1_0" started, PID 723
UBIFS (ubi1:0): recovery needed
UBIFS (ubi1:0): recovery completed
UBIFS (ubi1:0): UBIFS: mounted UBI device 1, volume 0, name "reserve1"
UBIFS (ubi1:0): LEB size: 126976 bytes (124 KiB), min./max. I/O unit sizes: 2048 bytes/2048 bytes
UBIFS (ubi1:0): FS size: 123039744 bytes (117 MiB, 969 LEBs), journal size 6221824 bytes (5 MiB, 49 LEBs)
UBIFS (ubi1:0): reserved for root: 4952683 bytes (4836 KiB)
UBIFS (ubi1:0): media format: w4/r0 (latest is w4/r0), UUID 721E72E7-F382-4130-AD9F-6C10D9102537, small LPT model
IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready
IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready
macb e000b000.ethernet eth0: unable to generate target frequency: 25000000 Hz
macb e000b000.ethernet eth0: link up (100/Full)
IPv6: ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
In axi fpga driver!
request_mem_region OK!
AXI fpga dev virtual address is 0xcfb38000
*base_vir_addr = 0xab013
In fpga mem driver!
request_mem_region OK!
fpga mem virtual address is 0xd2000000
2021-05-26 05:48:27 driver-btm-api.c:663:init_freq_mode: This is scan-user version
2021-05-26 05:48:27 driver-btm-api.c:2028:bitmain_soc_init: opt_multi_version     = 1
2021-05-26 05:48:27 driver-btm-api.c:2029:bitmain_soc_init: opt_bitmain_ab        = 1
2021-05-26 05:48:27 driver-btm-api.c:2030:bitmain_soc_init: opt_bitmain_work_mode = 0
2021-05-26 05:48:27 driver-btm-api.c:2031:bitmain_soc_init: Miner compile time: Thu Apr 23 16:29:07 CST 2020 type: Antminer T17
2021-05-26 05:48:27 driver-btm-api.c:2032:bitmain_soc_init: commit version: 1c5be6f 2020-04-20 16:18:14, build by: lol 2020-04-23 16:35:04
2021-05-26 05:48:27 driver-btm-api.c:1844:show_sn: no SN got, please write SN to /nvdata/sn
2021-05-26 05:48:27 driver-btm-api.c:1167:miner_device_init: Detect 256MB control board of XILINX
2021-05-26 05:48:27 driver-btm-api.c:1115:init_fan_parameter: fan_eft : 0  fan_pwm : 0
2021-05-26 05:48:27 thread.c:885:create_read_nonce_reg_thread: create thread
2021-05-26 05:48:33 driver-btm-api.c:1099:init_miner_version: miner ID : 81646c042b10481c
2021-05-26 05:48:33 driver-btm-api.c:1105:init_miner_version: FPGA Version = 0xB013
2021-05-26 05:48:35 eeprom.c:425:check_pattern_test_level: invalid pattern test result. ignore
2021-05-26 05:48:37 eeprom.c:425:check_pattern_test_level: invalid pattern test result. ignore
2021-05-26 05:48:39 eeprom.c:431:check_pattern_test_level: L1 board
2021-05-26 05:48:39 driver-btm-api.c:737:get_product_id: product_id[0] = 1
2021-05-26 05:48:39 driver-btm-api.c:737:get_product_id: product_id[1] = 1
2021-05-26 05:48:39 driver-btm-api.c:737:get_product_id: product_id[2] = 1
2021-05-26 05:48:39 driver-btm-api.c:1666:get_ccdly_opt: ccdly_opt[0] = 1
2021-05-26 05:48:39 driver-btm-api.c:1666:get_ccdly_opt: ccdly_opt[1] = 1
2021-05-26 05:48:39 driver-btm-api.c:1666:get_ccdly_opt: ccdly_opt[2] = 1
2021-05-26 05:48:39 driver-btm-api.c:1919:bitmain_board_init: g_ccdly_opt = 1
2021-05-26 05:48:39 driver-btm-api.c:676:_set_project_type: project:2
2021-05-26 05:48:39 driver-btm-api.c:706:_set_project_type: Project type: Antminer T17
2021-05-26 05:48:39 driver-btm-api.c:717:dump_pcb_bom_version: Chain [0] PCB Version: 0x0100
2021-05-26 05:48:39 driver-btm-api.c:718:dump_pcb_bom_version: Chain [0] BOM Version: 0x0100
2021-05-26 05:48:39 driver-btm-api.c:717:dump_pcb_bom_version: Chain [1] PCB Version: 0x0100
2021-05-26 05:48:39 driver-btm-api.c:718:dump_pcb_bom_version: Chain [1] BOM Version: 0x0100
2021-05-26 05:48:39 driver-btm-api.c:717:dump_pcb_bom_version: Chain [2] PCB Version: 0x0100
2021-05-26 05:48:39 driver-btm-api.c:718:dump_pcb_bom_version: Chain [2] BOM Version: 0x0100
2021-05-26 05:48:41 driver-btm-api.c:1939:bitmain_board_init: Fan check passed.
2021-05-26 05:48:42 board.c:36:jump_and_app_check_restore_pic: chain[0] PIC jump to app
2021-05-26 05:48:46 board.c:40:jump_and_app_check_restore_pic: Check chain[0] PIC fw version=0xb9
2021-05-26 05:48:48 board.c:36:jump_and_app_check_restore_pic: chain[1] PIC jump to app
2021-05-26 05:48:51 board.c:40:jump_and_app_check_restore_pic: Check chain[1] PIC fw version=0xb9
2021-05-26 05:48:53 board.c:36:jump_and_app_check_restore_pic: chain[2] PIC jump to app
2021-05-26 05:48:56 board.c:40:jump_and_app_check_restore_pic: Check chain[2] PIC fw version=0xb9
2021-05-26 05:48:56 thread.c:880:create_pic_heart_beat_thread: create thread
2021-05-26 05:48:56 power_api.c:55:power_init: power init ... 
2021-05-26 05:48:56 driver-btm-api.c:1949:bitmain_board_init: Enter 30s sleep to make sure power release finish.
2021-05-26 05:48:56 power_api.c:46:power_off: init gpio907
2021-05-26 05:49:28 power_api.c:232:set_iic_power_to_highest_voltage: setting to voltage: 17.00 ...
2021-05-26 05:49:34 power_api.c:124:check_voltage_multi: retry time: 0
2021-05-26 05:49:36 power_api.c:86:get_average_voltage: chain[0], voltage is: 19.073291 
2021-05-26 05:49:38 power_api.c:86:get_average_voltage: chain[1], voltage is: 18.436494 
2021-05-26 05:49:39 power_api.c:86:get_average_voltage: chain[2], voltage is: 17.799697 
2021-05-26 05:49:39 power_api.c:97:get_average_voltage: aveage voltage is: 18.436494 
2021-05-26 05:49:39 power_api.c:110:check_voltage: target_vol = 17.00, actural_vol = 18.44, more than 1.0v diff.
2021-05-26 05:49:40 power_api.c:124:check_voltage_multi: retry time: 1
2021-05-26 05:49:42 power_api.c:86:get_average_voltage: chain[0], voltage is: 16.905732 
2021-05-26 05:49:44 power_api.c:86:get_average_voltage: chain[1], voltage is: 16.348535 
2021-05-26 05:49:47 power_api.c:86:get_average_voltage: chain[2], voltage is: 15.448447 
2021-05-26 05:49:47 power_api.c:97:get_average_voltage: aveage voltage is: 16.234238 
2021-05-26 05:49:47 power_api.c:182:set_iic_power_by_voltage: now set voltage to : 17.000000 
2021-05-26 05:49:47 uart.c:80:set_baud: set fpga_baud = 115200, fpga_divider = 26
2021-05-26 05:49:57 driver-btm-api.c:1042:check_asic_number_with_power_on: Chain[0]: find 30 asic, times 0
2021-05-26 05:50:07 driver-btm-api.c:1042:check_asic_number_with_power_on: Chain[1]: find 30 asic, times 0
2021-05-26 05:50:17 driver-btm-api.c:1042:check_asic_number_with_power_on: Chain[2]: find 30 asic, times 0
2021-05-26 05:50:20 driver-btm-api.c:352:set_order_clock: chain[0]: set order clock, stragegy 3 clock_en=0x1
2021-05-26 05:50:21 driver-btm-api.c:352:set_order_clock: chain[1]: set order clock, stragegy 3 clock_en=0x1
2021-05-26 05:50:21 driver-btm-api.c:352:set_order_clock: chain[2]: set order clock, stragegy 3 clock_en=0x1
2021-05-26 05:50:21 driver-hash-chip.c:502:set_clock_delay_control: core_data = 0xb4
2021-05-26 05:50:21 uart.c:80:set_baud: set fpga_baud = 3000000, fpga_divider = 0
2021-05-26 05:50:21 driver-btm-api.c:1693:check_clock_counter: freq 50 clock_counter_limit 6
2021-05-26 05:50:22 uart.c:80:set_baud: set fpga_baud = 115200, fpga_divider = 26
2021-05-26 05:50:22 voltage[0] = 1730
2021-05-26 05:50:22 voltage[1] = 1730
2021-05-26 05:50:22 voltage[2] = 1690
2021-05-26 05:50:22 Voltage are different. Will exit.
2021-05-26 05:50:22 driver-btm-api.c:205:set_miner_status: ERROR_SOC_INIT
2021-05-26 05:50:22 driver-btm-api.c:146:stop_mining: stop mining: soc init failed!
2021-05-26 05:50:22 thread.c:930:cancel_read_nonce_reg_thread: cancel thread
2021-05-26 05:50:22 driver-btm-api.c:131:killall_hashboard: ****power off hashboard****

 

2021-05-26_214536.png

2021-05-26_214613.png

2021-05-26_214643.png

2021-05-26_214711.png

Ссылка на комментарий
Поделиться на другие сайты

@Farman Слейте EEPROM с любой из двух плат которые работают вместе и залейте его в третью - которая не работает вместе с теми двумя. И все заработает.

Ссылка на комментарий
Поделиться на другие сайты

On 4/12/2021 at 6:43 PM, Splinter said:

Это значит что проблема равновероятно в любом чипе.

Немного позанимался ремонтом и понял, что это не математически точное утверждение.

Все же чащи "вылетают" чипы с большими радиаторами, те, что ближе к выводу воздушного потока: хуже охлаждение, выше механическая нагрузка.

Говоря проще: чем больше на чипе радиатор, тем выше вероятность его перегрева и выхода из строя контактов.

Ссылка на комментарий
Поделиться на другие сайты

9 часов назад, AlexMu сказал:

это не математически точное утверждение

Если рассматривать ситуацию в контексте теории вероятности, вспомнить о матожидании, дисперсии и виде распределения, то вероятно вы будите правы. Распределение будет скорее всего носить нормальный характер (Гаусса).

Но мы здесь стараемся быть попроще. Не все заканчивали Бауманку чтобы заняться ремонтами. Цитируемый месседж нес простую смысловую нагрузку - при ASIC=0 проблема будет в любом чипе, а не в первом (как ошибочно думают начинающие). Чтобы быть математически точным, возможно следует там заменить слово "равновероятно" на "c нормальной функцией распределения вероятностей". Но тогда меня бы поняло 2 студента с настольным томиком по вышке.

Также ваше замечание больше справедливо для T17. У других моделей радиаторы значительно мельче и если накопить по ним статистику, то распределение вероятностей там думаю уже будет ближе к равномерному.

10 часов назад, AlexMu сказал:

чем больше на чипе радиатор, тем выше вероятность его перегрева

Это физически не точное утверждение.  Но в контексте темы ремонта T17 вполне справедливое.

Ссылка на комментарий
Поделиться на другие сайты

подскажите есть ли на т17 прошивка, которая делает циклический рестарт. ну как на с9  нажимаешь кнопку, и конторолько постоянно опрашиват  чипи, и ты спокойно по тест пойнтам смотришь сигналы.

Ссылка на комментарий
Поделиться на другие сайты

05.06.2021 в 15:15, Farman сказал:

подскажите есть ли на т17 прошивка, которая делает циклический рестарт. ну как на с9  нажимаешь кнопку, и конторолько постоянно опрашиват  чипи, и ты спокойно по тест пойнтам смотришь сигналы.

есть конечно, но она всего 3 опроса делает, другой не видел

Ссылка на комментарий
Поделиться на другие сайты

Подскажите пожалуйста кто знает, на шине CI присутствует напряжение 1,8v, как оно на неё может попасть? всю голову уже сломал.

CI1.jpg

Ссылка на комментарий
Поделиться на другие сайты

Подскажите пожалуйста нормальные сервисы в Москве, где отремонтируют данный аппарат.

Ссылка на комментарий
Поделиться на другие сайты

2 часа назад, cleaner1 сказал:

на шине CI присутствует напряжение 1,8v, как оно на неё может попасть?

Так оно там и должно быть. Что смущает то?

Ссылка на комментарий
Поделиться на другие сайты

Гость
Эта тема закрыта для публикации ответов.
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Similar Topics

    • Antminer L3, L3+

      Доброй ночи! пожалуйста помогите кто знает с antminer l3+  работает 1.5 недели, все было хорошо.  В один момент вижу, что он выключен пришел его перезагрузил и началось   Вообщем выдает ошибку socket connect failed. connection refused то иногда включается и показывает на второй плате 21 чип место 71  много раз перезагружал, перекинул с другого асика блок питания он все равно так   не майнит уходит в ошибку   что делать подскажите пожалуйста, асику всего полторы недели скрины приложил

      в ASIC/FPGA майнеры

    • Ремонт: Bitmain Antminer s7, s9, l3+

      Официальный сайт | Antminer. Все модели. Вопросы, помощь, обсуждение.   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы.   Статьи на bits.media:   Полезное:   (!) FAQ (часто задаваемые вопросы)   -Как найти в продаже разъемы питания, какая маркировка

      в ASIC/FPGA майнеры

    • блок питания Antminer T21

      Нужен ваш совет . Есть ли какой то способ подключить Bitcoin Miner T21 190T Power supply AC Input voltage  380~415 3610W к одной фазной сети 200 - 230 вольт !? Векторный преобразователь частоты 220 > 380В сможет !? Например - https://spc.com.ua/ru/products/nietz-splc-nz2200-15gs2-vector-frequency-inverter-15kw-ip20-1phase-220v-to-3phase-380v

      в Блоки питания, ИБП, силовая часть

    • Antminer S17, S17pro, S17+, S17e, T17, T17e, T17+

      Официальный сайт | Manual | Прошивка (официальный сайт) | Прошивка (bits.media)   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда,  F.A.Q по майнингу. Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы. Сообщения, не относящиеся к теме обсуждения (оффтоп), удаляются без предупреждения.   Технические характеристики:   Статьи на Bits.me

      в ASIC/FPGA майнеры

    • Antminer S19,-pro, S19j,-pro, S19a, S19i, S19 Hyd, S19pro Hyd, S19pro+ Hyd, T19 Hyd

      Официальный сайт | Manual | Прошивка (официальный сайт) | Прошивка (bits.media)   В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда,  F.A.Q по майнингу. Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы. Сообщения, не относящиеся к теме обсуждения (оффтоп), удаляются без предупреждения.   Технические характеристики:   Статьи на Bits.me

      в ASIC/FPGA майнеры

×
×
  • Создать...