Jump to content

nVidia GTX1070 Katana single-slot


iRybin

Recommended Posts

Posted (edited)

Коллеги, хочу поделиться печальной новостью - которая, возможно, поможет спасти ваши аналогичные карты.

 

Летом того года была собрана монстроидальная система на 11 таких картах и серверной двухксеонной матери (те, кто тогда этой темой "больше 6-8 карт на мать" интересовался - могут помнить), с тех пор оно верой и правдой не отключаясь молотило, обдуваемое большим полупромышленным напольным вентилятором - и лето пережило, и зиму.

 

Тут на днях машина теряет все карты. Прихожу - карты все офф (у них отдельный от сервера блок питания). Тыр - не стартует. Методом перебора нахожу "труп" - следы прогара с нижней части платы... Убираю его, пашет на 10 картах.

 

Проходит наверное недели две - и вижу что карт уже 9... собственно второй труп, симптомы те же, но в этот раз коротыша видимо нет - пашет остальное дальше.

 

И вот тут на днях совершенно случайно замечаю на 1 карте 80 градусов! Это при том, что сейчас осень и они стоят на неотапливаемой веранде - на остальных не выше 50 градусов. Несусь туда и наблюдаю отказ кулера - он "делает вид", что крутится - тыр-пыр и встаёт. При этом в nvidia-smi карта упорно репортует выставленные 100% оборотов. Естественно раскалённая в том месте, где умерли две предшественницы. Отключаю - руками кулер крутится нормально. Дальше не проверял что именно с ним не так - но стала ясна кончина первых двух. Вот такая печаль.

 

Резюме - если ваши Катаны молотили год - морально готовьтесь и следите. Рад, что не стал собирать на них фермы в большом количестве...

 

IMG_5420.thumb.jpg.bc6bd937487ff354a2f8fc1b845b9e4f.jpgIMG_5421.thumb.jpg.6aac1a864e31706a27017f72f52c07b2.jpgIMG_5422.thumb.jpg.a5fe8e18db9e7b6f4eca3d25bb86c761.jpg

 

Да - карты стояли на 120 ватт (а летом и вовсе на 100) - но кулеры с первого дня на 100%. Есть серьёзное подозрение, что тупо отработали ресурс и теперь по одной помирают в зависимости от процентов погрешности качества изготовления. Консоль на него теперь постоянно открыта.

Edited by iRybin
Posted (edited)

1 ошибку ты допустил и 1 улучшение страховочное
1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

улучшение - программа спидфан, которая позволяет регулировать обороты внешним обдувом в зависимости от температуры другого датчика (видеокарты в данном случае)
У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

Edited by KlopS5
Posted

@iRybin ничего криминального не вижу. Кондеры говно и стали "бумкать" от срока. Судя по картинкам, даже есть шансы на восстановить.

Но стОит запомнить стишок - "ГэТэиКс катана слот - умирают через год"! :crazy:

Posted

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

Posted (edited)
10 часов назад, KlopS5 сказал:

1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

 

было там всё - и стояло на 70+ - после чего и майнер сбавлял интенсивность, и сами они тротлить начинали... умер не чип - а обвес... И тротлинг чипа как показала практика не очень помог обвесу... И там Linux - хотя дописать скрипт на программный даунклок наверное да - теперь стоит.

 

10 часов назад, KlopS5 сказал:

У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

в теории оно должно было пойти в закрытый серверный кейс с могучим продувом... но руки не дошли по ряду причин...

 

5 часов назад, noname21051989 сказал:

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

 

не - у меня без всяких бекплейтов... есть подозрение, что вот это самое программное управление майнером - когда он отключал карту от перегрева - их в итоге и добивает... было бы лето - тупо ушли в висняк по железной защите и больше майнером не включались, а тут, по ходу дела, внешнего охлада и временного отключения хватало чипу, чтобы остыть - но не хватало всему остальному (прогары на плате уже ПОСЛЕ чипа - то есть этой бедной части доставался весь жар ещё и с чипа).

 

А можно фотку этой второй ревизии? - ни разу не видел если честно

 

Edited by iRybin
Posted
10 часов назад, Lexis77 сказал:

Судя по картинкам, даже есть шансы на восстановить.

 

если есть интерес - могу отправить двух этих трупов... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Posted (edited)
7 часов назад, iRybin сказал:

... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Никуда они тебя не пошлют, могут попытаться, в итоге - примут,могут отправить производителю на экспертизу ( или в АСЦ). Пободаться стоит. Недавно, вон возвращал филип уан-блейд-про (оказалось - дерьмо устройство по многим параметрам). Тоже выделывались,  тянули время, даже акт с местного сц предоставили, мол работает (предмет личной гигиены же). Потребовал проведения повторной экспертизы в своем присутствии (!) ... деньги вернули через несколько дней.

А на эксперименты - всегда отдать успеешь.

Edited by YoshCat
Posted (edited)

Разбирать ферму небуду, но вот такие они!

Ну и справедливости ради, обратите внимание что бэкплэйт контачит с местами ваших порогаров!

z0000123568-6.jpg

Edited by noname21051989
Posted

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

@YoshCat @Lexis77 @Chingizzz было бы ещё на это время... с одной подтопленной матерью (от той самой бакогрейки) я полгода до Регарда ехал - так она, зараза, отлежалась за это время и там у них завелась ))))

Posted
2 минуты назад, iRybin сказал:

было бы ещё на это время...

Ну тада шли. Будет скучно - поковыряю. Если важны сроки - не шли.

Posted
2 часа назад, iRybin сказал:

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

 

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

Posted
31.10.2018 в 02:39, noname21051989 сказал:

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

Posted
17 часов назад, iRybin сказал:

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

 

Ну мечтать то не вредно?

  • 2 weeks later...
Posted

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

Posted
4 часа назад, iRybin сказал:

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

 

Я непомйму, вот ну карта сдохла, сдохла по причине перегрева, причем страшенного! Ну а вы что хотели? Я уверен что и производитель, и сервис вас пошлют, ну это логично, бытовые нагрузки немогут такое натворить, карта, бп - хоть чтото данный момент предостережет, если и есть данная болячка у катан, то это собственно не майнинговые решения), хотя сугубо мне нравится данная связка, ибо я собирал 12шт в одну систему и в сибири зимой это дело занимало пол метра на балконе))

Posted

@noname21051989 то, что у меня с 10-к карт AMD 7900-ой серии - и что они тока не переживали - и живы до сих пор. Это откровенный косяк и брак при производстве (установка бэкплейта на второй ревизии тому доказательство)!

 

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

Posted
18 часов назад, iRybin сказал:

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

после 100 градусов на старых картах срабатывало, на гефорсах хз

 

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

Posted (edited)
2 часа назад, noname21051989 сказал:

Нууу, защита это конечно вопрос, я бы сказал вопрос конкретно к твоей системе может быть? 

Разницу между аппаратной защитой и программной (настройками ПО) не улавливаем?

Edited by YoshCat
Posted
4 часа назад, Meisner сказал:

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

 

типатого... хорошо, что так и не стал масштабировать это решение.

 

Теперь смотрю в сторону Manli "промышленных" с могучим продольным продувом... хотя глядя на курсы всё больше и больше сомневаюсь в актуальности

  • 4 weeks later...
Posted (edited)

У меня одной здохла вертушка, незнаю когда правда, щас захожу чере тимвьюер, оборотов 0, темпиратура 92 градуса, но работало? чем теперь эту вертушку заменить ваще незнаю, где ее взять?

 

Одним словом подтверждаю опасения, у меня на текущий момент вышло из строя 2 карты, вернее вышли из строя вертушки, карты живы живехкньки, работают как часы, все дело что у меня стоят серверные, на выдув, и видимо им хватило чтоб выжить, а если кому интересно проблема заключается в их охлаждении  в турбинке есть пружинка, видимо со временем, она ослабевает и перестает придавливать турбинку, в свою очередь тахометр перестает видить обороты, лечится довольно легко, прыжинка натягивается, и вуаля работает все как новое, главное заметить вовремя, и не убить какрты, поскольку подтверждаю, карты не уходят в защиту, а пашут до талого, с неработающим куллером, никаких защит от перегрева, и это непонятно!

Edited by noname21051989
  • 1 month later...
Posted (edited)

Самое интересное, что на одном из этих трупов кулер живой и уехал на карту, у которой сдохла турбинка (третья). Пока оставшиеся 9 «Катан» живы.

 

надо будет серийники глянуть - там 9 брались в Х-Коме, две - в Олди...

Edited by iRybin
  • 4 weeks later...
Posted

Карты использовались по назначению и поломка является недочётом производителя. Магазин может отказать, тогда надо обратиться на прямую в представительство и они всё разрулят.  

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    • No registered users viewing this page.
  • Similar Topics

    • Katana Network (KAT)

      Официальный сайт | Web app | X/Twitter| Reddit | Telegram | Discord | Blog| Coinmarketcap | Explorer| Docs | Github| Testnet     В теме действуют все Правила форума! Перед тем как задать вопрос, посмотрите НОВИЧКИ Bits.Media, все сюда,  Что такое "Форки Bitcoin" . Уважайте своё и чужое время. Для обсуждения и поиска программ/драйверов пользуйтесь разделом Файлы. Сообщения, не относящиеся к теме обсуждения (оффтоп), удаляются без

      in PoS криптовалюты

    • Влияние Nvidia и расширение рынка: катализаторы роста Bittensor

      Искусственный интеллект остается одним из ключевых нарративов в криптоиндустрии в 2026 году, а связанные с ним активы демонстрируют опережающую динамику. В частности, токен Bittensor (TAO) с начала марта показал рост выше среднего по рынку. 7 марта в Пекине прошло четырехчасовое собрание сообщества Bittensor. Во встрече участвовали разработчики, исследователи и пользователи сети. Основной темой стало развитие децентрализованного искусственного интеллекта в экосистеме Bittensor. Мероприятие

      in Новости криптовалют

    • app.katana.network - аирдроп Katana (KAT)

      Katana — L2-блокчейн, для DeFi-приложений, разрабатывается Polygon Labs с GSR. Основная сеть уже запущена и аирдроп рассчитан для тех, кто будет переводить в неё для активности реальные активы. Оплата комиссий в сети будет в эфире, поэтому его нужно будет гонять через мост. Токен управления, который будут раздавать - KAT. Эмиссия 10B KAT, без возможности выпускать новые. Цена сегодня 0,01547 $, с момента запуска основной сети уже капитализация 34,97M $   Контракт ка

      in Раздачи монет

    • Скрытое чипирование: как успехи Nvidia сказываются на криптоиндустрии

      Графические процессоры и искусственный интеллект поддерживают доминирующее положение компании Nvidia на рынке. Ее последний финансовый отчет превзошел самые оптимистичные прогнозы. А главное, Nvidia влияет на криптоиндустрию. Хотя понятие криптовалютной компании достаточно условное и размытое, в общем смысле под ней понимается организация, которая непосредственно вовлечена в индустрию цифровых активов. К этой категории можно отнести майнеров (Riot Platforfs, TerraWulf), крупных криптоинвест

      in Новости криптовалют

    • Мошенники опубликовали от имени Nvidia видео о раздаче биткоинов

      В сети появилось поддельное видео, в котором человек, похожий на гендиректора крупнейшей компании-производителя микрочипов Nvidia Дженсен Хуан (Jensen Huang) обещает зрителям бесплатный обмен токенов на биткоины. Злоумышленники с помощью искусственного интеллекта (ИИ) создали фальшивую трансляцию конференции Nvidia, и опубликовали ее на не имеющем отношение к компании ютуб-канале NVIDIA LIVE. Трансляция появилась вскоре после начала настоящего мероприятия Nvidia. Во время подлинной конферен

      in Новости криптовалют

×
×
  • Create New...