Jump to content

nVidia GTX1070 Katana single-slot


iRybin

Recommended Posts

Posted (edited)

Коллеги, хочу поделиться печальной новостью - которая, возможно, поможет спасти ваши аналогичные карты.

 

Летом того года была собрана монстроидальная система на 11 таких картах и серверной двухксеонной матери (те, кто тогда этой темой "больше 6-8 карт на мать" интересовался - могут помнить), с тех пор оно верой и правдой не отключаясь молотило, обдуваемое большим полупромышленным напольным вентилятором - и лето пережило, и зиму.

 

Тут на днях машина теряет все карты. Прихожу - карты все офф (у них отдельный от сервера блок питания). Тыр - не стартует. Методом перебора нахожу "труп" - следы прогара с нижней части платы... Убираю его, пашет на 10 картах.

 

Проходит наверное недели две - и вижу что карт уже 9... собственно второй труп, симптомы те же, но в этот раз коротыша видимо нет - пашет остальное дальше.

 

И вот тут на днях совершенно случайно замечаю на 1 карте 80 градусов! Это при том, что сейчас осень и они стоят на неотапливаемой веранде - на остальных не выше 50 градусов. Несусь туда и наблюдаю отказ кулера - он "делает вид", что крутится - тыр-пыр и встаёт. При этом в nvidia-smi карта упорно репортует выставленные 100% оборотов. Естественно раскалённая в том месте, где умерли две предшественницы. Отключаю - руками кулер крутится нормально. Дальше не проверял что именно с ним не так - но стала ясна кончина первых двух. Вот такая печаль.

 

Резюме - если ваши Катаны молотили год - морально готовьтесь и следите. Рад, что не стал собирать на них фермы в большом количестве...

 

IMG_5420.thumb.jpg.bc6bd937487ff354a2f8fc1b845b9e4f.jpgIMG_5421.thumb.jpg.6aac1a864e31706a27017f72f52c07b2.jpgIMG_5422.thumb.jpg.a5fe8e18db9e7b6f4eca3d25bb86c761.jpg

 

Да - карты стояли на 120 ватт (а летом и вовсе на 100) - но кулеры с первого дня на 100%. Есть серьёзное подозрение, что тупо отработали ресурс и теперь по одной помирают в зависимости от процентов погрешности качества изготовления. Консоль на него теперь постоянно открыта.

Edited by iRybin
Posted (edited)

1 ошибку ты допустил и 1 улучшение страховочное
1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

улучшение - программа спидфан, которая позволяет регулировать обороты внешним обдувом в зависимости от температуры другого датчика (видеокарты в данном случае)
У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

Edited by KlopS5
Posted

@iRybin ничего криминального не вижу. Кондеры говно и стали "бумкать" от срока. Судя по картинкам, даже есть шансы на восстановить.

Но стОит запомнить стишок - "ГэТэиКс катана слот - умирают через год"! :crazy:

Posted

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

Posted (edited)
10 часов назад, KlopS5 сказал:

1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

 

было там всё - и стояло на 70+ - после чего и майнер сбавлял интенсивность, и сами они тротлить начинали... умер не чип - а обвес... И тротлинг чипа как показала практика не очень помог обвесу... И там Linux - хотя дописать скрипт на программный даунклок наверное да - теперь стоит.

 

10 часов назад, KlopS5 сказал:

У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

в теории оно должно было пойти в закрытый серверный кейс с могучим продувом... но руки не дошли по ряду причин...

 

5 часов назад, noname21051989 сказал:

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

 

не - у меня без всяких бекплейтов... есть подозрение, что вот это самое программное управление майнером - когда он отключал карту от перегрева - их в итоге и добивает... было бы лето - тупо ушли в висняк по железной защите и больше майнером не включались, а тут, по ходу дела, внешнего охлада и временного отключения хватало чипу, чтобы остыть - но не хватало всему остальному (прогары на плате уже ПОСЛЕ чипа - то есть этой бедной части доставался весь жар ещё и с чипа).

 

А можно фотку этой второй ревизии? - ни разу не видел если честно

 

Edited by iRybin
Posted
10 часов назад, Lexis77 сказал:

Судя по картинкам, даже есть шансы на восстановить.

 

если есть интерес - могу отправить двух этих трупов... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Posted (edited)
7 часов назад, iRybin сказал:

... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Никуда они тебя не пошлют, могут попытаться, в итоге - примут,могут отправить производителю на экспертизу ( или в АСЦ). Пободаться стоит. Недавно, вон возвращал филип уан-блейд-про (оказалось - дерьмо устройство по многим параметрам). Тоже выделывались,  тянули время, даже акт с местного сц предоставили, мол работает (предмет личной гигиены же). Потребовал проведения повторной экспертизы в своем присутствии (!) ... деньги вернули через несколько дней.

А на эксперименты - всегда отдать успеешь.

Edited by YoshCat
Posted (edited)

Разбирать ферму небуду, но вот такие они!

Ну и справедливости ради, обратите внимание что бэкплэйт контачит с местами ваших порогаров!

z0000123568-6.jpg

Edited by noname21051989
Posted

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

@YoshCat @Lexis77 @Chingizzz было бы ещё на это время... с одной подтопленной матерью (от той самой бакогрейки) я полгода до Регарда ехал - так она, зараза, отлежалась за это время и там у них завелась ))))

Posted
2 минуты назад, iRybin сказал:

было бы ещё на это время...

Ну тада шли. Будет скучно - поковыряю. Если важны сроки - не шли.

Posted
2 часа назад, iRybin сказал:

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

 

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

Posted
31.10.2018 в 02:39, noname21051989 сказал:

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

Posted
17 часов назад, iRybin сказал:

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

 

Ну мечтать то не вредно?

  • 2 weeks later...
Posted

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

Posted
4 часа назад, iRybin сказал:

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

 

Я непомйму, вот ну карта сдохла, сдохла по причине перегрева, причем страшенного! Ну а вы что хотели? Я уверен что и производитель, и сервис вас пошлют, ну это логично, бытовые нагрузки немогут такое натворить, карта, бп - хоть чтото данный момент предостережет, если и есть данная болячка у катан, то это собственно не майнинговые решения), хотя сугубо мне нравится данная связка, ибо я собирал 12шт в одну систему и в сибири зимой это дело занимало пол метра на балконе))

Posted

@noname21051989 то, что у меня с 10-к карт AMD 7900-ой серии - и что они тока не переживали - и живы до сих пор. Это откровенный косяк и брак при производстве (установка бэкплейта на второй ревизии тому доказательство)!

 

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

Posted
18 часов назад, iRybin сказал:

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

после 100 градусов на старых картах срабатывало, на гефорсах хз

 

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

Posted (edited)
2 часа назад, noname21051989 сказал:

Нууу, защита это конечно вопрос, я бы сказал вопрос конкретно к твоей системе может быть? 

Разницу между аппаратной защитой и программной (настройками ПО) не улавливаем?

Edited by YoshCat
Posted
4 часа назад, Meisner сказал:

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

 

типатого... хорошо, что так и не стал масштабировать это решение.

 

Теперь смотрю в сторону Manli "промышленных" с могучим продольным продувом... хотя глядя на курсы всё больше и больше сомневаюсь в актуальности

  • 4 weeks later...
Posted (edited)

У меня одной здохла вертушка, незнаю когда правда, щас захожу чере тимвьюер, оборотов 0, темпиратура 92 градуса, но работало? чем теперь эту вертушку заменить ваще незнаю, где ее взять?

 

Одним словом подтверждаю опасения, у меня на текущий момент вышло из строя 2 карты, вернее вышли из строя вертушки, карты живы живехкньки, работают как часы, все дело что у меня стоят серверные, на выдув, и видимо им хватило чтоб выжить, а если кому интересно проблема заключается в их охлаждении  в турбинке есть пружинка, видимо со временем, она ослабевает и перестает придавливать турбинку, в свою очередь тахометр перестает видить обороты, лечится довольно легко, прыжинка натягивается, и вуаля работает все как новое, главное заметить вовремя, и не убить какрты, поскольку подтверждаю, карты не уходят в защиту, а пашут до талого, с неработающим куллером, никаких защит от перегрева, и это непонятно!

Edited by noname21051989
  • 1 month later...
Posted (edited)

Самое интересное, что на одном из этих трупов кулер живой и уехал на карту, у которой сдохла турбинка (третья). Пока оставшиеся 9 «Катан» живы.

 

надо будет серийники глянуть - там 9 брались в Х-Коме, две - в Олди...

Edited by iRybin
  • 4 weeks later...
Posted

Карты использовались по назначению и поломка является недочётом производителя. Магазин может отказать, тогда надо обратиться на прямую в представительство и они всё разрулят.  

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
  • Recently Browsing   0 members

    • No registered users viewing this page.
  • Similar Topics

    • Верховный суд США отклонил апелляцию Nvidia о закрытии иска криптоинвесторов

      Верховный суд США отклонил апелляцию производителя чипов Nvidia о прекращении коллективного иска, поданного криптоинвесторами в 2018 году. Жалоба связана с майнингом — истцы утверждают, что компания вводила акционеров в заблуждение. Судья Соня Сотомайер (Sonia Sotomayer) пояснила, что ходатайство Nvidia вызывает множество вопросов. Как выразилась Сотомайер, «суд не выдает сертификат на исправление ошибок». Дела Верховного суда устанавливают правовой прецедент на государственном уровне, а гр

      in Новости криптовалют

    • Американские власти поддержали иск криптоинвесторов к компании Nvidia

      Министерство юстиции США и Комиссия по ценным бумагам и биржам США (SEC) поддержали возобновление группового иска против Nvidia о предполагаемом искажении информации о продажах графических процессоров (GPU) в отчетности компании. В экспертном заключении для Верховного суда заместитель министра юстиции Элизабет Прелогар (Elizabeth Prelogar) и главный юрисконсульт SEC Теодор Вайман (Theodore Weiman) заявили, что группа инвесторов предоставила достаточное количество аргументов, чтобы возобнови

      in Новости криптовалют

    • QCP Capital: Финансовый отчет Nvidia оказал негативное влияние на биткоин

      Аналитики трейдинговой компании QCP Capital заявили, что финансовый отчет корпорации Nvidia вызвал негативную реакцию среди инвесторов и оказал давление на фондовый и криптовалютный рынки. После публикации отчета Nvidia о квартальной прибыли, волатильность первой криптовалюты сначала увеличилась, но потом начала снижаться. В QCP Capital считают, что инвесторы ожидали более впечатляющих результатов от лидера по производству чипов для искусственного интеллекта (ИИ).   Аналитики предпол

      in Новости криптовалют

    • NVIDIA GeForce RTX 30**

      Видеокарты семейства NVIDIA GeForce RTX 30** основаны на архитектуре RTX второго поколения - Ampere. В рознице RTX 3090 и RTX 3080 должны появиться с сентября 2020, а RTX 3070 с октября 2020.   Характеристики     Ядер CUDA Частота ядра Объем памяти Тип памяти Полоса пропускания  Разъемы питания Энергопотребление

      in Видеокарты

    • NVIDIA GeForce RTX 40**

      Карты NVIDIA GeForce RTX 40** должны выйти до конца 2022 года, предположительно это произойдет в сентябре. Сначала NVIDIA выпустит RTX 4090, через месяц - RTX 4080, еще через месяц - RTX 4070. Название новой архитектуры -Ada Lovelace, производиться чипы будут на фабриках TSMC по 5-нм техпроцессу.   Площадь старшего процессора должна получиться около 600 мм2 с производительностью в FP32 около 81 TFLOPS (на частоте 2200 МГц). Потребление (и тепловыделение) при этом составят колоссал

      in Видеокарты

×
×
  • Create New...