Перейти к содержанию

nVidia GTX1070 Katana single-slot


iRybin

Рекомендуемые сообщения

Коллеги, хочу поделиться печальной новостью - которая, возможно, поможет спасти ваши аналогичные карты.

 

Летом того года была собрана монстроидальная система на 11 таких картах и серверной двухксеонной матери (те, кто тогда этой темой "больше 6-8 карт на мать" интересовался - могут помнить), с тех пор оно верой и правдой не отключаясь молотило, обдуваемое большим полупромышленным напольным вентилятором - и лето пережило, и зиму.

 

Тут на днях машина теряет все карты. Прихожу - карты все офф (у них отдельный от сервера блок питания). Тыр - не стартует. Методом перебора нахожу "труп" - следы прогара с нижней части платы... Убираю его, пашет на 10 картах.

 

Проходит наверное недели две - и вижу что карт уже 9... собственно второй труп, симптомы те же, но в этот раз коротыша видимо нет - пашет остальное дальше.

 

И вот тут на днях совершенно случайно замечаю на 1 карте 80 градусов! Это при том, что сейчас осень и они стоят на неотапливаемой веранде - на остальных не выше 50 градусов. Несусь туда и наблюдаю отказ кулера - он "делает вид", что крутится - тыр-пыр и встаёт. При этом в nvidia-smi карта упорно репортует выставленные 100% оборотов. Естественно раскалённая в том месте, где умерли две предшественницы. Отключаю - руками кулер крутится нормально. Дальше не проверял что именно с ним не так - но стала ясна кончина первых двух. Вот такая печаль.

 

Резюме - если ваши Катаны молотили год - морально готовьтесь и следите. Рад, что не стал собирать на них фермы в большом количестве...

 

IMG_5420.thumb.jpg.bc6bd937487ff354a2f8fc1b845b9e4f.jpgIMG_5421.thumb.jpg.6aac1a864e31706a27017f72f52c07b2.jpgIMG_5422.thumb.jpg.a5fe8e18db9e7b6f4eca3d25bb86c761.jpg

 

Да - карты стояли на 120 ватт (а летом и вовсе на 100) - но кулеры с первого дня на 100%. Есть серьёзное подозрение, что тупо отработали ресурс и теперь по одной помирают в зависимости от процентов погрешности качества изготовления. Консоль на него теперь постоянно открыта.

Изменено пользователем iRybin
Ссылка на комментарий
Поделиться на другие сайты

1 ошибку ты допустил и 1 улучшение страховочное
1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

улучшение - программа спидфан, которая позволяет регулировать обороты внешним обдувом в зависимости от температуры другого датчика (видеокарты в данном случае)
У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

Изменено пользователем KlopS5
Ссылка на комментарий
Поделиться на другие сайты

@iRybin ничего криминального не вижу. Кондеры говно и стали "бумкать" от срока. Судя по картинкам, даже есть шансы на восстановить.

Но стОит запомнить стишок - "ГэТэиКс катана слот - умирают через год"! :crazy:

Ссылка на комментарий
Поделиться на другие сайты

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

Ссылка на комментарий
Поделиться на другие сайты

10 часов назад, KlopS5 сказал:

1-е  ты не настроил temp limit, чтоб карта начинала сбрасывать частоту по достижению определенной температуры - есть как в мси афтебернер так и нвидиа инспектор (то что карта показывала 100% оборотов не удивительно, на 1-м вентиляторе тахометр?)

 

было там всё - и стояло на 70+ - после чего и майнер сбавлял интенсивность, и сами они тротлить начинали... умер не чип - а обвес... И тротлинг чипа как показала практика не очень помог обвесу... И там Linux - хотя дописать скрипт на программный даунклок наверное да - теперь стоит.

 

10 часов назад, KlopS5 сказал:

У меня настроено так  на зеленные - 70 градусов темп лимит - выше не будет даже если все вентиля станут - она тупо сбросит частоту, обдув -серверные вентиляторы в обычном режиме 20-65 гр работают на 20%, с 65гр по кривой до сотки. Бонусом - автоуправление обдувом в зависимости от окружающей температуры (лето/зима/день/ночь) 

 

в теории оно должно было пойти в закрытый серверный кейс с могучим продувом... но руки не дошли по ряду причин...

 

5 часов назад, noname21051989 сказал:

У меня с десяток таких карт, работают уже больше года, если быть точным с 08.17, но у меня вторая ревизия  которые бэкплэйтом прикрыты, да и странно почему карты даже при отказе куллера, не сбрасывались, и в защиту не ушли?

 

не - у меня без всяких бекплейтов... есть подозрение, что вот это самое программное управление майнером - когда он отключал карту от перегрева - их в итоге и добивает... было бы лето - тупо ушли в висняк по железной защите и больше майнером не включались, а тут, по ходу дела, внешнего охлада и временного отключения хватало чипу, чтобы остыть - но не хватало всему остальному (прогары на плате уже ПОСЛЕ чипа - то есть этой бедной части доставался весь жар ещё и с чипа).

 

А можно фотку этой второй ревизии? - ни разу не видел если честно

 

Изменено пользователем iRybin
Ссылка на комментарий
Поделиться на другие сайты

10 часов назад, Lexis77 сказал:

Судя по картинкам, даже есть шансы на восстановить.

 

если есть интерес - могу отправить двух этих трупов... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Ссылка на комментарий
Поделиться на другие сайты

7 часов назад, iRybin сказал:

... можно, конечно, взять все 3 и пойти в магазин - типа кулер того и вот они сдохли - но, боюсь, пошлют нахрен со словами "да задолбали такиерастакие майнеры"...

Никуда они тебя не пошлют, могут попытаться, в итоге - примут,могут отправить производителю на экспертизу ( или в АСЦ). Пободаться стоит. Недавно, вон возвращал филип уан-блейд-про (оказалось - дерьмо устройство по многим параметрам). Тоже выделывались,  тянули время, даже акт с местного сц предоставили, мол работает (предмет личной гигиены же). Потребовал проведения повторной экспертизы в своем присутствии (!) ... деньги вернули через несколько дней.

А на эксперименты - всегда отдать успеешь.

Изменено пользователем YoshCat
Ссылка на комментарий
Поделиться на другие сайты

@iRybin попробовать можно, но может сначала стоит потрахать мозги магазину?

Ссылка на комментарий
Поделиться на другие сайты

Однозначно надо сходить в магаз. С одной штукой естессно для начала 

Ссылка на комментарий
Поделиться на другие сайты

Разбирать ферму небуду, но вот такие они!

Ну и справедливости ради, обратите внимание что бэкплэйт контачит с местами ваших порогаров!

z0000123568-6.jpg

Изменено пользователем noname21051989
Ссылка на комментарий
Поделиться на другие сайты

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

@YoshCat @Lexis77 @Chingizzz было бы ещё на это время... с одной подтопленной матерью (от той самой бакогрейки) я полгода до Регарда ехал - так она, зараза, отлежалась за это время и там у них завелась ))))

Ссылка на комментарий
Поделиться на другие сайты

2 минуты назад, iRybin сказал:

было бы ещё на это время...

Ну тада шли. Будет скучно - поковыряю. Если важны сроки - не шли.

Ссылка на комментарий
Поделиться на другие сайты

2 часа назад, iRybin сказал:

@noname21051989 спасибо! Видимо ребята таки сделали работу над ошибками.

 

 

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

Ссылка на комментарий
Поделиться на другие сайты

31.10.2018 в 02:39, noname21051989 сказал:

Я все мечатю эти карты в благое дело пустить, и заказать на них водоблоки, и на теплый пол поставить)))

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

Ссылка на комментарий
Поделиться на другие сайты

17 часов назад, iRybin сказал:

 

по моему опыту - хреновая идея - не тянет бытовуха такие температуры... две 1080 валяются как раз с отопительной (ГВС) водянки - текут они на 60-70 градусах теплоносителя.... тут нужен кондовый фуллметалл без всякого акрилового говна

 

Ну мечтать то не вредно?

Ссылка на комментарий
Поделиться на другие сайты

  • 2 недели спустя...

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

Ссылка на комментарий
Поделиться на другие сайты

4 часа назад, iRybin сказал:

погулял по сети - проблема у Katana массовая - ещё на одном форуме точно такие же повреждения, там народ ходил до сервисов - сервисы требуют переписку-согласие от производителя на ремонт-замену...

 

Я непомйму, вот ну карта сдохла, сдохла по причине перегрева, причем страшенного! Ну а вы что хотели? Я уверен что и производитель, и сервис вас пошлют, ну это логично, бытовые нагрузки немогут такое натворить, карта, бп - хоть чтото данный момент предостережет, если и есть данная болячка у катан, то это собственно не майнинговые решения), хотя сугубо мне нравится данная связка, ибо я собирал 12шт в одну систему и в сибири зимой это дело занимало пол метра на балконе))

Ссылка на комментарий
Поделиться на другие сайты

@noname21051989 то, что у меня с 10-к карт AMD 7900-ой серии - и что они тока не переживали - и живы до сих пор. Это откровенный косяк и брак при производстве (установка бэкплейта на второй ревизии тому доказательство)!

 

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

Ссылка на комментарий
Поделиться на другие сайты

Нууу, защита это конечно вопрос, я бы сказал вопрос конкретно к твоей системе может быть? 

Ссылка на комментарий
Поделиться на другие сайты

18 часов назад, iRybin сказал:

Немного не в тему - но ещё имею "огрызки" от Гигабайта (ITX Edition) - у них тоже спустя полтора года кулеры в утиль! - так вот это чудо нагрелось до 93 градусов! Внимание, вопрос - где аппаратная защита???

после 100 градусов на старых картах срабатывало, на гефорсах хз

 

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

Ссылка на комментарий
Поделиться на другие сайты

2 часа назад, noname21051989 сказал:

Нууу, защита это конечно вопрос, я бы сказал вопрос конкретно к твоей системе может быть? 

Разницу между аппаратной защитой и программной (настройками ПО) не улавливаем?

Изменено пользователем YoshCat
Ссылка на комментарий
Поделиться на другие сайты

4 часа назад, Meisner сказал:

по сабжу просто корявый катях, ничего более. говно и палки во всей красе, так сказать

 

типатого... хорошо, что так и не стал масштабировать это решение.

 

Теперь смотрю в сторону Manli "промышленных" с могучим продольным продувом... хотя глядя на курсы всё больше и больше сомневаюсь в актуальности

Ссылка на комментарий
Поделиться на другие сайты

  • 4 недели спустя...

У меня одной здохла вертушка, незнаю когда правда, щас захожу чере тимвьюер, оборотов 0, темпиратура 92 градуса, но работало? чем теперь эту вертушку заменить ваще незнаю, где ее взять?

 

Одним словом подтверждаю опасения, у меня на текущий момент вышло из строя 2 карты, вернее вышли из строя вертушки, карты живы живехкньки, работают как часы, все дело что у меня стоят серверные, на выдув, и видимо им хватило чтоб выжить, а если кому интересно проблема заключается в их охлаждении  в турбинке есть пружинка, видимо со временем, она ослабевает и перестает придавливать турбинку, в свою очередь тахометр перестает видить обороты, лечится довольно легко, прыжинка натягивается, и вуаля работает все как новое, главное заметить вовремя, и не убить какрты, поскольку подтверждаю, карты не уходят в защиту, а пашут до талого, с неработающим куллером, никаких защит от перегрева, и это непонятно!

Изменено пользователем noname21051989
Ссылка на комментарий
Поделиться на другие сайты

  • 1 месяц спустя...

Самое интересное, что на одном из этих трупов кулер живой и уехал на карту, у которой сдохла турбинка (третья). Пока оставшиеся 9 «Катан» живы.

 

надо будет серийники глянуть - там 9 брались в Х-Коме, две - в Олди...

Изменено пользователем iRybin
Ссылка на комментарий
Поделиться на другие сайты

  • 4 недели спустя...

Карты использовались по назначению и поломка является недочётом производителя. Магазин может отказать, тогда надо обратиться на прямую в представительство и они всё разрулят.  

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Similar Topics

    • NVIDIA GeForce RTX 30**

      Видеокарты семейства NVIDIA GeForce RTX 30** основаны на архитектуре RTX второго поколения - Ampere. В рознице RTX 3090 и RTX 3080 должны появиться с сентября 2020, а RTX 3070 с октября 2020.   Характеристики     Ядер CUDA Частота ядра Объем памяти Тип памяти Полоса пропускания  Разъемы питания Энергопотребление

      в Видеокарты

    • NVIDIA GeForce RTX 40**

      Карты NVIDIA GeForce RTX 40** должны выйти до конца 2022 года, предположительно это произойдет в сентябре. Сначала NVIDIA выпустит RTX 4090, через месяц - RTX 4080, еще через месяц - RTX 4070. Название новой архитектуры -Ada Lovelace, производиться чипы будут на фабриках TSMC по 5-нм техпроцессу.   Площадь старшего процессора должна получиться около 600 мм2 с производительностью в FP32 около 81 TFLOPS (на частоте 2200 МГц). Потребление (и тепловыделение) при этом составят колоссал

      в Видеокарты

    • Технический директор Nvidia: «Криптовалюты бесполезны для общества»

      Технический директор американского производителя чипов Nvidia заявил, что криптовалюты «не приносят ничего полезного для общества». При этом компания продолжает продавать свои процессоры майнерам. Майкл Каган (Michael Kagan) считает, что, например, чат-бот с искусственным интеллектом ChatGPT, будет более полезным, чем добыча криптовалюты.   «Все эти криптографические штуки нуждались в параллельной обработке. Nvidia была лучшей, поэтому люди просто запрограммировали ее для использов

      в Новости криптовалют

    • Nvidia: Автомобильная промышленность начнет использовать метавселенные в 2023 году

      Американский производитель графических процессоров Nvidia опубликовал прогноз, в котором заявил, что в 2023 году многие автомобильные компании будут использовать метавселенные в своей работе. Nvidia представила два варианта, как это будет выглядеть. Согласно первому, компании будут использовать инструменты метавселенной, чтобы контролировать весь процесс производства автомобилей. Это позволит им проще и эффективнее улучшать машины. На заводах будут использоваться цифровые двойники автомобил

      в Новости криптовалют

    • Nvidia сняла ограничения хэшрейта для майнинга на своих видеокартах

      Производитель видеочипов Nvidia ограничил майнинг на своих видеокартах еще в начале 2021 года, однако теперь компания решила убрать ограничения из новых драйверов. Решение об ограничении хэшрейта на видеокартах было принято на фоне ажиотажного спроса на видеоускорители Nvidia – майнеры применяли их для добычи ETH. Пандемия COVID-19 привела к масштабной нехватке полупроводниковых кристаллов, поэтому видеокарты стали дефицитом, а цены на них значительно выросли. В попытке решить проблему комп

      в Новости криптовалют

×
×
  • Создать...