Перейти к публикации
danilacryptomaster

Перестала майнить ферма 1080 Ti

Рекомендованные сообщения

Всем доброго времени суток! Ровно год назад собрал вот такую ферму:

ЦП: Intel Celeron G3930 2.9 GHz 2Mb DDR3L/DDR4-1600/2133 HD610 TDP-51w LGA1151 OEM [CM8067703015717]

МП: Asus LGA1151 PRIME Z270-P

ОЗУKingston ValueRAM [KVR21N15S8/4] 4 Gb 2133 MHz (2 штуки); в данный момент одна планка поменяна на Kingston ValueRAM [KVR24N17S6/4] 4 Gb 2400 MHz

ПЗУ: SATA-3 500 Gb Toshiba P300 7200 rPm [HDWD105UZSVA] Cashe 64 Mb

БП: LC-Power LC8850III V2.3 850 W (3 штуки)

ГП: GeForce GTX 1080 Ti Aorus 11Gb (6 штук)

И весь годик она работала себе есть не просила, почти без сбоев, кое-что иногда все таки отлаживать приходилось, но это по мелочи можно сказать. А вот месяц назад начали происходить поистине чудеса... Чудеса в прямом смысле даже для меня, хотя в компьютерах с детства копаюсь. Например: подходишь к своему компьютеру, запускаешь тимвивер чтобы проверить ферму, а в ответ сообщение - "на компьютере партнера не запущен TeamViewer", хотя ферма стоит рядом, вентиляторы у карт работают и продолжают греть. Изображение на монитор тоже не получить, пишет "нет сигнала", когда втыкаешь HDMI в материнку. Помогала только перезагрузка. Тут же сигнал через этот выход шел. Однако, моя ферма стала часто вот так сбоить, да и порой просто сам майнинг начинал глючить по неизвестным причинам (в добыче появлялось огромное число, а коммандная строка майнера чертила бесконечно сообщение о сбое). Так же у меня была программа Aorus Graphics Engine которая делала разную подcветку карт в зависимости от температуры, позволяла выставить настройки вентиляторов на картах и настройки разгона. Настроек разгона я не ставил, весь год карты работали на заводских частотах процессора и памяти. Так вот даже настройки этой программы стали сбиваться при каждой перезагрузке. Ну я полез отлаживать... Сначала увидел что у меня вообще не хочет запускаться Nvidia панель управления, говорит мол дисплей не подключен. Я все дрова грамотно снес и поставил заново, оказались не они. Стоит заметить, что каждая перезагрузка и запуск компьютера уже давались с трудом, зачастую я просто не получали изображения и добивался его поменяв местами какие нибудь провода. А, иногда, замкнув контакты для включения, тут же появлялась какая-то ошибка инициализации (или что-то в этом роде, я бы показал, но нет фото) на черном экране первой строчкой и дальше никакой загрузки вообще не шло. В этом случае запускалось все только если выключить питание нескольким видеокартам (вот это явление вообще для меня никак не понятно).  Начали вылетать синие экраны от разных действий. По итогу дошел до того, что наверное проще будет снести винду. Стояла у меня весь год десятка и менять хотел тоже на нее. Но после того как сделал загрузочную флешку и запустил через биос процесс установки у меня тоже вылетел синий экран. Вот тут я вообще удивился, т. к. до этого не встречался с таким (чтоб bsod вылетал при попытке переустановки винды). После очень долгих мучений (сброс настроек биоса, отключение нескольких видеокарт и т. п.) пробуя по разному установить новую винду, удачей увенчалась одна из многих попыток. Помогло запустить процесс установки только удаление одной из планок оперативки. Установил чистую винду (тот же дистрибутив Win 10 что был до этого), поставил на нее все дрова и программы, перезагружаю итоговый раз и тут мне она заявляет о критической ошибке и нужно восстановление и запускаться она отказывается. После прогона восстановления она мне удалила все что я поставил... И у меня опять чистая винда. Начал ставить все по новой, начали опять выскакивать синие экраны (см. фото 1) Скачал другую десятку, она уже так не слетела, но помайнить я все рано не смог, т. к. через секунду запуска появлялась ошибка (см. фото 2, 3). Попытки вернуть планку оперативки назад убирала возможность получить вообще какое-либо изображение на мониторе. Поскольку было написано "out of memory", посчитал что нужно планку все таки заменить. Однако, после ее замены проблема поменялась на другую (смотри фото 4). Мало того, я не могу вообще сейчас уже на новой винде и с новой планкой открыть программу Aorus Graphics Engine (она появляется на секунду в трее и пропадает). Драйвера поставлены все корректно: диспетчер устройств видит все оборудование правильно и восклицательных знаков там нигде нет. Однако, драйвер на карты все равно так же не открывается. К тому же, выскакивают всякие странности типа (см. фото 5), которая тут же пропала при повторной перезагрузке или в окне майнинга после запуска появлялась вообще "unknow error" вместо той на фото 4 и они время от времени чередовались. После уже конкретных танцев с бубном которые я имел честь плясать до трех ночи сегодняшнего дня привели к такому результату: отключив на хрен одну карту, я получил все таки возможность запустить утилитку Aorus (как и почему это произошло - неизвестно). В ней я убавил показатели частот граф. процессоров и памяти на всех видеокартах еще ниже заводских, после чего майнинг стал работать. Ну по крайней мере, он работал 20 минут и ничего не случилось. Это хоть какой-то результат... Подключение карты обратно вызвало сбив настроек подсветки и скорости вентилятора что я поставил в утилите (которую при шести картах опять уже было не открыть), когда было 5 карт. Майнинг смог запустится и работал, но так как вентиляторы крутились на какой то по дэфу заданной скорости, карты начали сильно жарить. До задней панели стало не коснуться (раньше такого не было при работе) и я по быстрому прекратил эту богодельню. В общем я уже вообще не знаю на что думать и что исправлять, помогите пожалуйста товарищи форумчане! Другой надежды, кроме как на помощь онлайновых духов, у меня нет (сами знаете мастер-домушник мне не поможет). Совсем весь мозг ферма истрахала! Что сделать, чтобы все по прежнему нормально работало? Всем заранее спасибо, кто попытается помочь.

Фото 1.JPG

Фото 2.JPG

Фото 3.JPG

Фото 4.JPG

Фото 5.JPG

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Для начала стандартно - проконтролируй температуру и перемажь радиатор южного моста, переткни разъем САТА диска, планки памяти, питающие разъемы. Продуй БП.

Чтобы исключить ОС-софтово-драйвернуе проблемы, попробуй запустить на Hive-OS

Изменено пользователем Uliss

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Uliss  Вы мне предлагаете дальше с бубном плясать пробуя различные конфигурации, надеясь что одна из них сработает? Блоки питания и карты все почищены, даже сжатым воздухом были продуты. Я так уже все туда и туда тыкаю, даже если это все начнет двигаться, то это починка на уровне "не трожь, работает", что и куда я должен по вашему переткнуть? И еще, что значит перемазать радиатор южного моста (я примерно понимаю, что про материнку это, но что это значит не понимаю)?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Привет. Вынимай все карты, кроме одной. Если всё будет работать с одной - меняй блок питания.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
14 минут назад, danilacryptomaster сказал:

что и куда я должен по вашему переткнуть?

 

Переткнуть - это значит вынуть-вставить.

И так несколько раз - способствует улучшению контакта методом прошоркивания оксидных пленок на контактах.

 

14 минут назад, danilacryptomaster сказал:

что значит перемазать радиатор южного моста (я примерно понимаю, что про материнку это, но что это значит не понимаю)?

 

Это значит что нужно сжать 2 пластиковые клипсы и снять радиатор с чипа.

Потом тряпочкой аккуратно снять термопасту с чипа и радиатора, нанести (намазать) новую (хорошую) термопасту и установить радиатор на чип.

Я бы еще 60-70мм вент поставил на обдув радиатора.

 

14 минут назад, danilacryptomaster сказал:

Вы мне предлагаете дальше с бубном плясать пробуя

 

Так причин для таких неполадок масса, нужно поочередно отрубать хвосты исключать возможные и наблюдать за результатами.

 

10 минут назад, Delicious сказал:

Вынимай все карты, кроме одной. Если всё будет работать с одной - меняй блок питания.

 

Не показательно.

Достаточно снять/отключить одну карту, чтобы уменьшить нагрузку БП и при этом не сильно менять конфигурацию.

Изменено пользователем Uliss

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Карты у меня запитаны по 2 штуки на один БП. От одного из БП дополнительно питается мать со всем остальным. У меня в последних предложениях описано, что при отключении одной карты вроде как все адекватно работает... Кто тут виноват? Да и потом, из чего вы исходите, говоря перемазать мост? Как вы поняли что это поможет сейчас?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Первое что я бы посоветовал сделать.

0 проверить жёсткий диск после того как перекинете куда он был подключен то есть разем на матери сата и питания шнурок. прогнать утилитами на бед сектора и так далее.

также тут проверить схему подключения блоков питания и карт. не должно быть такого чтобы карта питалась разных блоков не через допо питание и не через райзер. то есть райзер и доп питания должно идти с 1 блока питания на карту (неважно сколько карт висит на блоки питания в итоге).

1 Отказаться от экстрактора :) и проги найсхеша. 

2 Я потомо поставить не меньше 24 гигов фаил подкачки.

после скачал нормальный майнер который вам нужен который будет копать вашу монету (даже на найсхеш неважно), но не программу от найсхеша.

3 поставить Автербернер 

уменьшить поверелимит до 80. вентиляторы поставить на 70%

и начинать запускать майнер и майнить следить за температурой и 

уже от туда разгонять если алгорим  на память то гнать память чип нетрогать воообще.

Если аглорим на чип разгоняете чип на +200  память нетроагете воообще.

И потом смотрите как ведут себя караты.

"запустить утилитку Aorus" ставить не надо 

вообще инсталить старайтес минимум всякого софта.

и желательно не не обязательно проверить все контакты питания матери и райзеров и замерить на них потом в работе под нагрузкой (майнинг) напряжения.

 

4 я бы поставил для эксперимента 7рку для проверки.

дело в том что и 7рка потянет 6 карт без проблем.

а вот как раз месяц два назад форум шумел от обновлений винды именно 10тки которые ломают майнинг от слова совсем.

и если вы не проконтролировали обновление (дали ему случиться ) тов се амба и по 5 карт и слетает майнинг и маниться меньше и греют карты короче все чудеса.

Почитайте форум.

И тут же были рекомендации что сделать с виндовс 10 чтобы она не обновлялась автоматом.

 

 

 

 

Изменено пользователем Desconect

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
6 часов назад, danilacryptomaster сказал:

Да и потом, из чего вы исходите, говоря перемазать мост? Как вы поняли что это поможет сейчас?

Когда чипсет идёт в разнос - и синий экран может выдавать и много чего ещё. Не факт что поможет, но перепробовать надо всё.

 

6 часов назад, danilacryptomaster сказал:

У меня в последних предложениях описано, что при отключении одной карты вроде как все адекватно работает...

Одной конкретной видеокарты или одной из?

Изменено пользователем HolodGLD

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@danilacryptomaster  ошибка на синем экране ясно дает вам понять , что проблема с дровами, значит вы не защищали систему от обновлений и оно случилось

 

теперь вы знаете в чем причина и найти способы ее устранения будет легко на этом форуме

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
43 минуты назад, rig4you сказал:

ошибка на синем экране ясно дает вам понять , что проблема с дровами, значит вы не защищали систему от обновлений и оно случилось

Почему именно с дровами?

У меня когда мать крякнулась, тоже первое время синий экран выдавало. Пока чипсет не догорел.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
7 часов назад, danilacryptomaster сказал:

Да и потом, из чего вы исходите, говоря перемазать мост?

 

И не я один...

 

5 часов назад, Desconect сказал:

Первое что я бы посоветовал сделать.

-- проверить жёсткий диск после того как перекинете куда он был подключен то есть разем на матери сата и питания шнурок. прогнать утилитами на бед сектора и так далее.

 

Только я начал с подключения и обеспечения, проверка диска была бы следующей операцией.

(поскольку это муторно и долго)

 

7 часов назад, danilacryptomaster сказал:

Как вы поняли что это поможет сейчас? 

 

Проблемы с загрузкой + синий экран, как бы, вполне определенно на это намекают

 

1 час назад, rig4you сказал:

ошибка на синем экране ясно дает вам понять , что проблема с дровами

 

Или с железом, которое под этими дровами работают

Изменено пользователем Uliss

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@Uliss Что за бредовые советы??

Во первых на интеле уже нет северного и южного моста в классическом понимании, функции серверного ушли в цп и часть функций южного. 

Фактически южного моста на интел нет уже много лет, то что осталось с схожим функционалом, не требует охлаждения.PCH это не южный мост, последний южный мост был ich10 и ich10r и это был 2009 год, прошло 8 лет карл! Люди советуют перемазать пасту и охлаждать то, чего нет!

а PCH интел охлада не требует, и тем более активной вентиляции, это не АМД хренотень, где действительно есть южный мост, который не только греется, но и перегреваться может.

? мат часть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

@HolodGLD  какую тогда у вас ошибку на синем экране показывало? 

@Uliss  80/20

Изменено пользователем rig4you

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
11 часов назад, Uliss сказал:

попробуй запустить на Hive-OS

 

дельный совет.

автор не игнорируйте его. это самый простой и быстрый способ понять в чем проблема - в софте или железе.

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×