Перейти к содержанию

Настройка gtx 1060 под Linux


iBaaX

Рекомендуемые сообщения

Мои наблюдения.

1. Фан контрол - ф топку. К сожалению вешает карты. Вентили в ручную.

2. Watchdog nvOS имеет право на жизнь - прикрутил себе, сразу ребутит есл падает хоть одна карта. (К сожалению не силен в скриптах, поэтому пользуюсь готовыми с мин доработкой)

1. Согласен. Давно перешел на разовую установку вентилей скриптом при загрузке. До этого тоже много экспериментов провел с контролом и плюнул в итоге.

2. А можно в студию код выпиленного из nvOS ватчдога? Буду очень признателен!

Ссылка на комментарий
Поделиться на другие сайты

Watchdog лежит в откртом доступе на первой странице оф ветки на биттолке.

Я закоментировал перезапуск 1bash и убрал умножение на 6, чтобы перезапуск сразу стартовал. Могу позже выложить. Коряво, но работает)

Ссылка на комментарий
Поделиться на другие сайты

Watchdog лежит в откртом доступе на первой странице оф ветки на биттолке.

Я закоментировал перезапуск 1bash и убрал умножение на 6, чтобы перезапуск сразу стартовал. Могу позже выложить. Коряво, но работает)

Да, буду благодарен за этот кастрированный ватчдог с пояснениями. А то не все в нем понял.....

Ссылка на комментарий
Поделиться на другие сайты

Как доберусь до компьютера - выложу. Особо не кострировал, т.к. мне тоже много не понятно - он интегрирован с другими скриптами. Закоментил перезапуск скриптов, прописал ребут и все)

Если кто сможет подправить и лишнее убрать. Будет гуд.

Ссылка на комментарий
Поделиться на другие сайты

По фан-контролу мысли следующие:

1. без вачдога запускать нельзя. оставил тестовую на ночь, утром увидел 98 градусов (все живы).

2. вачдог есть у нвоса. он мне не нравится: с одной завешенной картой скрипт, тыкающийся даже в квери, будет висеть сам.

2.cont. все обращения к нвапи, все сеты и геты, надо оборачивать в какой-то try..except, создающий отдельный тред и имеющий таймаут.

3. 0% оборотов ставить нельзя, см п.1

4. каждый GPUTargetFanSpeed=нанана взрывает процессорное время ксорга. устанавливать надо, только если есть изменение. у всех так, кстати? гляньте в топ, пожалуйста.  

Текущее решение: старт с 80%, с 60 градусов 100%. У старших товарищей 100% и никаких гвоздей.

 

@_eugene_, ксорг есть, драйвер стартует. Какой-то мелочи не хватает, вроде

export DISPLAY=:0
xhost + 

из-под юзера. Нвидиа-сеттингс что говорит?

Почему бы не сделать все таки Watchdog через systemd мне кажется это намного надежнее, там есть функции по ребуту и выключению системы мне кажется такой вариант куда лучше чем отключение карты на рабочей системе, в любом случае можно логировать происходящие и уже по факту решать проблему.

Вопрос немного в другю сторону на одной карте просел хешрейт было 19.копеки стало 15.копейки. Майнер клеймор майню в дуале ETH+DCR, с железом ничего не делал, искания и постепенные вытыкания карт и перетекания в слоты все равно выводят на показатели 15.копейки даже если карта в системе одна, разгон не делал, монитор вытыкал. Думается мне два варианта либо сама карта либо пул !

Изменено пользователем Fabryan
Ссылка на комментарий
Поделиться на другие сайты

Выкладываю, у меня работает.

 

Т.к. код не мой - все авторские коменты остались

#!/bin/bash

# Miner restart script V002
# By Maxximus007 && IAmNotAJeep
# for nvOC by fullzero

export DISPLAY=:0

# Creating a log file to record restarts
LOG_FILE="/home/prospector/4_restartlog"
if [ -e "$LOG_FILE" ] ; then
  #Limit the logfile, just keep the last 2K
  LASTLOG=$(tail -n 2K $LOG_FILE)
  echo $LASTLOG
  echo ""
fi

#echo "$(date) - Starting miner restart script." | tee -a ${LOG_FILE}
#echo "" | tee -a ${LOG_FILE}
# Give oneBash time to start to prevent reboot
echo "$(date) - waiting 30 seconds before going 'on watch'" 
sleep 20

THRESHOLD=90
RESTART=0
GPU_COUNT=$(nvidia-smi --query-gpu=count --format=csv,noheader,nounits | tail -1)
COUNT=$GPU_COUNT

while true
do
sleep 10  # sleep 60
#IAmNotAJeep MOD from V002
  JEEP=0
#IAmNotAJeep MOD from V002
  GPU=0
  REBOOTRESET=$(($REBOOTRESET + 1))

#IAmNotAJeep MOD from V002
  echo ""
  echo "      GPU_COUNT: " $GPU_COUNT

#IAmNotAJeep MOD from V002

  UTILIZATIONS=$(nvidia-smi --query-gpu=utilization.gpu --format=csv,noheader,nounits)
  echo ""
  echo "GPU UTILIZATION: " $UTILIZATIONS
  echo ""




numtest='^[0-9]+$'
  
  for UTIL in $UTILIZATIONS
  do
    if ! [[ $UTIL =~ $numtest ]]
    then
 # Not numeric so: Help we've lost a GPU, so reboot
        echo "$(date) - Lost GPU so restarting system. Found GPU's:" | tee -a ${LOG_FILE}
        echo "" | tee -a ${LOG_FILE}
        #Hope PCI BUS info will help find the faulty GPU
        nvidia-smi --query-gpu=gpu_bus_id --format=csv | tee -a ${LOG_FILE}
        echo "reboot in 10 seconds"
        echo ""
        sleep 10
        sudo reboot
    fi

    # If utilization is lower than threshold count them:
    if [ $UTIL -lt $THRESHOLD ]
    then
      echo "$(date) - GPU under threshold found"
      echo ""
      COUNT=$(($COUNT - 1))
      #IAmNotAJeep MOD from V002
      JEEP=$(($JEEP + 1))
      #IAmNotAJeep MOD from V002
    fi
    GPU=$(($GPU + 1))
  done

#IAmNotAJeep MOD from V002
if [ $JEEP -gt 0 ]
 then

  if [ $COUNT -le 0 ]
then
    INTERNET_IS_GO=0
    if nc -vzw1 google.com 443;
    #if nc -vzw1 $POOL 80;
    then
    INTERNET_IS_GO=1
    fi
    echo ""
    if [[ $RESTART -gt 4 && $INTERNET_IS_GO == 1 ]]
    then
      echo "$(date) - Utilization is too low: reviving did not work so restarting system in 10 seconds" | tee -a ${LOG_FILE}
      echo "" | tee -a ${LOG_FILE}
      sleep 10
      sudo reboot
    fi
    echo "$(date) - Utilization is too low: REBOOT"
    # If miner runs in screen 'miner' kill the screen to be sure it's gone
    #pkill -e miner
    sudo reboot
    # Best to restart oneBash - settings might be adjusted already
    #target=$(ps -ef | awk '$NF~"1bash" {print $2}')
    #kill $target #| tee -a ${LOG_FILE}
    #echo "" #| tee -a ${LOG_FILE}
    RESTART=$(($RESTART + 1))
    REBOOTRESET=0
    COUNT=$GPU_COUNT
    # Give oneBash time to restart to prevent reboot
    sleep 10
  #fi
  else
  echo "$(date) - Low Utilization Detected: 1bash will reinit if there are 6 consecutive failures"
  echo ""
  echo "                  "$COUNT "Failures Before reinit" 

#IAmNotAJeep MOD from V002
  fi

else
#IAmNotAJeep MOD from V002
  COUNT=$GPU_COUNT
  echo "$(date) - REMEMBER TO THANK IAmNotAJeep and Maxximus007"
#IAmNotAJeep MOD from V002
fi

  # No need for a reboot after a while
  if [ $REBOOTRESET -gt 5 ]
  then
    RESTART=0
    REBOOTRESET=0
  fi
done

Скрипт в данном виде отслеживает загрузку карт и количество (просто и со вкусом), если загрузка падает - перезагружает комп. (дергать майнер, как по мне, бессмысленно, проще ребутнуть)

 

Просьба, если кто возьмется за приведение в порядок скрипта - сделать выгрузку в файл последнего состояния nvidia-smi, чтобы потом понимать какая карта упала.

 

Ссылка на комментарий
Поделиться на другие сайты

Просьба, если кто возьмется за приведение в порядок скрипта - сделать выгрузку в файл последнего состояния nvidia-smi, чтобы потом понимать какая карта упала.

Попробую на досуге доработать.....

Чтобы выгрузить состояние в файл, запиши туда просто вот эту переменную из скрипта:

 

UTILIZATIONS=$(nvidia-smi --query-gpu=utilization.gpu --format=csv,noheader,nounits)

 

Она выдает столбиком загрузку всех карт. Порядок карт такой же, как в 

 

nvidia-smi --query-gpu=gpu_bus_id --format=csv | tee -a ${LOG_FILE}

Ссылка на комментарий
Поделиться на другие сайты

Вот. Упростил и переписал скриптик под свои нужды. Еще и почту шлет (если mailutils установлены и postfix настроен):

#!/bin/bash
 
export DISPLAY=:0
 
THRESHOLD=80
numtest='^[0-9]+$'
GPU_COUNT=$(nvidia-smi --query-gpu=count --format=csv,noheader,nounits | tail -1)
 
# Creating a log file 
LOG_FILE="/tmp/watchdog.log"
if [ -e "$LOG_FILE" ] ; then
  #Limit the logfile, just keep the last 2K
  LASTLOG=$(tail -n 2K $LOG_FILE)
  echo $LASTLOG
  echo ""
fi
 
# Waiting miner....
sleep 120
 
while true
do
 
 
  CURRENT_GPU=0
  UTILIZATIONS=$(nvidia-smi --query-gpu=utilization.gpu --format=csv,noheader,nounits)
  for UTIL in $UTILIZATIONS
  do
    # Not numeric - lost a GPU
    if ! [[ $UTIL =~ $numtest ]]
    then
        echo "$(date) - Lost GPU:" $CURRENT_GPU | tee -a ${LOG_FILE}
        echo "Utilizations:" | tee -a ${LOG_FILE}
echo $UTILIZATIONS | tee -a ${LOG_FILE}
echo "" | tee -a ${LOG_FILE}
        echo "Watchdog - fault GPU!" `hostname` | mail -s "Watchdog - fault GPU `hostname`" info@example.com
sleep 10
        reboot
    fi
 
    # If utilization is lower than threshold count:
    if [ $UTIL -lt $THRESHOLD ]
    then
      echo "$(date) - GPU under threshold found:" $CURRENT_GPU | tee -a ${LOG_FILE}
      echo "Utilizations:" | tee -a ${LOG_FILE}
      echo $UTILIZATIONS | tee -a ${LOG_FILE}
      echo "" | tee -a ${LOG_FILE}
      echo "Watchdog - under threshold!" `hostname` | mail -s "Watchdog - under threshold `hostname`" info@example.com
      sleep 10
      reboot
    fi
    CURRENT_GPU=$(($CURRENT_GPU + 1))
  done
 
  sleep 20 
 
 
done
Ссылка на комментарий
Поделиться на другие сайты

ребят а что 1060 гонится под линуксом?

Приехали...... ))))

8 страниц обсуждений, как к этому разгону бантики прикрутить и плюшки, а тут такой вопрос.....   )))

Ссылка на комментарий
Поделиться на другие сайты

Приехали...... ))))

8 страниц обсуждений, как к этому разгону бантики прикрутить и плюшки, а тут такой вопрос.....   )))

да у меня вот эта гадость 

GeForce GTX 1060 1506Mhz PCI-E 3.0 6144Mb 8008Mhz 192 bit Mining Edition (GV-NP106D5-6G) nvidia-settings  не срабатывает smi только питание рулит
Ссылка на комментарий
Поделиться на другие сайты

 

да у меня вот эта гадость 

GeForce GTX 1060 1506Mhz PCI-E 3.0 6144Mb 8008Mhz 192 bit Mining Edition (GV-NP106D5-6G) nvidia-settings  не срабатывает smi только питание рулит

 

Скажу тебе по секрету - у меня риг на 11 таких картах ))))

Что у тебя не рулится? Разгон же, да?  ;) Что-то типа:

nvidia-settings -a [gpu:0]/GPUMemoryTransferRateOffset[3]=1000

Да?

Ссылка на комментарий
Поделиться на другие сайты

Скажу тебе по секрету - у меня риг на 11 таких картах ))))

Что у тебя не рулится? Разгон же, да?  ;) Что-то типа:

nvidia-settings -a [gpu:0]/GPUMemoryTransferRateOffset[3]=1000

Да?

да именно это не работает.

Ссылка на комментарий
Поделиться на другие сайты

да именно это не работает.

Вместо:

nvidia-settings -a [gpu:0]/GPUMemoryTransferRateOffset[3]=1000

 

сделай:

nvidia-settings -a [gpu:0]/GPUMemoryTransferRateOffset[2]=1000

 

Т.е., замени 3 на 2. Тут как с 1050 - всего два уровня в майнинговых картах. И будет тебе счастье

 

P.S. Это все с учетом того, что xorg.conf сделан верно

Изменено пользователем Torquemada
Ссылка на комментарий
Поделиться на другие сайты

 

Вот. Упростил и переписал скриптик под свои нужды. Еще и почту шлет (если mailutils установлены и postfix настроен):

 

Он процесс не отображает?

Ссылка на комментарий
Поделиться на другие сайты

 

 

Т.е., замени 3 на 2. Тут как с 1050 - всего два уровня в майнинговых картах. И будет тебе счастье   P.S. Это все с учетом того, что xorg.conf сделан верно
не подкинеш конфиг? кстати не отрабатывает вообще команду nvidia-settings вываливает ошибку и если пускать через иксы то выдает ошибку зараза. уже голову сломал с настройкой.  в токе идет на 21 мх. хотелось бы 24-25. и окно нвидиа сетингс пустое без вкладок разгона. черт зает может так и должно быть. драйвер поставил 384-59
Ссылка на комментарий
Поделиться на другие сайты

Уже разобрался - нет echo, чтобы смотреть за процессом работы.

+ не ребутал, добавил sudo перед ребут.

еще тестирую - посмотрим.

Ссылка на комментарий
Поделиться на другие сайты

Уже разобрался - нет echo, чтобы смотреть за процессом работы.

+ не ребутал, добавил sudo перед ребут.

еще тестирую - посмотрим.

А на фига смотреть за процессом работы вотчдога? ))) Для этого лог есть потом......

У меня ребутить без sudo. Но у меня десктопная система, не серверная

 

Был бы благодарен, если кто-то подсказал, как этот скрипт оформить через systemctl со всеми присущими этому плюшками

не подкинеш конфиг? кстати не отрабатывает вообще команду nvidia-settings вываливает ошибку и если пускать через иксы то выдает ошибку зараза. уже голову сломал с настройкой.  в токе идет на 21 мх. хотелось бы 24-25. и окно нвидиа сетингс пустое без вкладок разгона. черт зает может так и должно быть. драйвер поставил 384-59

Значит, xorg не настроен и coolbits не выставлен. Поэтому и не получается. Позже вышлю конф

Изменено пользователем Torquemada
Ссылка на комментарий
Поделиться на другие сайты

Как любитель линуха решил попробовать, но вопрос есть плюсы по сравнению с виндой?

Ссылка на комментарий
Поделиться на другие сайты

Поставь x11vnc настрой его, и рули через него. Моник по хорошему надо подключать к той карте которая стоит в первом полном слоте.

спасибо за совет про vnc. чего-то сам не додумался - привык к ssh :)

 

 

@_eugene_, ксорг есть, драйвер стартует. Какой-то мелочи не хватает, вроде

export DISPLAY=:0
xhost + 

из-под юзера. Нвидиа-сеттингс что говорит?

Все, спасиб, разобрался. но немного по-другому:

включил встроенную карту и повесил на нее 1 экран. чтобы все nvidia-settings заработало нужно правильно указать драйвер карты.

с экспортом дисплея не заморачивался. перенес запуск скриптов из init.d в конфиг lightdm. ибо нет lightdm -- не экрана и один фиг ничего работать не будет.

в итоге

в init.d -- запуск майнеров. в скрипте перед запуском майнеров прописываются более низкие tdp. ну и естественно стартует lightdm

lightd запускает скрипт, которые корректирует частоты и рулит вентиляторами.

второй день вижу риг когда поливаю цветы на балконе ну и разочек-другой в течении дня зайду по ssh посмотреть одним глазком на температуру :)

 

кстати, имел неосторожность купить несколько радеонов. я так понимаю, гнать их под линуксом практически без вариантов?

Ссылка на комментарий
Поделиться на другие сайты

Как любитель линуха решил попробовать, но вопрос есть плюсы по сравнению с виндой?

как любитель линукса и начинающий фермер приведу несколько важных (для меня)

1. pxe + nfsroot + dhcp + init.d. в итоге настройку рига можно свести к его сборке, включению сетевой загрузки, прописыванию мака и имени в dhcp конфиг, тюнинг карт в скрирт, и включению патчкорда в материнку (щелк)

2. из всех портов у меня слушается только 22 (с vnc +5900)

Ссылка на комментарий
Поделиться на другие сайты

pxe

Реализовано? Если да, то...  УЧИТЕЛЬ! СКАЖИ, ЧТО ЧИТАТЬ? Проблема: инитрамфс стартует, сквошфс через нфс монтируется, но не вгружается. Вываливаюсь в рекавери консоль. Лог каспера... недоступен, потому что в рекавери не нашел чем показывать страницу за страницей.

 

(или может изначально посыл был неверен, и правда совсем рядом, навроде: "каспер не нужен, делай рсинк-чрут, инит-скрипт переключить в нфс и все")

 

есть плюсы по сравнению с виндой

К вышесказанному добавлю меньшее потребление ресурсов.

Изменено пользователем UR_Quan
Ссылка на комментарий
Поделиться на другие сайты

не подкинеш конфиг? кстати не отрабатывает вообще команду nvidia-settings вываливает ошибку и если пускать через иксы то выдает ошибку зараза. уже голову сломал с настройкой.  в токе идет на 21 мх. хотелось бы 24-25. и окно нвидиа сетингс пустое без вкладок разгона. черт зает может так и должно быть. драйвер поставил 384-59

Пытался подкинуть, но у тебя запрещено использование личных сообщений. Так что упс.

Ссылка на комментарий
Поделиться на другие сайты

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать учетную запись

Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
  • Similar Topics

    • Настройка Асиков в "Соло Режим"

      Доброго времени суток товарищи. Такое дело, майнингом занимаюсь давно но никогда не пытался майнить соло. Стало интересно, и тут проблема выскочила. Хочу воткнуть в соло ROCK MINER t1.  Управляется он "BE200 Jet Stratum Miner V 5.47" через Block Erupter.  Настройки в bitcoin.conf server=1 rpcuser=123 rpcpassword=123 rpcallowip=* rpcport=3131 daemon=1 gen=0   Настройки в вебморде асика         192.168.0.101 - локальный ип сервака запущенного "сервер кошелек" 3131 порт открытыйв локалке и "из

      в ASIC/FPGA майнеры

    • Настройка USB майнера

      Народ привет! Прошу тему не удалять.   Нашёл наконец-то на просторах интернета такой мини Асик.  Поиск по фото показал, что это модель Erupter какая-то. Здесь есть древние темы, но не рискнул там писать. Скачал драйвер CP210x_Universal_Windows_Driver, Винда определила майнер. Нашел старую версию cgminer-3-1-1-zeus-windows.   Но вот где взять пул для добычи биткоина, чтобы его прописать в батнике? В старых темах пулы все мёртвые и давно на видюхах толь

      в ASIC/FPGA майнеры

    • Установка и настройка YiiMP пулов. База знаний

      Предисловие. Первоначально тема называлась так: "Домашний YiiMP пул + кошелек для соло. Нужен совет". Но в связи с тем, что информации по настройке yiimp пулов в сети катастрофически мало, в топике стали обсуждаться гораздо более широкие задачи. Надеемся, что, в конечном итоге, эта тема станет хорошей базой знаний.       Прошу помочь советом в настройке связки yiimp + кошелек.   Тема соло мне всегда была интересна, но так как метод getwok на сегодняшний день пра

      в Программы для майнинга

    • Замена вентилятора на EVGA GeForce GTX 1070 FTW

      Доброго времени суток.   Не подскажете, что и как можно сделать с картой EVGA GeForce GTX 1070 FTW? Отвалился один вентилятор. Но карта работает. Как заменить его, вентилятор, можно? И можно ли? И где его достать. Ни одной темы по этим вопросам не могу найти. Ни на форумах, ни в интернете.       Подойдут ли эти вентиляторы для замены: 1. Вентилятор - этот в итоге заказал... 2. Вентилятор - этот скорее всего не подойдёт...

      в Видеокарты

    • Настройка полного узла Lightning Network на Windows

      Не могу найти свежие статьи по запуску полной ноды  LN с помощью Bitcoin core + Eclair на Windows.  Все статьи,  что выдает поиск 2018 - 2019 года.  Есть кто это делал?  

      в Биткоин

×
×
  • Создать...