Jump to content

Fabryan

Новички
  • Content Count

    28
  • Joined

  • Last visited

Everything posted by Fabryan

  1. Все таки пришлось сделать таймер запуска службы. [Timer] OnBootSec=10min Unit=m1.service [Install] WantedBy=multi-user.target #systemctl start m1.timer #systemctl enable m1.timer
  2. По традиции, отвечаю сам себе. Подкорректировал службы в systemd после чего провел испытания, по крайней мере на испытаниях все работает. Майнер [Unit] Description=M1 Script [Service] ExecStart=/opt/m1/start.sh Охлаждения [Unit] Description=Fan Script [Service] Type=simple ExecStart=/opt/fan/fan2.sh Restart=always RestartSec=1 User=fabryan Group=fabryan
  3. Честно говоря, не думал об этом, но мне кажется у этой идеи есть и плюсы и минусы. Я бы хотел более точно понять почему так происходит, по этому и обратился на форум.
  4. Привет всем, народ помогите разобраться, че то самому тяжко стало. Я использую systemd в качестве сервиса для работы со скриптами. Суть проблемы, имеется два скрипта start.sh (для запуска майнера) и fan2 (для охлаждения). Если я правильно выключаю/перезагружаю ферму и потом включаю все стартует правильно, все запускается корректно. Но если выключается свет и потом включается то начинает происходить что то не понятное, прилагаю файл лога ниже. Почему то карты при таком старте перстают определятся, в одну из видеокарт воткнут эмулятор монитора. На сколько я понял возможно майнер и охлаждение стартует раньше чем xсессия. То что у меня в systemd : m1.service [Unit] Description=M1 Script After=multi-user.target [Service] Type=idle ExecStart=/opt/m1/start.sh [Install] WantedBy=multi-user.target fan1.service [Unit] Description=Fan Script After=multi-user.target [Service] Type=simple ExecStart=/opt/fan/fan2.sh Restart=always RestartSec=1 User=fabryan Group=fabryan [Install] WantedBy=multi-user.target Содержание скриптов: Майнер start.sh #!/bin/bash /opt/m1/miner --config /opt/m1/miner.cfg Охлаждение fan2.sh #!/bin/bash #nvidia-xconfig -a --enable-all-gpus #nvidia-xconfig -a --cool-bits=4 #sleep 30 export DISPLAY=:0 DELAY=5 MIN_TEMP=50 MAX_TEMP=62 CARDS_NUM=`nvidia-smi -L | wc -l` echo "Found ${CARDS_NUM} GPU(s) : MIN ${MIN_TEMP}°C - ${MAX_TEMP}°C MAX : Delay ${DELAY}s" for ((i=0; i<$CARDS_NUM; i++)) do nvidia-settings -a [gpu:$i]/GPUFanControlState=1 > /dev/null if [ "$?" -ne 0 ]; then exit 1; fi done echo "GPUFanControlState set to 1 for all cards" while true do echo "$(date +"%d/%m/%y %T")" for ((i=0; i<$CARDS_NUM; i++)) do GPU_TEMP=`nvidia-smi -i $i --query-gpu=temperature.gpu --format=csv,noheader` if [[ $GPU_TEMP < $MIN_TEMP ]] then FAN_SPEED=0 elif [[ $GPU_TEMP > $MAX_TEMP ]] then FAN_SPEED=100 else FAN_SPEED=$(( ($GPU_TEMP - $MIN_TEMP)*100/($MAX_TEMP - $MIN_TEMP) )) fi nvidia-settings -a [fan:$i]/GPUTargetFanSpeed=$FAN_SPEED > /dev/null echo "GPU${i} ${GPU_TEMP}°C -> ${FAN_SPEED}%" done sleep $DELAY done syslog3.txt
  5. Возможно вы правы, но я так понимаю никто еще этого не делал, по этому хотелось бы из гипотетической области перевести этот вопрос в практическую !
  6. Не даст смотря под что ! Например для эфира даст, хотелось бы попробовать, куда копнуть ?
  7. Привет всем, понимаю что вопрос из области фантастики, но все таки интересно. Попытался изучить вопрос но гугл толком ничего не дал, в основном есть много манов и видео как увеличить память используя всю память видеокарты, но это не то. Так же из всех крупиц которые удалось почерпнуть понял, что такое возможно только на картах AMD. Может у кого то есть соображения на этот счет ?
  8. Почему бы не сделать все таки Watchdog через systemd мне кажется это намного надежнее, там есть функции по ребуту и выключению системы мне кажется такой вариант куда лучше чем отключение карты на рабочей системе, в любом случае можно логировать происходящие и уже по факту решать проблему. Вопрос немного в другю сторону на одной карте просел хешрейт было 19.копеки стало 15.копейки. Майнер клеймор майню в дуале ETH+DCR, с железом ничего не делал, искания и постепенные вытыкания карт и перетекания в слоты все равно выводят на показатели 15.копейки даже если карта в системе одна, разгон не делал, монитор вытыкал. Думается мне два варианта либо сама карта либо пул !
  9. Если не сложно после теста, выложите пошагово скрипты и сервисы в порядке реализации !
  10. Круто, контроли как реализованы ? через systemd ?
  11. Если можешь что нибудь сделать, сделай чтонибудь хорошее !

  12. init.d проверенный инструмент но я хотел попробовать что то новое. fan1.service - Fan Script Loaded: loaded (/lib/systemd/system/fan1.service; enabled; vendor preset: ena Active: active (running) since Чт 2017-08-24 20:44:22 +03; 11h ago Main PID: 1735 (fan2.sh) CGroup: /system.slice/fan1.service ├─ 1735 /bin/bash /opt/fan/fan2.sh └─30402 sleep 5 По подробнее пожалуйста немного не понял, видать не настолько в никсах разбираюсь, а хотелось бы ! На сколько я понял systemd работает на уровне системы и скорее всего упадет вместе с системой !
  13. Я себе 28 поставил ! Ну теперь все встало на свои места !
  14. Он привел ссылку https://us.download.nvidia.com/XFree86/Linux-x86/384.47/README/xconfigoptions.html И предложил окунуться в таинство документации )), но там не все режимы, все я так и не нашел.
  15. Отвечаю сам себе, дело было в том что данный скрипт должен запускаться от простого пользователя в итоге пусковой файл в systemd выглядит так [unit] Description=Fan Script After=multi-user.target [service] Type=simple ExecStart=/opt/fan/fan2.sh Restart=always RestartSec=1 User=Ваш пользователь Group=Его группа [install] WantedBy=multi-user.target Будет время я еще поиграюсь с настройками WatchdogSec=30s Restart=on-failure StartLimitInterval=3min StartLimitBurst=4 Для более точной настройки
  16. спасибо за ответы. Обнаружил что данный скрипт невозможно автоматически стартовать например через systemctl или supervisor а хотелось бы, что бы можно было контролировать процесс в логах пишет вот такое: Aug 24 12:55:53 M1 systemd[1]: fan1.service: Service hold-off time over, scheduling restart. Aug 24 12:55:53 M1 systemd[1]: Stopped Fan Script. Aug 24 12:55:53 M1 systemd[1]: Started Fan Script. Aug 24 12:55:53 M1 systemd[1]: fan1.service: Main process exited, code=exited, status=1/FAILURE Aug 24 12:55:53 M1 systemd[1]: fan1.service: Unit entered failed state. Aug 24 12:55:53 M1 systemd[1]: fan1.service: Failed with result 'exit-code'. Aug 24 12:55:53 M1 systemd[1]: Starting Daemon for power management... Aug 24 12:55:53 M1 systemd[1]: fan1.service: Service hold-off time over, scheduling restart. Aug 24 12:55:53 M1 systemd[1]: Stopped Fan Script. Aug 24 12:55:53 M1 systemd[1]: fan1.service: Start request repeated too quickly. Aug 24 12:55:53 M1 systemd[1]: Failed to start Fan Script. [email protected]:/lib/systemd/system# sudo systemctl status fan1.service ● fan1.service - Fan Script Loaded: loaded (/lib/systemd/system/fan1.service; enabled; vendor preset: enabled) Active: failed (Result: exit-code) since Чт 2017-08-24 13:21:36 +03; 2min 24s ago Main PID: 3171 (code=exited, status=1/FAILURE) авг 24 13:21:36 M1 systemd[1]: Started Fan Script. авг 24 13:21:36 M1 fan2.sh[3171]: Found 5 GPU(s) : MIN 50°C - 60°C MAX : Delay 5s авг 24 13:21:36 M1 fan2.sh[3171]: No protocol specified авг 24 13:21:36 M1 fan2.sh[3171]: Failed to connect to Mir: Failed to connect to server socket: Н авг 24 13:21:36 M1 fan2.sh[3171]: Unable to init server: Could not connect: В соединении отказано авг 24 13:21:36 M1 fan2.sh[3171]: ERROR: The control display is undefined; please run `nvidia-set авг 24 13:21:36 M1 fan2.sh[3171]: --help` for usage information. авг 24 13:21:36 M1 systemd[1]: fan1.service: Main process exited, code=exited, status=1/FAILURE авг 24 13:21:36 M1 systemd[1]: fan1.service: Unit entered failed state. авг 24 13:21:36 M1 systemd[1]: fan1.service: Failed with result 'exit-code'. И постоянно идет на перезапуск Служба которая лежит в systemd [unit] Description=Fan Script After=multi-user.target [service] ExecStart=/opt/fan/fan2.sh WatchdogSec=30s Restart=on-failure StartLimitInterval=3min StartLimitBurst=4 [install] WantedBy=multi-user.target
  17. Что то про coolbits мало пишут, хотел найти ман по ним, но что то не на гуглил. Режим 31 это полный оверклокинг ? Чем он от 4-го отличается ?
  18. Неужели настолько может не повезти )) По подробнее, где можно почитать ?
  19. Стоило мне зайти в GUI включить/выключить режим вентиля и батник заработал. Только появился новый вопрос, как я понял скрипт контролирует температуру и в зависимости он ее вручную проставляет обороты для вентилятора ! Но если скрипт завершается, в настройках остается последняя величина которую скрипт успел выставить, хотелось бы это как то контролировать что бы не получилось так что карты перегреются. Я так понимаю можно отслеживать работу скрипта и если он мертв перезапускать его, или написать второй скрипт который переходит в авто режим контроля оборотов куллера !
  20. Сoolbits cстоит 4 Забил руками [email protected]:~# sudo nvidia-settings -a [fan:0]/GPUTargetFanSpeed=100 ERROR: Error assigning value 100 to attribute 'GPUTargetFanSpeed' (M1:0[fan:0]) as specified in assignment '[fan:0]/GPUTargetFanSpeed=100' (Unknown Error). Подскажи как лучше xorg сгенерировать ? # nvidia-xconfig: X configuration file generated by nvidia-xconfig # nvidia-xconfig: version 384.59 ([email protected]) Thu Jul 20 01:03:28 PDT 2017 Section "ServerLayout" Identifier "Layout0" Screen 0 "Screen0" 0 0 InputDevice "Keyboard0" "CoreKeyboard" InputDevice "Mouse0" "CorePointer" EndSection Section "Files" EndSection Section "InputDevice" # generated from default Identifier "Mouse0" Driver "mouse" Option "Protocol" "auto" Option "Device" "/dev/psaux" Option "Emulate3Buttons" "no" Option "ZAxisMapping" "4 5" EndSection Section "InputDevice" # generated from default Identifier "Keyboard0" Driver "kbd" EndSection Section "Monitor" Identifier "Monitor0" VendorName "Unknown" ModelName "Unknown" HorizSync 28.0 - 33.0 VertRefresh 43.0 - 72.0 Option "DPMS" EndSection Section "Device" Identifier "Device0" Driver "nvidia" VendorName "NVIDIA Corporation" BoardName "GeForce GTX 1060 6GB" EndSection Section "Screen" Identifier "Screen0" Device "Device0" Monitor "Monitor0" DefaultDepth 24 Option "Coolbits" "4" SubSection "Display" Depth 24 EndSubSection EndSection
  21. Вы дает ошибку ERROR: Error assigning value 65 to attribute 'GPUTargetFanSpeed' (M1:0[fan:0]) as specified in assignment '[fan:0]/GPUTargetFanSpeed=65' (Unknown Error). GPU0 63°C -> 65%
  22. Опять отвечаю сам себе. Тупанул не посмотрел название пула смотрел не на тот путь который в sh файле идет
  23. Народ, подскажите пожалуйста использую клеймор 9.8 дуал eth+dcr декред нормально майниться на пул supernova а вот эфир почему то вообще на пуле никаких признаков не подает на пуле ethermine, ни скорость ни одного майнера не показывает, может надо какие то порты открыть ?
  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...