Перейти к содержимому
nikodim

rigonline.ru | Мониторинг работы фермы

Рекомендуемые сообщения

П.С. микрозаметка:

на одной из ферм в момент запуска скрипта процесс poweshell выжирает 100% процесрного времени, что создает проблемы в работе фермы ;(

Причина пока не ясна, но в идеале запускать скрипт с низким процессорным приоритетом, во избежании возможных проблем

 

Хорошее предложение))

Поставлю в задачи разобраться с процессорным приоритетом.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

Чтобы еще сократить - можно убрать слово "Ферма" или заменить его на "Риг".

думаю это будет правильней, так как ферма или шахта это наверное больше подходит под определение всего массива ригов, а риг это как раз одна его составляющая 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

думаю это будет правильней, так как ферма или шахта это наверное больше подходит под определение всего массива ригов, а риг это как раз одна его составляющая 

 

Тоже размышлял об этом пару дней назад))

Ферма - это совокупность ригов в помещении...

Сделаю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Тестирую ребут системы при отвалах карт и нарушении температурного режима...

Настраивать фичу можно будет?

Например, я хочу уведомление при 75+ градусах, но не хочу при этом автоматически ребутиться.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Настраивать фичу можно будет?

Например, я хочу уведомление при 75+ градусах, но не хочу при этом автоматически ребутиться.

 

Да, конечно.

Будут 2 дополнительные настройки: "Авторебут при отвале карт", "Авторебут при нарушении температуры".

Мне, например, по температуре тоже авторебут  не нужен, поэтому использую только авторебут при отвале карт.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Сделал настройки ригов на всплывашках.

Уж очень мне не нравился прежний вариант...

 

post-40565-0-15049500-1502281686_thumb.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

Сделал настройки ригов на всплывашках. Уж очень мне не нравился прежний вариант...
спасибо, стало удобней лично для меня !

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Обновление (версия 3.5):

 

- авторебут рига при отвале карт (при установленной настройке)

- авторебут рига при нарушении температуры (при установленной настройке)

 

Необходимо быть очень внимательными и понимать что вы делаете.

Вы все делаете на свой страх и риск))

 

Если у вас отвалилась карта и ребут ее не оживляет - при установленной настройке "авторебут при отвале" - риг будет постоянно ребутаться. Чтобы решить проблему - нужно в личном кабинете изменить количество карт на риге. Приложение скачает новый конфиг и ребуты прекратятся.

То-же самое касается и температур - если у вас стоит настройка "авторебут по температуре", то при частых ребутах, просто измените пороги температур в личном кабинете.

 

post-40565-0-92290800-1502284834_thumb.png

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Обновление (версия 3.5):

 

- авторебут рига при отвале карт (при установленной настройке)

- авторебут рига при нарушении температуры (при установленной настройке)

 

Необходимо быть очень внимательными и понимать что вы делаете.

Вы все делаете на свой страх и риск))

 

Если у вас отвалилась карта и ребут ее не оживляет - при установленной настройке "авторебут при отвале" - риг будет постоянно ребутаться. Чтобы решить проблему - нужно в личном кабинете изменить количество карт на риге. Приложение скачает новый конфиг и ребуты прекратятся.

То-же самое касается и температур - если у вас стоит настройка "авторебут по температуре", то при частых ребутах, просто измените пороги температур в личном кабинете.

 

attachicon.gif2017-08-09_18-05-45.png

 

Предложение:

исходя из соседнего проекта я бы разделил температуры оповещения и температуры ребута

например, хорошо понимать, что температра подошла к пределу еще до того как ферма ребутнется

 

Это как светофор, загорелся желтый - внимание, красный - жми на тормоз(ребут).

да и визуально при осмотре ферм в ЛК сразу понятно что температура  перешла "в предкретичный предел"

 

Опционально в настройках можно отключить оповещение о "предкртичном пороге", в таком случае уведомления будут приходить только в случае ребута.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Предложение:

исходя из соседнего проекта я бы разделил температуры оповещения и температуры ребута

например, хорошо понимать, что температра подошла к пределу еще до того как ферма ребутнется

 

Это как светофор, загорелся желтый - внимание, красный - жми на тормоз(ребут).

да и визуально при осмотре ферм в ЛК сразу понятно что температура  перешла "в предкретичный предел"

 

Опционально в настройках можно отключить оповещение о "предкртичном пороге", в таком случае уведомления будут приходить только в случае ребута.

 

Даже не знаю как прокомментировать... не очень понятно зачем это нужно... у меня конечно есть промежуточный статус "CHECK" перед уведомлением, но совсем не хочется еще кучу уведомлений отправлять по этому статусу... мне кажется пользователям и так хватает уведомлений... честно не понятно какие задачи может решать такое уведомление.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Разбираюсь с приоритетом процессов.

Сделал чтобы каждый скрипт выполнялся с приоритетом "ниже среднего" (и ОХМ в том числе), но что-то я разницы не заметил... 

Могу выкатить обновление 3.6 с этими изменениями, потом отпишетесь - есть результат или нет.

Пробуем?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Выкатил версию 3.6 с изменением приоритета на "ниже среднего".

Тестируйте.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Спасибо. Утром буду тестить

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Обновление (версия 3.7):

 

- Замена нативной функции Get-WmiObject кастомной функцией Get-WmiCustom

 

данное обновление позволяет задать таймаут по прошествию которого функция прекращает выполнение, что должно решить проблему зависания приложения по причине зависания WMI (в нативной функции Get-WmiObject нет возможности задать параметр timeout).

 

Подробнее с решением можно ознакомиться по ссылке - https://blogs.msdn.microsoft.com/dmuscett/2009/05/27/get-wmicustom-aka-get-wmiobject-with-timeout/

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
(изменено)

Если нет интернета

Будет ли перезагрузка?

 

Как работает сам алгоритм узнавания что карта отвалилась?

Изменено пользователем Rostiks

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Если нет интернета

Будет ли перезагрузка?

 

Как работает сам алгоритм узнавания что карта отвалилась?

 

Наличие интернета не влияет на идентификацию отвала карт.

 

Идентификация отвала карт идет 2 проверками:

1. если количество карт указанных в конфиге больше чем количество карт полученных из ОХМ

2. если температура карты = 0 - считается что карта отвалилась

 

Все эти проверки происходят в приложении на клиентской машине. Соответственно не зависимо от наличия/отсутствия интернета машина будет перезагружена (при установленной настройке).

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Наличие интернета не влияет на идентификацию отвала карт.

 

Идентификация отвала карт идет 2 проверками:

1. если количество карт указанных в конфиге больше чем количество карт полученных из ОХМ

2. если температура карты = 0 - считается что карта отвалилась

 

Все эти проверки происходят в приложении на клиентской машине. Соответственно не зависимо от наличия/отсутствия интернета машина будет перезагружена (при установленной настройке).

 

По частоте так и не реализовано? Бывает майнер вылетает, на зеленых картах, температура не падает к 0, все карты на месте. Майнер вылетает и работает в пустую. Тогда ваш софт не сделает перезагрузку.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

 

По частоте так и не реализовано? Бывает майнер вылетает, на зеленых картах, температура не падает к 0, все карты на месте. Майнер вылетает и работает в пустую. Тогда ваш софт не сделает перезагрузку.

 

вот в этом случай как раз таки и не помешало бы видеть показания хешрейта в панели, смотри хеш упал взял и ребутнул, а еще непомешало бы видеть пинг майнера на пул, было такое что у провайдера что то случилось и пинг вырос сильно, соответственно не все шары доходили, перезагрузился и пинг востановился.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

вот в этом случай как раз таки и не помешало бы видеть показания хешрейта в панели, смотри хеш упал взял и ребутнул, а еще непомешало бы видеть пинг майнера на пул, было такое что у провайдера что то случилось и пинг вырос сильно, соответственно не все шары доходили, перезагрузился и пинг востановился.

 

Зачем этот хешрейт? Это сложно и для каждого пула нужно отдельно брать по апи. Лучше уже работать с частостой, когда она уже у нас в руках. 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
(изменено)

По частоте так и не реализовано? Бывает майнер вылетает, на зеленых картах, температура не падает к 0, все карты на месте. Майнер вылетает и работает в пустую. Тогда ваш софт не сделает перезагрузку.

 

По частотам у меня задача стоит, но она под большим вопросом.

Потому что заметил следующее - при отвале карты частоты по прежнему на максимуме.

Нужно понять что происходит когда майнер вылетает - у всех карт частоты падают?

вот в этом случай как раз таки и не помешало бы видеть показания хешрейта в панели, смотри хеш упал взял и ребутнул, а еще непомешало бы видеть пинг майнера на пул, было такое что у провайдера что то случилось и пинг вырос сильно, соответственно не все шары доходили, перезагрузился и пинг востановился.

 

Тоже не пойму чего вы в этот хэшрейт упираетесь?

 

Зачем чинить машину когда она сломалась и при это самому еще периодически проверять, а не сломалась ли она?

Когда гораздо правильнее автоматически диагностировать поломку опираясь на частоты карт - это первоисточник.

Изменено пользователем nikodim

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
(изменено)

По частотам у меня задача стоит, но она под большим вопросом.

Потому что заметил следующее - при отвале карты частоты по прежнему на максимуме.

Нужно понять что происходит когда майнер вылетает - у всех карт частоты падают?

 

Тоже не пойму чего вы в этот хэшрейт упираетесь?

 

Зачем чинить машину когда она сломалась и при это самому еще периодически проверять, а не сломалась ли она?

Когда гораздо правильнее автоматически диагностировать поломку опираясь на частоты карт - это первоисточник.

Не скажите, на зеленых порой проседает хешрейт, но загрузка гпу остается такая же. Помогает перезупуск майнера/ребут. 

Изменено пользователем marlllboro

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не скажите, на зеленых порой проседает хешрейт, но загрузка гпу остается такая же. Помогает перезупуск майнера/ребут. 

 

Какой майнер? У меня ccminer разгружает карту если вылетает. Майнинг не идет изначит и карта разгружаеться.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Бага:

Ферма грузится каждые N часов — так у меня настроено.

Убрал галочку в настройках чтобы мониторинг не слал уведомления о перезагрузке. Теперь и на дневных графиках статистики отметки о перезагрузках не ставятся.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
(изменено)

Бага:

Ферма грузится каждые N часов — так у меня настроено.

Убрал галочку в настройках чтобы мониторинг не слал уведомления о перезагрузке. Теперь и на дневных графиках статистики отметки о перезагрузках не ставятся.

 

Ясно, проверю, починю))

----------------

 

Починил.

Теперь должно писать статистику не зависимо от галочки.

Изменено пользователем nikodim

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Выкатил версию 3.6 с изменением приоритета на "ниже среднего".

Тестируйте.

В Богдаде все стабильно. Спасибо.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас


  • Сейчас на странице   1 пользователь

×