Перейти к содержимому

YoBit.Net

Фотография

rigonline.ru | Мониторинг работы фермы

мониторинг подключение отключение

Сообщений в теме: 798

#461 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 17:22

Доброго дня!

 

Подскажите пожалуйста, прога видит только зелёные карточки? amd не видит?(

 

У меня все карты видит.

И по отдельности красные и зеленые фермы и смешанные фермы.

 

Кидай мне скрин консоли приложения, лучше в вк (https://vk.com/rigonline).


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#462 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 20:38

Обновление,

 

- в личном кабинете добавил настройку "Расширенная статистика" в блоке "Публичная ссылка"

 

Если эту галочку отметить, то по публичной ссылке будет отображаться вся статистика в полном объеме, как в личном кабинете. Иначе, только аптайм и видеокарты.


  • 2

Сервис мониторинга работы ферм - rigonline.ru


#463 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 20:54

Обновление:
 
- разработан функционал уведомлений при выходе видеокарт за температурные пределы (mint, maxt в файле config.ini)
 
Ферма №1 «RIG1». Температурный режим нарушен.
Ферма №1 «RIG1». Температурный режим восстановлен.
 
- разработан функционал уведомлений при отвале видеокарт (vcount в файле config.ini)
 
Ферма №1 «RIG1». Отвал видеокарт (1 шт. из 5).
Ферма №1 «RIG1». Все видеокарты восстановлены (5 шт.).
 
Рекомендации:
- настроить на всех фермах правильные температурные пределы
- настроить на всех фермах правильно количество видеокарт
 
После внесения изменений в config.ini - НЕ обязательно перезапускать батник.
Конфиг читается заново на каждой итерации цикла.
 
Для избежания ложных срабатываний, реализовано двойное подтверждение ошибки.
Т.е. уведомление уйдет только при получении второй ошибки сразу после первой.
Так-же как и с мониторингом найса.

  • 5

Сервис мониторинга работы ферм - rigonline.ru


#464 yazol

yazol

    Новичок

  • Пользователи
  • Pip
  • 5 сообщений

Отправлено 27 July 2017 - 22:19

Благодарю Автора за отличный сервис.

 

Подскажите пожалуйста, по какой причине, в стстистике, на одной ферме не отображаерся график запусков/остановок/перезагрузок фермы?

На всех показывает, а на одной нет.


Сообщение отредактировал yazol: 27 July 2017 - 22:20

  • 0

#465 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 22:26

Благодарю Автора за отличный сервис.

 

Подскажите пожалуйста, по какой причине, в стстистике, на одной ферме не отображаерся график запусков/остановок/перезагрузок фермы?

На всех показывает, а на одной нет.

 

Статистика по запускам/остановкам/перезагрузкам начала собираться с вечера прошлой пятницы.

Если все это время ферма работала стабильно и ни разу не перегружалась, то и статистики нет))

 

Можешь просто выключить мое приложение. Подождать 8 минут. Получишь уведомления что ферма остановлена. После чего запустить приложение. После этого статистика начнет записываться. 


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#466 yazol

yazol

    Новичок

  • Пользователи
  • Pip
  • 5 сообщений

Отправлено 27 July 2017 - 22:37

Да действительно ферма работает 12дней ...

Подожду может сама станет ))

 

По поводе графиков температуры.

Это была бы очень полезная штука. Только зачем вести статистику каждой карты?

Мне кажется графика минимальной и максимальной температуры фермы, было бы достаточно.


  • 0

#467 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 22:41

Средняя температура фермы может быть 68 градусов, что в принципе нормально.

Но при этом 3 карты будут по 60, а две по 80. А это уже плохо.

Мне кажется средняя температура по больнице не очень хороший вариант))


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#468 yazol

yazol

    Новичок

  • Пользователи
  • Pip
  • 5 сообщений

Отправлено 27 July 2017 - 22:54

Не средний показатель, а минимум и максимум. Мин 60 макс 80, тогда сразу видно


  • 0

#469 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 22:59

Не средний показатель, а минимум и максимум. Мин 60 макс 80, тогда сразу видно

 

Хммм... есть над чем подумать... спасибо за идею))


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#470 seriych

seriych

    Пользователь

  • Пользователи
  • PipPip
  • 104 сообщений
  • ГородМосква

Отправлено 27 July 2017 - 23:28

Пользователи, которые очень хотели графики по температурам карт, есть что обсудить.

Пока есть предложение писать статистику не каждые 3 минуты, а допустим, раз в час.

Час для полной слишком редко, хотя и гораздо лучше чем ничего. Некоторые моменты не поймаем. Если минут до 15 уменьшить интервал и воспользоваться интересным предложением хранить только максимум и минимум, то в принципе норм.

Хотя с максимумом и минимумом свои заморочки могут выплыть. Если номер карты с мгновенным граничным значением меняется за интервал, что делать? Считать максимум за период каждой отдельной карты, а потом смотреть максимум из максимумов? Но так надо хранить много промежуточных данных и производить много вычислений. Или можно всегда брать максимум температур всего рига и не париться? В принципе может второй вариант даже полезнее, так что стоит подумать над этой возможностью.

 

Но, как мне кажется, проблема будет не в дисковом пространстве и обработке базы, а в ширине канала, который может не справиться с потоком данных, если многие будут графики использовать. Хотя, если хранить в json, то естественно все ресурсы сервака только на парсинг и будут уходить (если графики не клиент напрямую по данным json рисовать будет). Но внезапно хранить можно не в json. Плюс бинарный формат позволить хранить не 18 байт на тик, а 3 байта (условно два байта на время и один на температуру)


  • 1

#471 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 27 July 2017 - 23:34

Час для полной слишком редко, хотя и гораздо лучше чем ничего. Некоторые моменты не поймаем. Если минут до 15 уменьшить интервал и воспользоваться интересным предложением хранить только максимум и минимум, то в принципе норм.

Хотя с максимумом и минимумом свои заморочки могут выплыть. Если номер карты с мгновенным граничным значением меняется за интервал, что делать? Считать максимум за период каждой отдельной карты, а потом смотреть максимум из максимумов? Но так надо хранить много промежуточных данных и производить много вычислений. Или можно всегда брать максимум температур всего рига и не париться? В принципе может второй вариант даже полезнее, так что стоит подумать над этой возможностью.

 

Но, как мне кажется, проблема будет не в дисковом пространстве и обработке базы, а в ширине канала, который может не справиться с потоком данных, если многие будут графики использовать. Хотя, если хранить в json, то естественно все ресурсы сервака только на парсинг и будут уходить (если графики не клиент напрямую по данным json рисовать будет). Но внезапно хранить можно не в json. Плюс бинарный формат позволить хранить не 18 байт на тик, а 3 байта (условно два байта на время и один на температуру)

 

Данные храню в json.

И графики рисовать будут браузеры клиентов при помощи какого-нить плагина.

Тут надо понять как минимизировать сами файлы json без потери информативности.


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#472 marlllboro

marlllboro

    Пользователь

  • Пользователи
  • PipPip
  • 78 сообщений

Отправлено 28 July 2017 - 01:03

За температуру просто адски спасибо. Нет, просто мегаадовоспасибо! доберусь до цивизалации - отправлю еще поддержку.

Вопрос - давеча в статистке один риг загорелся желтым, развернул - одна из видях просела gpu, но уведомление молчало. Остальные карты работе впоряде. Это можно как то вывести в телеграмм ?


  • 1

#473 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 28 July 2017 - 09:07

За температуру просто адски спасибо. Нет, просто мегаадовоспасибо! доберусь до цивизалации - отправлю еще поддержку.

Вопрос - давеча в статистке один риг загорелся желтым, развернул - одна из видях просела gpu, но уведомление молчало. Остальные карты работе впоряде. Это можно как то вывести в телеграмм ?

 

Что значит "загорелся желтым"?)

 

По загрузке гпу уведомлений не делаю, потому что ОХМ часто нулевую загрузку возвращает, поэтому в карточках бывают знаки "?".

С температурой вроде проблем нет - всегда есть данные.

Да и если карта отвалилась, то явно будет остывать и тут ее спалит выход за температурный диапазон.


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#474 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 28 July 2017 - 11:25

Полезные мелочи))

 

2017-07-28_13-24-13.png


  • 4

Сервис мониторинга работы ферм - rigonline.ru


#475 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 28 July 2017 - 17:05

Пока делаю резиновую верстку - отключил отображение графиков на экранах шириной меньше 730 пикселей.


  • 0

Сервис мониторинга работы ферм - rigonline.ru


#476 bezymec

bezymec

    Новичок

  • Пользователи
  • Pip
  • 26 сообщений

Отправлено 28 July 2017 - 20:11

Охота андройд виджет на весь экран. отображать теже показатели что на сайте, дабы не заходить постоянно в браузер))


  • 0

#477 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 28 July 2017 - 20:18

Сделал резиновую верстку + заверстал адаптивы.

Теперь на мобильниках тоже можно адекватно смотреть.

Вернул отображение таблиц и графиков.

 

На мобильниках по видеокартам можно ткнуть - откроются скрытые параметры (вентилятор, частота ядра, частота памяти).


Охота андройд виджет на весь экран. отображать теже показатели что на сайте, дабы не заходить постоянно в браузер))

 

Не пойму зачем заходить постоянно в браузер?

Если нет уведомлений, значит все нормально работает))


  • 3

Сервис мониторинга работы ферм - rigonline.ru


#478 bezymec

bezymec

    Новичок

  • Пользователи
  • Pip
  • 26 сообщений

Отправлено 28 July 2017 - 20:44


 

Не пойму зачем заходить постоянно в браузер?

Если нет уведомлений, значит все нормально работает))

Это как в найс хеше охота постоянно видеть))


  • 0

#479 seriych

seriych

    Пользователь

  • Пользователи
  • PipPip
  • 104 сообщений
  • ГородМосква

Отправлено 29 July 2017 - 00:02

3. предложат решение по минимизации нагрузки на сервер в связи с огромным количеством данных

Еще вариант, как можно пожать данные: хранить не для каждого тика время и температуру, а только времена, когда температура менялась и эту изменившуюся температуру. Если еще и точность температуры уменьшить не до +-1 градуса, а до +-3..5 градусов, то пожмется очень сильно
  • 0

#480 nikodim

nikodim

    Пользователь

  • Пользователи
  • PipPip
  • 395 сообщений
  • ГородТюмень

Отправлено 29 July 2017 - 11:33

Обновление:

 

- в уведомлениях по температурному режиму добавил все температуры видеокарт фермы

 

2017-07-29_13-31-12.png


  • 3

Сервис мониторинга работы ферм - rigonline.ru






Темы с аналогичным тегами мониторинг, подключение, отключение

Количество пользователей, читающих эту тему: 5

1 пользователей, 3 гостей, 0 анонимных