Перейти к публикации
Konstantin310

Падение разгона GTX1070 в Ubuntu, настройка адекватной частоты вращения

Рекомендованные сообщения

(изменено)

Доброе время суток форумчане,
Такие вопросы:

1) разогнал 2 видеокарты по ссылка на инструкцию, (правда у меня 1070)
При запуске компа как бы все хорошо:
 

"Graphics Clock level" = 3 (NVidia XServer Settings)

 

Но когда я запускаю майнер, то разгон переходит с уровня "3" на уровень "2" (см. рис. внизу)
 

"Graphics Clock level" = 2 (NVidia XServer Settings)

Почему так?

и номер "level", становится какой-то непонятной цифрой, всеравно, что наложились цифры "2" на "3" или наоборот.



Сразу же мысли, что такое поведение, может наверное говорить, что я все таки не правильно разогнал видео и где-то срабатывает защита.

2) По этому мануалу разгона, если температура карт больше 50 градусов, то частота становится куллера = 100%
Вот у меня и вопрос по этой границе в 50 градусов, нельзя ли ее повысить или (в скрипте все можно сделать), какие более соответствующие значения для параметров: температура – частота вращения кулера? Т.е. у меня сейчас логика:

- если температура больше 55 гр. то частота вращения 65%,

- если температура больше 60 гр. то частота вращения 100%,

у меня сейчас температура где-то 56 - 59 гр., что-то слишком мало для разогнанной карты

Заранее спасибо за ответы

P.S.
- видео "Geforce GTX 1070 (GV-N1070WF2OC-8GD)"
- Ubuntu 16.04

Ubuntu acceleration bad.jpg

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Мануал ваш не смотрел, и желания нет. 

Ниже приведу способ, которым пользуюсь я. Никогда не подводил.

Сначала разрешаем разгон

sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration

Эта команда дается один раз, для включения расширенного управления картами

 

Из команд ниже нужно сделать скрипт

По порядку. 

Даунвольт:

sudo nvidia-smi -pl значение_в_ваттах

Здесь для всех карт разом. Если карты разные и даунвольт нужен для каждой индивидуально то добавляем в эту команду -i номер_карты

 

Далее устанавливаем значения для режима максимальной произодительности

sudo nvidia-settings -a "[gpu:0]/GPUGraphicsClockOffset[3]=добавка_к_частоте_чипа"
sudo nvidia-settings -a "[gpu:0]/GPUMemoryTransferRateOffset[3]=добавка_к_частоте_памяти"

И указание использовать этот режим:

sudo nvidia-settings --assign "[gpu:0]/GPUPowerMizerMode=1"

Все то же самое нужно продублировать для каждой карты меняя значение gpu. Т.е. [gpu:1], [gpu:2] и т.д. по количеству карт в системе. Карты нумеруются с нуля.
 

Лично я вентиляторами не рулю. Всегда оставляю на автомате. По какой то причине при выставлении ручного режима - ферма начинает работать менее стабильно. Разбираться не особо хочется. Автоматический режим вполне себя оправдывает. При правильном даунвольте и вентиляции карты не греются выше 65 градусов. А это, ИМХО вполне в рамках приличия. И охлаждать их еще больше, особого смысла не вижу.

Но если есть желание порулить вентилями то

Включаем режим ручного управления

sudo nvidia-settings -a "[gpu:0]/GPUFanControlState=1" 

и устанавливаем нужную интенсивность вентилятора (в процентах)

sudo nvidia-settings -a "[fan:0]/GPUTargetFanSpeed=нужная_интенсивность"

из всего этого набора команд делаем скрипт. Добавляем nvidia-smi и nvidia-settings в sudoers. и загоняем сделанный скрипт в автозагрузку.

радуемся

Изменено пользователем 19alexrus71

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

 

37 minutes ago, 19alexrus71 said:

Ниже приведу способ, которым пользуюсь я. Никогда не подводил.

не поверите, но примерно тоже самое и я делал:

разрешил разгон, правда у меня было добавлено "--enable-all-gpus", и т.о.

sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus

а вот файл который у меня в атозагрузке, точно такой же, ка Вы описали (только добавлены строки о вентеляторе)

nvidia-settings -a '[gpu:0]/GPUMemoryTransferRateOffset[3]=800';
nvidia-settings -a '[gpu:1]/GPUMemoryTransferRateOffset[3]=800';
nvidia-settings -a '[gpu:0]/GPUGraphicsClockOffset[3]=180';
nvidia-settings -a '[gpu:1]/GPUGraphicsClockOffset[3]=180';
nvidia-settings -a '[gpu:0]/GPUPowerMizerMode=1';
nvidia-settings -a '[gpu:1]/GPUPowerMizerMode=1';
nvidia-settings -a '[gpu:0]/GPUFanControlState=1';
nvidia-settings -a '[fan:0]/GPUTargetFanSpeed=55';
nvidia-settings -a '[gpu:1]/GPUFanControlState=1';
nvidia-settings -a '[fan:1]/GPUTargetFanSpeed=55';

правда, может у меня НЕ правильная "добавка к частоте чипа" и "добавка к частоте памяти"

А вот чего я не делал (и этого не было в инструкции), так это не "игрался" с "Даунвольт:" и наверное по этому карточке мощности не хватает, когда включается минер...

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
7 минут назад, Konstantin310 сказал:

НЕ правильная "добавка к частоте чипа" и "добавка к частоте памяти"

Это подбирается индивидуально.

Потихоньку добавляете и даете помайнить несколько минут. EWBF начинает сыпать ошибки или отваливается при переразгоне ядра.

клей обычно более чувствиетелен к разгону памяти. 

Вобщем этими двумя майнерами подбираете максимальные значения при которых нет ошибок и не отваливаются карты. Для большей стабильности можно от этих значений еще отнять понемножку.

Ну а даунвольт тоже индивидуально. Вообще для зеленых 60-70 % от стока самое оно.

дайте команду

nvidia-smi

без параметров - выдаст дефолтные значения по питанию. Ну и уже от этих значений 60-70% можно задавать. И уже потом делать тонкую подстройку наблюдая за стабильностью работы и температурой карт.

Лучше на EWBF - он самый прожорливый и больше всего греет карты. Ловите консенсус между "прожорливостью" и хешрейтом.

 

Изменено пользователем 19alexrus71

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

только вопрос по 

44 minutes ago, 19alexrus71 said:

sudo nvidia-smi -pl значение_в_ваттах

 

это если в характеристиках видеоплаты стоит "Recommended PSU = 500W" и видекарты две, то это будет:

Quote

sudo nvidia-smi -pl 1000


правильно (уточняю просто не хотелось бы жечь карты)

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

конечно нет :)

Не смотрите что там в характеристиках написано. На заборе тоже написано :)

запустите 

nvidia-smi

увидите что там зашито по дефолту

С даунвольтом на 1070 надо давать примерно 120-130 Вт.

Но повторюсь - подбирать индивидуально. Все карты разные.

И в значении 

nvidia-smi

параметр pl не имеется ввиду суммарная мощность. Это мощность на одну карту! Просто если не указывать конкретную карту - то эта мощность будет установлена на все карты одинаковая.\

Т.е. например

sudo nvidia-smi -pl 120

установит на все карты в системе максимальную мощность в 120 Вт. (не суммарно, а на каждую)

Изменено пользователем 19alexrus71

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Еще если можно несколько вопросов:
1. Каков диапазон/границы разгона параметров «
"добавка к частоте чипа" и "добавка к частоте памяти"», я так понимаю,  это те диапазоны которые указаны в утилите «(NVidia XServer Settings)» (см. картинку вверху) для конкретного «level» в данном случае «3»?

2 с каким шагом изменять «"добавка к частоте чипа" и "добавка к частоте памяти"»?

3 Параметры «"добавка к частоте чипа" и "добавка к частоте памяти"» нужно изменять одновременно?
4 "
Даунвольт" в скрипте можно указать сразу,  т.е. на любые частоты, или его изменять нужно одновременно с изменением "частоты чипа" и "частоты памяти"?

5. Какие начальные значения выставлять у «"добавка к частоте чипа" и "добавка к частоте памяти"»?

 

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

1. Да.. Мин и максимум этих прибавок/смещений (offcet) - вам показывает утилита. В этих границах и можно эти значения задавать.

2. Шаг любой

3. Необязательно. Это независимые параметры. Один отвечает за частоту ядра (чипа), второй за частоту памяти. Например на картах с памятью Hynix память гонится очень плохо, а ядро вполне нормально.

4. Сначала нужно подобрать частоты. Без даунвольта. На дефолтной мощности. Добиться стабильной работы фермы. Чтобы не висли и не отваливались карты и программы майнеры не сыпали ошибок. Потом подбирать значение даунвольта. Можно начать с 80% от номинала и понемногу убавлять, ловя оптимальное значение, когда хешрейт начнет заметно падать - значит это предел и ниже опускать питание уже не стоит.

5. Нет единого рецепта. Абсолютно все карты разные. Лично я сначала гоню ядро при дефолтной памяти. А потом уже на разогнанном ядре гоню память. Можно методом деления пополам. Т.е. сначала добавляем половину от максимально возможного. Если не работает - убавляем на четверть. Работает - прибавляем одну восьмую, не работает - убавляем одну восьмую... Ну и т.д.

И так же с памятью.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

ЗЫ^ а вообще очень рекомендую воспользоваться поиском и посмотреть на этом форуме. Тут есть топики по разгону, где все подробно расписано и много раз пережевано

В основном обсуждается винда и MSI Afterburner, но разницы нет. Сам принцип разгона одинаков. что под виндой что под линуксом.

Изменено пользователем 19alexrus71

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

1.

23 hours ago, 19alexrus71 said:

4. Сначала нужно подобрать частоты. Без даунвольта. На дефолтной мощности. Добиться стабильной работы фермы. Чтобы не висли и не отваливались карты и программы майнеры не сыпали ошибок. Потом подбирать значение даунвольта. Можно начать с 80% от номинала и понемногу убавлять

А я думал как раз, что от постоянства (не изменении) мощности (дефолтной), как раз у меня происходил переход от "level 3" к "level 2" при запуске майнинга. (Ведь при запуске машины он у меня "level 3" ("Editable performance level"), а при запуске майнинга становится "level 2" (см. рис. вверху))

2 как видно из картинки внизу, номинальная СРЕДНЯЯ мощность где-то 152Вт (исходя из 2-х одинаковых видеокарт). (а как мы знаем выделяемая мощность прямопропорциональна частоте работы карты), то я должен сначало увеличить мощность на 80%, это тогда будет где-то 273,6Вт. И тогда по вашим словам, я должен ее эксперементально понижать до стабильной работы. Правильно?

begin power.png

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Не увеличивать! А уменьшать!

Стоковое значение питания зашито у вас 180 Вт. Как я писал оптимально 60-80% от номинала.

Т.е. получится ~ 110-150 Вт. 

О чем я вам и писал

В 15.11.2017 в 20:41, 19alexrus71 сказал:

С даунвольтом на 1070 надо давать примерно 120-130 Вт.

Т.е можно начинать от 150 Вт и постепенно понижать пока не увидите заметного снижения производительности. Это и будет оптимальный порог по питанию

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Просто при использовании cuda, драйвер нвидии переводит карту в режим P2, что отображается как предпоследний уровень в панели. В этом режиме частота памяти снижается на 400мгц. Пока способов побороть это на никсах я не видел, так что приходится костылить путём запуска отдельного приложения которое тупо использует cuda чтобы зарезервировать пару мегов памяти и больше ничего не делает.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
11 минуту назад, Shevchik сказал:

В этом режиме частота памяти снижается на 400мгц. Пока способов побороть это на никсах я не видел, так что приходится костылить путём запуска отдельного приложения которое тупо использует cuda чтобы зарезервировать пару мегов памяти и больше ничего не делает.

Есть такое дело. Пытался в свое время химичить разными способами - успехов не добился. Плюнул. Снижение производительности не настолько велико, чтобы сильно напрягаться.

Однако, все же интересно.

Можно поподробнее про рецепт с запуском отдельного приложения. Пусть костыльный способ. Но если он действенный - то тоже имеет право на жизнь

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Я просто написал свой мини хелпер для майнинга, вот он у меня и держит сам по себе cuda, чтобы видюхи всегда в p2 были, даже пока майнер дохлый. Будет время оставлю только держание cuda, и выложу сюда, ну или допилю таки и выложу целиком.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
3 минуты назад, Shevchik сказал:

Будет время оставлю только держание cuda, и выложу сюда, ну или допилю таки и выложу целиком.

Ок. Выложите конечно, когда будет готово. Если действительно будет работать, то и небольшой донат со стороны благодарных майнеров наверняка будет :)

Изменено пользователем 19alexrus71

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Хм... У меня при остановке майнера, опять level=3, такое впечатление, что карте не хватает выделяемой мощности...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
2 минуты назад, Konstantin310 сказал:

карте не хватает выделяемой мощности...

Всего ей хватает. И даже более чем.

Выше же человек только что написал

1 час назад, Shevchik сказал:

при использовании cuda, драйвер нвидии переводит карту в режим P2, что отображается как предпоследний уровень в панели

Это нормально. Так и должно быть. Незначительное снижение частоты работы памяти имеет место быть. Но на производительность влияет не сильно. Просто забейте

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

разгон 1070 дал всего 5Mh/s разгона, 9% разгон карты - как-то не очень впечатляет... честно говоря,

Я расчитывал хотябы 20-30%%

Изменено пользователем Konstantin310

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Подскажите, может есть у кого то скрипт по автоматической регулировке PL при заданном значении температуры?

 

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу.

×