Jump to content
Konstantin310

Падение разгона GTX1070 в Ubuntu, настройка адекватной частоты вращения

Recommended Posts

Доброе время суток форумчане,
Такие вопросы:

1) разогнал 2 видеокарты по ссылка на инструкцию, (правда у меня 1070)
При запуске компа как бы все хорошо:
 

"Graphics Clock level" = 3 (NVidia XServer Settings)

 

Но когда я запускаю майнер, то разгон переходит с уровня "3" на уровень "2" (см. рис. внизу)
 

"Graphics Clock level" = 2 (NVidia XServer Settings)

Почему так?

и номер "level", становится какой-то непонятной цифрой, всеравно, что наложились цифры "2" на "3" или наоборот.



Сразу же мысли, что такое поведение, может наверное говорить, что я все таки не правильно разогнал видео и где-то срабатывает защита.

2) По этому мануалу разгона, если температура карт больше 50 градусов, то частота становится куллера = 100%
Вот у меня и вопрос по этой границе в 50 градусов, нельзя ли ее повысить или (в скрипте все можно сделать), какие более соответствующие значения для параметров: температура – частота вращения кулера? Т.е. у меня сейчас логика:

- если температура больше 55 гр. то частота вращения 65%,

- если температура больше 60 гр. то частота вращения 100%,

у меня сейчас температура где-то 56 - 59 гр., что-то слишком мало для разогнанной карты

Заранее спасибо за ответы

P.S.
- видео "Geforce GTX 1070 (GV-N1070WF2OC-8GD)"
- Ubuntu 16.04

Ubuntu acceleration bad.jpg

Edited by Konstantin310

Share this post


Link to post
Share on other sites

Мануал ваш не смотрел, и желания нет. 

Ниже приведу способ, которым пользуюсь я. Никогда не подводил.

Сначала разрешаем разгон

sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration

Эта команда дается один раз, для включения расширенного управления картами

 

Из команд ниже нужно сделать скрипт

По порядку. 

Даунвольт:

sudo nvidia-smi -pl значение_в_ваттах

Здесь для всех карт разом. Если карты разные и даунвольт нужен для каждой индивидуально то добавляем в эту команду -i номер_карты

 

Далее устанавливаем значения для режима максимальной произодительности

sudo nvidia-settings -a "[gpu:0]/GPUGraphicsClockOffset[3]=добавка_к_частоте_чипа"
sudo nvidia-settings -a "[gpu:0]/GPUMemoryTransferRateOffset[3]=добавка_к_частоте_памяти"

И указание использовать этот режим:

sudo nvidia-settings --assign "[gpu:0]/GPUPowerMizerMode=1"

Все то же самое нужно продублировать для каждой карты меняя значение gpu. Т.е. [gpu:1], [gpu:2] и т.д. по количеству карт в системе. Карты нумеруются с нуля.
 

Лично я вентиляторами не рулю. Всегда оставляю на автомате. По какой то причине при выставлении ручного режима - ферма начинает работать менее стабильно. Разбираться не особо хочется. Автоматический режим вполне себя оправдывает. При правильном даунвольте и вентиляции карты не греются выше 65 градусов. А это, ИМХО вполне в рамках приличия. И охлаждать их еще больше, особого смысла не вижу.

Но если есть желание порулить вентилями то

Включаем режим ручного управления

sudo nvidia-settings -a "[gpu:0]/GPUFanControlState=1" 

и устанавливаем нужную интенсивность вентилятора (в процентах)

sudo nvidia-settings -a "[fan:0]/GPUTargetFanSpeed=нужная_интенсивность"

из всего этого набора команд делаем скрипт. Добавляем nvidia-smi и nvidia-settings в sudoers. и загоняем сделанный скрипт в автозагрузку.

радуемся

Edited by 19alexrus71

Share this post


Link to post
Share on other sites

 

37 minutes ago, 19alexrus71 said:

Ниже приведу способ, которым пользуюсь я. Никогда не подводил.

не поверите, но примерно тоже самое и я делал:

разрешил разгон, правда у меня было добавлено "--enable-all-gpus", и т.о.

sudo nvidia-xconfig -a --cool-bits=28 --allow-empty-initial-configuration --enable-all-gpus

а вот файл который у меня в атозагрузке, точно такой же, ка Вы описали (только добавлены строки о вентеляторе)

nvidia-settings -a '[gpu:0]/GPUMemoryTransferRateOffset[3]=800';
nvidia-settings -a '[gpu:1]/GPUMemoryTransferRateOffset[3]=800';
nvidia-settings -a '[gpu:0]/GPUGraphicsClockOffset[3]=180';
nvidia-settings -a '[gpu:1]/GPUGraphicsClockOffset[3]=180';
nvidia-settings -a '[gpu:0]/GPUPowerMizerMode=1';
nvidia-settings -a '[gpu:1]/GPUPowerMizerMode=1';
nvidia-settings -a '[gpu:0]/GPUFanControlState=1';
nvidia-settings -a '[fan:0]/GPUTargetFanSpeed=55';
nvidia-settings -a '[gpu:1]/GPUFanControlState=1';
nvidia-settings -a '[fan:1]/GPUTargetFanSpeed=55';

правда, может у меня НЕ правильная "добавка к частоте чипа" и "добавка к частоте памяти"

А вот чего я не делал (и этого не было в инструкции), так это не "игрался" с "Даунвольт:" и наверное по этому карточке мощности не хватает, когда включается минер...

Edited by Konstantin310

Share this post


Link to post
Share on other sites
7 минут назад, Konstantin310 сказал:

НЕ правильная "добавка к частоте чипа" и "добавка к частоте памяти"

Это подбирается индивидуально.

Потихоньку добавляете и даете помайнить несколько минут. EWBF начинает сыпать ошибки или отваливается при переразгоне ядра.

клей обычно более чувствиетелен к разгону памяти. 

Вобщем этими двумя майнерами подбираете максимальные значения при которых нет ошибок и не отваливаются карты. Для большей стабильности можно от этих значений еще отнять понемножку.

Ну а даунвольт тоже индивидуально. Вообще для зеленых 60-70 % от стока самое оно.

дайте команду

nvidia-smi

без параметров - выдаст дефолтные значения по питанию. Ну и уже от этих значений 60-70% можно задавать. И уже потом делать тонкую подстройку наблюдая за стабильностью работы и температурой карт.

Лучше на EWBF - он самый прожорливый и больше всего греет карты. Ловите консенсус между "прожорливостью" и хешрейтом.

 

Edited by 19alexrus71

Share this post


Link to post
Share on other sites

только вопрос по 

44 minutes ago, 19alexrus71 said:

sudo nvidia-smi -pl значение_в_ваттах

 

это если в характеристиках видеоплаты стоит "Recommended PSU = 500W" и видекарты две, то это будет:

Quote

sudo nvidia-smi -pl 1000


правильно (уточняю просто не хотелось бы жечь карты)

Edited by Konstantin310

Share this post


Link to post
Share on other sites

конечно нет :)

Не смотрите что там в характеристиках написано. На заборе тоже написано :)

запустите 

nvidia-smi

увидите что там зашито по дефолту

С даунвольтом на 1070 надо давать примерно 120-130 Вт.

Но повторюсь - подбирать индивидуально. Все карты разные.

И в значении 

nvidia-smi

параметр pl не имеется ввиду суммарная мощность. Это мощность на одну карту! Просто если не указывать конкретную карту - то эта мощность будет установлена на все карты одинаковая.\

Т.е. например

sudo nvidia-smi -pl 120

установит на все карты в системе максимальную мощность в 120 Вт. (не суммарно, а на каждую)

Edited by 19alexrus71

Share this post


Link to post
Share on other sites

Еще если можно несколько вопросов:
1. Каков диапазон/границы разгона параметров «
"добавка к частоте чипа" и "добавка к частоте памяти"», я так понимаю,  это те диапазоны которые указаны в утилите «(NVidia XServer Settings)» (см. картинку вверху) для конкретного «level» в данном случае «3»?

2 с каким шагом изменять «"добавка к частоте чипа" и "добавка к частоте памяти"»?

3 Параметры «"добавка к частоте чипа" и "добавка к частоте памяти"» нужно изменять одновременно?
4 "
Даунвольт" в скрипте можно указать сразу,  т.е. на любые частоты, или его изменять нужно одновременно с изменением "частоты чипа" и "частоты памяти"?

5. Какие начальные значения выставлять у «"добавка к частоте чипа" и "добавка к частоте памяти"»?

 

Edited by Konstantin310

Share this post


Link to post
Share on other sites

1. Да.. Мин и максимум этих прибавок/смещений (offcet) - вам показывает утилита. В этих границах и можно эти значения задавать.

2. Шаг любой

3. Необязательно. Это независимые параметры. Один отвечает за частоту ядра (чипа), второй за частоту памяти. Например на картах с памятью Hynix память гонится очень плохо, а ядро вполне нормально.

4. Сначала нужно подобрать частоты. Без даунвольта. На дефолтной мощности. Добиться стабильной работы фермы. Чтобы не висли и не отваливались карты и программы майнеры не сыпали ошибок. Потом подбирать значение даунвольта. Можно начать с 80% от номинала и понемногу убавлять, ловя оптимальное значение, когда хешрейт начнет заметно падать - значит это предел и ниже опускать питание уже не стоит.

5. Нет единого рецепта. Абсолютно все карты разные. Лично я сначала гоню ядро при дефолтной памяти. А потом уже на разогнанном ядре гоню память. Можно методом деления пополам. Т.е. сначала добавляем половину от максимально возможного. Если не работает - убавляем на четверть. Работает - прибавляем одну восьмую, не работает - убавляем одну восьмую... Ну и т.д.

И так же с памятью.

Share this post


Link to post
Share on other sites

ЗЫ^ а вообще очень рекомендую воспользоваться поиском и посмотреть на этом форуме. Тут есть топики по разгону, где все подробно расписано и много раз пережевано

В основном обсуждается винда и MSI Afterburner, но разницы нет. Сам принцип разгона одинаков. что под виндой что под линуксом.

Edited by 19alexrus71

Share this post


Link to post
Share on other sites

1.

23 hours ago, 19alexrus71 said:

4. Сначала нужно подобрать частоты. Без даунвольта. На дефолтной мощности. Добиться стабильной работы фермы. Чтобы не висли и не отваливались карты и программы майнеры не сыпали ошибок. Потом подбирать значение даунвольта. Можно начать с 80% от номинала и понемногу убавлять

А я думал как раз, что от постоянства (не изменении) мощности (дефолтной), как раз у меня происходил переход от "level 3" к "level 2" при запуске майнинга. (Ведь при запуске машины он у меня "level 3" ("Editable performance level"), а при запуске майнинга становится "level 2" (см. рис. вверху))

2 как видно из картинки внизу, номинальная СРЕДНЯЯ мощность где-то 152Вт (исходя из 2-х одинаковых видеокарт). (а как мы знаем выделяемая мощность прямопропорциональна частоте работы карты), то я должен сначало увеличить мощность на 80%, это тогда будет где-то 273,6Вт. И тогда по вашим словам, я должен ее эксперементально понижать до стабильной работы. Правильно?

begin power.png

Edited by Konstantin310

Share this post


Link to post
Share on other sites

Не увеличивать! А уменьшать!

Стоковое значение питания зашито у вас 180 Вт. Как я писал оптимально 60-80% от номинала.

Т.е. получится ~ 110-150 Вт. 

О чем я вам и писал

В 15.11.2017 в 20:41, 19alexrus71 сказал:

С даунвольтом на 1070 надо давать примерно 120-130 Вт.

Т.е можно начинать от 150 Вт и постепенно понижать пока не увидите заметного снижения производительности. Это и будет оптимальный порог по питанию

Share this post


Link to post
Share on other sites

Просто при использовании cuda, драйвер нвидии переводит карту в режим P2, что отображается как предпоследний уровень в панели. В этом режиме частота памяти снижается на 400мгц. Пока способов побороть это на никсах я не видел, так что приходится костылить путём запуска отдельного приложения которое тупо использует cuda чтобы зарезервировать пару мегов памяти и больше ничего не делает.

Share this post


Link to post
Share on other sites
11 минуту назад, Shevchik сказал:

В этом режиме частота памяти снижается на 400мгц. Пока способов побороть это на никсах я не видел, так что приходится костылить путём запуска отдельного приложения которое тупо использует cuda чтобы зарезервировать пару мегов памяти и больше ничего не делает.

Есть такое дело. Пытался в свое время химичить разными способами - успехов не добился. Плюнул. Снижение производительности не настолько велико, чтобы сильно напрягаться.

Однако, все же интересно.

Можно поподробнее про рецепт с запуском отдельного приложения. Пусть костыльный способ. Но если он действенный - то тоже имеет право на жизнь

Share this post


Link to post
Share on other sites

Я просто написал свой мини хелпер для майнинга, вот он у меня и держит сам по себе cuda, чтобы видюхи всегда в p2 были, даже пока майнер дохлый. Будет время оставлю только держание cuda, и выложу сюда, ну или допилю таки и выложу целиком.

Share this post


Link to post
Share on other sites
3 минуты назад, Shevchik сказал:

Будет время оставлю только держание cuda, и выложу сюда, ну или допилю таки и выложу целиком.

Ок. Выложите конечно, когда будет готово. Если действительно будет работать, то и небольшой донат со стороны благодарных майнеров наверняка будет :)

Edited by 19alexrus71

Share this post


Link to post
Share on other sites

Хм... У меня при остановке майнера, опять level=3, такое впечатление, что карте не хватает выделяемой мощности...

Share this post


Link to post
Share on other sites
2 минуты назад, Konstantin310 сказал:

карте не хватает выделяемой мощности...

Всего ей хватает. И даже более чем.

Выше же человек только что написал

1 час назад, Shevchik сказал:

при использовании cuda, драйвер нвидии переводит карту в режим P2, что отображается как предпоследний уровень в панели

Это нормально. Так и должно быть. Незначительное снижение частоты работы памяти имеет место быть. Но на производительность влияет не сильно. Просто забейте

Share this post


Link to post
Share on other sites

разгон 1070 дал всего 5Mh/s разгона, 9% разгон карты - как-то не очень впечатляет... честно говоря,

Я расчитывал хотябы 20-30%%

Edited by Konstantin310

Share this post


Link to post
Share on other sites

Подскажите, может есть у кого то скрипт по автоматической регулировке PL при заданном значении температуры?

 

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...