21 Методики, тесты

Методики, технологии, идеи...


1. - Методика для выбора процессора под работу в связке программ 3ds max + V-ray

"метод Базовых Коэффициентов"
- Для прогноза времени рендера одним процессором используется
  сцена
L O N G test - V22
- сцена настроена таким образом, что самые тяжёлые участки находятся в начале
   рендеринга, и размер  бакета охватывает часть лёгких и часть тяжёлых для рендера участков.
- также сцена настроена под большинство функций макса и вирея, и настройки сделаны
  случайным образом, что исключает приоритет для какого-то одного количества ядер процессора.

Суть метода








Результаты прогнозов по методу "Базовых Коэффициентов" в сравнении с известными

методами CPU Queen, Benchmarks, CINEBENCH 11.5, NIX
Как видно из таблицы по методу "Базовых Коэффициентов"
погрешность в прогнозе времени рендера в пределах 2 % - светлосиние поля
и до 10% в  других методах - на красных полях
Дело в том, что мой метод учитывает усреднённо - стандартный набор
загрузки процессора, с учётом функций макса и вирея
(лайт кеш, ир мап, дисперсия, каустика и тд... - а они нелинейно грузят процессор).
Память на скорость рендера практически не влияет.
Видеокарта тоже (она влияет на моделирование - и важна для очень тяжёлых сцен)

В теории были следующие соображения

Есть много таблиц и программ сравнения производительности процессоров, они хороши
для дотошных и имеющих время выбирать.
А иногда надо навскидку прикинуть конкретное время рендера любой сценки, скажем в вирее, на разных процах.
Не вдаваясь в глубокие расчёты и подбор конфига, пользуюсь упрощённой таблицей.
1 Комлектующие не учитываю.
2 Архитектура процессоров учитывается в интерполированном коэффициенте

Итак, предположим, что у нас

- есть сцена со временем рендера 23мин 10сек (1390 cек)
- есть процессор q9550 @ 2.84
Прикидывать время будем для 2,4,6,8HT и тд ядерных процессоров - надо свести расчёт
к одному “чистому” Ghz, те за сколько один “чистый” Ghz отрендерит сцену
1390сек Х 4ядра Х 2.84Ghz = 15792сек
(не путать с режимами по отключению НТ, ядер, понижению частоты и тд - это условный для
дальнейших расчётов Ghz)

Теперь надо узнать за сколько времени будет отрендерена сцена, к примеру

6 ядерником с частотой 2.8Ghz -
15792с : 6я: 2.8@ = 940сек = 15мин 40 сек

Для core i7 c HT нужен коэффициент, тк виртуальные 8 ядер не могут быть реальными

Этот коэффициент 0.76
Процы core i7 с частотой 2.8 должны рендерить сцену так
15792с : 8я : 2.8@ : 0.76 = 927сек = 15м 28сек

Для того, чтобы не набивать все цифры, привожу всё к базовому числу, в котором учтены
количество ядер, коэффициент HT (для Core) и пересчёт в минуты

т.е.
15792:8:0.76 = 43.3м - это время, за которое отрендерили бы 8 ht ядер при 1Ghz частоты проца
Теперь всё просто, надо его разделить на частоту реальную т.е.

43.3/@ = время в минутах (не забываем десятичные доли переводить в секунды)

43.3/2.8 = 15.46 = 15м 28сек

и учесть разгон

При разгоне от 0 до 50% тоже есть понижающий коэффициент пропорционально от 1 до 0.9
Разогнанный проц 2.8 до 4@ соответственно должен дать время
43.3/ 4.0@ /0.94 = 11.51 = 11м 30сек

Для простоты расчётов по разным процессорам дам время рендера одного “чистого” Ghz

всеми ядрами следующих процессоров,с cоответствующими коэффициентами
-назовём его базовым.

Итак, для прогноза времени рендера данной сценки, делим на частоту проца

БАЗОВОЕ число(см. ВЫШЕ)

При сильно разогнанном проце ещё делим на коэфф от 1 при номинале до 0.9 при 

разгоне +50% . Промежуточные значения - по линейной интерполяции.

Ну, и теперь, вернувшись к первоначальному замыслу прогнозирования времени любой сцены
на этих процах:


Имеете время Вашей сцены, на скажем, любом кваде @ 3.0Ghz - 233 минуты

А время рендера этой тестовой сцены test NEO max 2011 на нём 23.3минуты
Хотелось бы знать, за сколько эту сцену отрендерит новый комп, к примеру на базе
AMD 1090 3.2Ghz ?
1 Базовое число возростёт пропорционально времени рендера то есть с 70 в таблице - до 700 - для Вашей сцены
2 соответственно базовые числа перечисленных процов возрастатут пропорционально.
3 Для 6 ядерников - это 450, делим на частоту проца 3.2 = получаем 140 минут.

Остальное - аналогично.

Понятно, что на скорость будут влиять комлектующие и другие факторы.
Так вот, можно и оценить качество сборки и сравнить цену при выборе компа, конкретно под рендер.

                         ТАБЛИЦА ПРОГНОЗОВ ВРЕМЕНИ РЕНДЕРА

                                     (ФОРМУЛЬНОЕ И РЕАЛЬНОЕ)










2. -  Ещё одна сцена для тестирования и сравнения времени рендера процессорами,
       но уже и для сетевого рендеринга (distributed) 

       Ссылка на файл LDR       

LDR+FARM+LONG тесты


                                    Test results  LDR - 

                Время рендера сцены для max Vray 


Для V-ray 3 - адаптированная сцена, с совпадением времени рендера на V-ray 2

LDR v3embree


Для V-ray 3.2 - адаптированная сцена, с совпадением времени рендера на V-ray 2, V-ray 3
LDR FARM-32

Сцены под новые виреи 

- всё более тяжёлые, потому что сами вирейщики оптимизируют использование инструкций и самих движков, ускоряя время рендеринга.
То есть производительность проца, как такового не меняется,
и поэтому показатель - время рендера, является показателем производительности CPU, а точнее конфига 
и время я адаптирую под старые версии вирея.

Большой разброс результатов на одном проце - не является погрешностью тестирования в "чистоте". 

Это производительность, что зависит от разгона и частоты не только проца 
- а и NB HT шины, памяти - сокращения таймингов. 
К тому же кроме "троттлинга" проца
есть такое понятие как материнские

"overload protection" (OP) - это защиты мамы от перегрузок. 


Они периодически включаются, когда токи или температуры на системе(не только проце)

превышают порог, устанавливаемый мамой - по VID процессора. 
Если нет троттлинга проца, не мелькают подключения ""overload protection", - одинаковый разгон КП, и всего с ним по шине, на одной винде и её настройках 
- то отклонений от времени рендера не будет до 1% 






















i7 3770k @3700(def) - в Врее 2.40 - время 14м 00 с



LDR v3embree8350@4000def = 13 20

3. NEW!!!

Легкая сцена "минутка" LDReasy - для проверки производительности в пробах или просто быстрого теста макса-врея

Сцена "минутка"- процессоры i7 3770k и FX 8350 - по умолчанию 

одинаково рендерят её за 60 секунд

LDR easy


 amd1090@3504 219x16 nb-ht 2846 1.32v  mem 1460 tim7-7-7-16 = 67, 9 sek

ДЛЯ РЕНДЕР-ФЕРМ (СЕТЕВОГО РЕНДЕРИНГА) СЦЕНА   

LDR FARM  - самая тяжёлая сцена для больших тягачей!!!


LDR FARM



Сценка для Vray 3- c включённым embree и высоким приоритетом, подогнанная под время LDR FARM и LDR FARM emb

LDR FARM emb on

Для V-ray 3.2 - адаптированная сцена, с совпадением времени рендера на V-ray 2, V-ray 3


LDR FARM-32









Таблица времени рендера сцены LDR FARM - 2 MAY 2015












Для 8 ядерных вишер методом интерполяции построен такой график времени рендеринга в зависимости от разгона



4.

Cцена для выбора видеокарт в связке 3ds max 2013 + V-Ray

Цель теста - 
определить реальный комфорт работы в максе, 
настройки вьюпортов - по умолчанию.
Сцена довольно тяжёлая.

Результаты - показывают реальную производительность видеокарты
 в КОНКРЕТНОЙ программе, 
заметно отличаются от общих бенчей - по абсолютной производительности,
поэтому на них можно ориентироваться только для работы в максе-вирее.

 
Tестим т MAX 2013-2014, 
1 Realistic
2 Wireframe
3 Shaded
4 Shaded+Edges
5 Cinebench 11 5 - для контроля Open GL


1 Открываем файл, ничего не меняя, по умолчанию во вьюпорте realistic
2 Жмём play в анимации
3 Запоминаем среднее значение Realistic fps, после минутного прогона теста.
4 Переключаем на Wireframe - тоже фиксируем fps после минуты прогона (очень важен для моделлинга)
5 То же для Shaded и Shaded+Edges


Для таблицы - 4 результатов в3DSmax - средние значения 

по ним расчитан средний БАЛЛ

и по-желанию - для сравнения

- Сinebench 11 5
- 3Dmakk 11 

Важен стиль Windows - в персонализации

Вот Radeon HD 6850 и CPU i7 3770k по умолчанию

                                                                      VideoTest20Mln

Таблица - по среднему баллу 





 

 

Video Test 24mln(sten)

FX8320@3.7 mem 2147 - HD Radeon 6850 (850)

  Video Test 20mln 

FX8320@3.7 mem 2147 - HD Radeon 6850 (850)

 


 

 

 

- Cцена для выбора видеокарт в связке 3ds max + V-Ray

тяжёлая сцена 100 миллионов полигонов - довольно редко в практичекой работе архитектора

тестирование видеокарт Fps 100. 000 000 polys

Fps 100 MLN

                                              ТАБЛИЦА 100 MLN















5. -Cцена для выбора видеокарт в связке 3ds max + V-Ray

средняя сцена 10 миллионов полигонов - в основном в практической работе архитектора
сцены менее этой.
 
тестирование видеокарт FPS  10. 000 000 polys
FPS 10 000 000 nitrous



                                             ТАБЛИЦА 10 MLN







скрины видеокарты Radeon HD 6850









Разгон процессора amd 1090 и видеокарты Radeon HD 6850


Разгон процессора amd 1090 до 4.16 Ghz


6. - CЕТЕВОЙ РЕНДЕРИНГ
      Последовательность настройки сетевого рендеринга на нескольких компьютерах



7. - Разгон процессоров (overclocking the CPU)

 

AMD Phenom IIX6 1090T - кулер Cooler Master Hyper 212 Plus RR-B10-212P
AMD Phenom IIX6 1055 - кулер Cooler Master Hyper 212 Plus RR-B10-212P

Разгон - это риск, хоть и небольшой -  и не все CPU гонятся одинаково.


Во своим - скажу следующее


1 Без поднятия напряжения частота стабильная 3.5 - множитель 17.5 у 1090 или 250 по шине у 1055

2 Стабильная работа с поднятием напряжения- частоты не выше 4.0 - как повезёт
3 Максимальные частоты - в настройках ниже есть - компы проходят тесты, но работа нестабильна
4 Для сетевого рендеринга рекомендую частоту 3.5 - с напряжением по умолчанию,
    либо 3.7-3.9 с наряжением 1.45 -1.475
5 Да - температуру датчики Core Temp показывают ниже, чем на самом деле градусов на 12.
6 Темпреатура стабильной работы по ним у меня не превышала 43 градуса
7 Некоторые настройки для разгона












8. КОЭФФИЦИЕНТ  ЭКОНОМИЧНОСТИ ПРОЦЕССОРОВ 
МЕТОДИКА КОРРЕКТИРОВКИ РАСЧЁТА TDP cpu ДЛЯ КОНКРЕТНОГО ПРОЦЕССОРА

Производительность при одном потреблении энергии CPU

Оптимум для AMD Phenom II 1090@3.5






п81

AMD Phenom II 6сore  
- на частоте 3.5 (25% разгон без подъёма напруг) берут
127wt  - 1090 
139wt -  1055
 

Intel Core i7-3770K Ivy Bridge
- в таком же 25% процентном разгоне 
- те на удобной и стабильной для него частоте 4.375,   
155wt  - i7-3770K

AMD Phenom II 1090 -   155WT - на частоте 3.75 


Рекомендованные БП д - 550wt ,

-В сценах макс-вирей

Сравнение реальной производительности при равном энергопотреблении 127Wt

AMD Phenom II 1090@3.50  - LDR FARM test = 48м 17с = 48.1
Intel Core i7 3770k @4.0         - LDR FARM test = 35m 30c = 35.5
 35.5/48.1 = 73.8%
 Сравнение реальной производительности при равной частоте СPU
AMD Phenom II 1090@3.40  - LDR FARM test = 48м 17с = 48.1
Intel Core i7 3770 @3.4          - LDR FARM test = 41m 30c = 41.5
 41.5/48.1 = 86.3%

965@4000 vs 8320@4700

9- AMD FX 8320 VS AMD Phenom 1055 Процессоры тестировались на одном железе

 

ASUS M5A  88-m evo  (am3/am3+)
8GB Team Elite (TED34096M1600HC11) 1600Mhz
CoolerMaster Hyper 212 Plus (RR-B10-212P-GP)
OCZ Vertex 2   60gb
Chieftec A-80 CTG-550-80P



10  Напряжения на CPU







 

11 Bench - Black Hole









  12 cinebench11,5

13 Super PI mod 1.5

14 Конвертация MOV to AVI (H264)

MOV

Инсталлячим  avidemux_2.6.1_win64

и по настройкам скриним ближе к концу


                    MovAvi FX8320 @3.8 = 48.2cek

Сравнение i7 3770k @ 4000 и fx8320@4000 в видеоконверте 7 роликов мov в avi H264




15 Настройки FX 8320









  16 Cкорость загрузки систем на базе айвика и вишки

-  1  Перезагрузка Win7 - 24cек, загрузка Max 2013 - 14cек
cpu i7 3770k @3.7
mb Z77MA-G45(MS-7759), 
ssd OCZ vertex 2   275mb/s - read 285 mb/s  ddr3 1600 8gb, sata II
ddr3 Team elite 1600mhz 11-11-11-28, 8Gb,

-  2  Перезагрузка Win7 - 41cек, загрузка Max 2013 - 18cек
cpu FX 8320@4.4
mb ASUS M5A  88-m evo,  
ssd KINGSTON hyper X SH103S3120G   510mb/s - read 525 mb/s sata III
ddr3 Corsair CMX4GX3M2A2000C8 1600mhz 9-9-9-24, 8Gb, 

                                               скрин реализации скоростей чтения SSD

17 - системы охлаждения - принцип отвода тепла
Чем ближе окружающая температура к критической - тем меньше эффективность системы охлаждения.
А именно - если температура окружения 70 градусов - НИКАКОЙ СИСТЕМОЙ ОХЛАЖДЕНИЯ нельзя обеспечить температуру CPU - ниже 70 градусов.
(речь о 100% кулеров - как вода , так и воздух)
ТЕ CPU - сдох...(чья max темпа 70)

И если кулер даёт 50% отвод тепла (к примеру)

- то это значит
1 при окружающей темпе 20 - а критической 70 = 45
2 при окружающей темпе 40 - а критической 70 = 55
3 при окружающей темпе 60 - а критической 70 = 65
(при условии отсутствия компенсации потерь эффективности наращиванием оборотов -
но это программный аспект, а не физический, и никакого отношения к принципу
потери эффективности систем охлаждения - не имеет)

В результате

1 в первом случае - кулер отвёл 25 градусов
2 во втором - 15.
3 в третьем 5.
То есть эффективность отвода тепла снижается нелинейно 
и стремится к нулю при сокращеннии
зазора между температурой окружающего воздуха и Tmax - стабильной работы CPU.
(надеюсь, что понятно, есть расчёты - а объяснение на "пальцах" - градусах, для быстроты восприятия сути явления.)
17 Cinebench 11.5


Cinebench 11,5 + 15   Asus + Gigabyte = ALL

18 сравнение VID fx8320 vs 8350

минимум Vcore для 8320@4000
OCCT FX8350@4825
Gigabyte 970A UD3





















процессор с высоким 1.413v VID


максимальное напряжение
минимальное напряжение


19 Таблица результатов нагрева  CPU amdFX (vishera) - влияния VID  и систем охлаждения








20 CORONA

                       Для определения времени рендера в CORONA, сценка

                                                      V- corona test LDR

Intel i7 3770k def




from Kevin skreen VID 1.413















VRM


Охлаждение цепей питания




Разгон AMD FX8320@4625 mb AsusM5A 88M-evo

Cooler Zalman10performa.
Вентилятор на обдув цепей питания 80мм под MB,
120мм на MB,80мм - на задней стенке.
Температура в комнате 24 градуса, у системного блока - 22 градуса.
Видео
LDR tests 8230@4625

https://www.youtube.com/watch?v=Fo-1Gs1qKTA

скрин 8320@4700






Почему VID и TDP? Потому что это характеристики имеющие отношение к температурам в разгоне.
Как увязать VID и TDP в полной штатной нагрузке?
1. VID – как неизменяемая характеристика CPU, обеспечивающая стабильную работу CPU в номинале
2. ТDP – как предельная величина отвода тепловой мощности
– зависит от подводимой мощности на СPU - зависит от силы тока, потребляемого каждым процессором в 100% нагрузке и напряжения Vcore,  что задаёт материнка, идентифицировав VID.
3. При этом напряжение должно уложиться в рамки подаваемой мощности на СPU,
Чтобы отводимая мощность не превысила заявленный параметр TDP.
4. VID, а значит и Vcore не может быть больше величины, превышающей подводимую мощность.
Но может быть меньше, при условии стабильной работы процессора, а значит и мощность,
подводимая к процу, и зависящие от неё значения TDP.
5. Важно то, может ли процессор стабильно работать на напряжении, ниже VID.
Силу тока изменить нельзя – она является уникальной и разной для каждого экземпляра.
6. Если напряжение нельзя выставить ниже, чем VID, без потери стабильности и производительности,
то это значит, что потребляемая мощность (и TDP) на максимуме.
И  VID жёстко фиксирован по TDPБез запаса по понижению TDP.
7. И тогда из 2х процов с разными видами, сила тока будет меньше там, где вид выше.
8. Если же напряжение можно выставить ниже без потери стабильности,
то это опять таки значит, что VID выставлен не по проверке стабильности,
а по максимуму TDP, то есть VID жёстко фиксирован по TDP и в этом случае.
9. Но TDP, а значит и подводимая мощность у процов одной модели в реальности разные,
И температуры при всех прочих равных условиях – разные. Почему?
10. Потому что есть у каждого проца своя дельта – разница между VID и напряжением, достаточным для стабильной работы. И ещё потому, что сила тока у процов разная, а большая в разгоне растёт линейно
И график роста выглядит круче, для процов с большей силой тока при меньшем VID
График по десяткам тестов, сведённый и фиксируемый датчиками
ТЕМПЕРАТУР одного конфига в равных условиях - процессор с низким VID - 1.288 и высоким 1.375
В перспективе при увеличении количества ядер будет расти сила тока и цепи питания будут перегреваться. Либо техпроцесс позволит держать амперы в разумных пределах - либо напряжение питания процессора, 
то есть и VID - должны быть высокими. 






Графики расчётов по теории VID и пересчёта данных с реальных замеров, предоставленных
IN - в ветке процессоры FX






Про низкие температуры, теорию "ОР" (overload protection)

и прогоны LinX - В УСЛОВИЯХ, когда ОР - исключён

***


Задача - теоретический порог FX в конфиге на Giga970A UD3, память 1600cl11

Итак - пониженная частота - 8350@2511,
температуры обеспечены низкие, обдув мой скриновый...
То есть - ОР исключён,
и если он не будет срабатывать в разгоне,
то теоретически должно быть без троттлинга проца и срабатывания "overload protection" на этом конфиге
LinX = 61.7гф - что в пересчёте на
4018 (штатная для гиги97) = 98.7гф @5022 = 123.4гф
LinX = 61.3гф - что в пересчёте на
4018 (штатная для гиги97) = 98.1гф @5022 = 122.6гф
Проверяю на половине ядер @4018= 48гф - в пересчёте на 8 ядер@4018 =96, на частоту @5022 = 120гф
То же на 2 ядрах @4922 = 29.31гф
в пересчёте на 4018 = 24гф - умножаем на 4 (все ядра) - получаем 96гф
пересчитываем на 5022 = 120гф




Spire CoolGate 2.0 SP988N1-V3-PWM

Почему упала цена? Кулер у многих показал характеристики гораздо ниже ожидаемых.


for 5 minutes and the temperature was 4-5 degrees lower. Screenshots

FX8350@4612 - до исправления инженерной недоработки


FX8350@4612 - после исправления инженерной недоработки






Признаков деградации не вижу за 4 года эксплуатации высоковидового проца при напряжениях 1.56 - 1.62v и частотах 4800-5000




4 комментария:

  1. Спасибо за ваш труд - просто супер!!!

    ОтветитьУдалить
    Ответы
    1. Sten - тебе спасибо за столько точных и обстоятельных рендертестов

      Удалить