Ich weiß du kannst HÄRTER!
[Blockierte Grafik: http://www.umluex.at/bilder/anime/ahegao.jpg]
Ich weiß du kannst HÄRTER!
[Blockierte Grafik: http://www.umluex.at/bilder/anime/ahegao.jpg]
launch_x265benchmark aufgerufen um 16:17 am 22.02.2017!
Prüfe, ob die VC++ 2010 Laufzeitumgebung installiert ist!
VC++ 2010 Laufzeitumgebung gefunden, OK
WARNUNG: launch_x265benchmark läuft im Debugmodus Level 1!
Fehlertoleranz aktiv, Debugmeldungen deaktiviert!
Prüfe Betriebssystemarchitektur!
AMD64, OK
Prüfe freien Speicherplatz auf C:!
22456MiB, OK
Prüfe verfügbaren Arbeitsspeicher!
68714MiB, OK
Modernes Betriebssystem erkannt (Windows 7 oder neuer), NUMA aktiviert!
Verwende modernen x265 Encoder!
Verifiziere SHA-512 Prüfsummen!
ffmpeg.exe................. OK
input.h265................. OK
launch_x265benchmark.bat... OK
transcoder.bat............. OK
x265-NT6.1+.exe............ OK
Erzeuge CPU-Z Systemreport im Hintergrund...
Starte x265 Benchmark!
input.h265: 10-bit YUV 4:2:0 HEVC, 1280x720 [16:9], 29.970fps [30000/1001]
y4m [info]: 1280x720 fps 24000/1000 i444p12 sar 1:1 unknown frame count
raw [info]: output file: .\temporary-output\pass1.h265
x265 [info]: HEVC encoder version 2.3+2-912dd749bdb5
x265 [info]: build info [Windows][MSVC 1600][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZ
CNT BMI2
x265 [info]: Main 4:4:4 10 profile, Level-4 (Main tier)
x265 [info]: Thread pool 0 using 56 threads on numa nodes 0
x265 [info]: Slices : 8
x265 [info]: frame threads / pool features : 6 / wpp(45 rows)+pmode+pme
x265 [info]: Thread pool 0 using 8 threads on numa nodes 0
x265 [info]: Coding QT: max CU size, min CU size : 16 / 8
x265 [info]: Residual QT: max TU size, max depth : 16 / 3 inter / 3 intra
x265 [info]: ME / range / subpel / merge : star / 57 / 4 / 4
x265 [info]: Keyframe min / max / scenecut / bias: 24 / 250 / 40 / 5.00
x265 [info]: Lookahead / bframes / badapt : 40 / 16 / 2
x265 [info]: b-pyramid / weightp / weightb : 1 / 1 / 1
x265 [info]: References / ref-limit cu / depth : 6 / off / on
x265 [info]: AQ: mode / str / qg-size / cu-tree : 2 / 1.0 / 16 / 1
x265 [info]: Rate Control / qCompress : ABR-10000 kbps / 0.75
x265 [info]: tools: rect amp limit-modes rd=6 rdoq=1 psy-rdoq=5.00 rskip
x265 [info]: tools: signhide tmvp b-intra lslices=4 lthreads=8 slices=8 deblock
x265 [info]: tools: stats-write
x265 [info]: frame I: 2, Avg QP:10.71 kb/s: 11197.34
x265 [info]: frame P: 7, Avg QP:10.59 kb/s: 9043.61
x265 [info]: frame B: 21, Avg QP:14.94 kb/s: 3808.44
x265 [info]: Weighted P-Frames: Y:0.0% UV:0.0%
x265 [info]: Weighted B-Frames: Y:0.0% UV:0.0%
x265 [info]: consecutive B-frames: 33.3% 11.1% 11.1% 11.1% 0.0% 33.3% 0.0% 0.0%
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%
encoded 30 frames in 14.49s (2.07 fps), 5522.57 kb/s, Avg QP:13.64
Pass 1 erledigt, starte Pass 2:
y4m [info]: 1280x720 fps 24000/1000 i444p12 sar 1:1 unknown frame count
raw [info]: output file: .\temporary-output\pass2.h265
x265 [info]: HEVC encoder version 2.3+2-912dd749bdb5
x265 [info]: build info [Windows][MSVC 1600][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZ
CNT BMI2
x265 [info]: Main 4:4:4 10 profile, Level-4 (Main tier)
x265 [info]: Thread pool 0 using 56 threads on numa nodes 0
x265 [info]: Slices : 8
x265 [info]: frame threads / pool features : 6 / wpp(45 rows)+pmode+pme
x265 [info]: Thread pool 0 using 8 threads on numa nodes 0
x265 [info]: Coding QT: max CU size, min CU size : 16 / 8
x265 [info]: Residual QT: max TU size, max depth : 16 / 3 inter / 3 intra
x265 [info]: ME / range / subpel / merge : star / 57 / 4 / 4
x265 [info]: Keyframe min / max / scenecut / bias: 24 / 250 / 40 / 5.00
x265 [info]: Lookahead / bframes / badapt : 40 / 16 / 2
x265 [info]: b-pyramid / weightp / weightb : 1 / 1 / 1
x265 [info]: References / ref-limit cu / depth : 6 / off / on
x265 [info]: AQ: mode / str / qg-size / cu-tree : 2 / 1.0 / 16 / 1
x265 [info]: Rate Control / qCompress : ABR-10000 kbps / 0.75
x265 [info]: tools: rect amp limit-modes rd=6 rdoq=1 psy-rdoq=5.00 rskip
x265 [info]: tools: signhide tmvp b-intra lslices=4 lthreads=8 slices=8 deblock
x265 [info]: tools: stats-read
x265 [info]: frame I: 2, Avg QP:5.58 kb/s: 17213.28
x265 [info]: frame P: 7, Avg QP:7.10 kb/s: 11849.88
x265 [info]: frame B: 21, Avg QP:10.02 kb/s: 6200.05
x265 [info]: Weighted P-Frames: Y:0.0% UV:0.0%
x265 [info]: Weighted B-Frames: Y:0.0% UV:0.0%
x265 [info]: consecutive B-frames: 33.3% 11.1% 11.1% 11.1% 0.0% 33.3% 0.0% 0.0%
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%
encoded 30 frames in 12.73s (2.36 fps), 8252.56 kb/s, Avg QP:9.04
Schreibe Systembericht in .\RESULTS.txt...
Multiplexe Ausgabe zu MKV Videocontainerdatei
'.\temporary-output\output.mkv' für Wiedergabetests... OK
Die ungefähre Abschlußzeit war 16:17 am 22.02.2017. Die temporären
Dateien in '.\temporary-output\' können nach Wunsch gelöscht werden.
Das Ergebnis kann nun aus der Datei '.\RESULTS.txt' ausgelesen werden!
Drücken Sie eine beliebige Taste . . .
Alles anzeigen
muss wohl so sein. CPU-Z erkennt den Manufacturer String auch nicht.
hier mein test:
Prüfe, ob die VC++ 2010 Laufzeitumgebung installiert ist!
VC++ 2010 Laufzeitumgebung gefunden, OK
launch_x265benchmark aufgerufen um 10:46 am 21.02.2017!
Prüfe Betriebssystemarchitektur!
AMD64, OK
Prüfe freien Speicherplatz auf C:!
22170MiB, OK
Prüfe verfügbaren Arbeitsspeicher!
68714MiB, OK
Verifiziere SHA-512 Prüfsummen!
ffmpeg.exe................. OK
x265.exe................... OK
input.h265................. OK
launch_x265benchmark.bat... OK
transcoder.bat............. OK
Starte x265 Benchmark!
input.h265: 10-bit YUV 4:2:0 HEVC, 1280×720 [16:9], 29.970fps [30000/1001]
y4m [info]: 1280x720 fps 30000/1001 i420p8 sar 1:1 unknown frame count
raw [info]: output file: .\temporary-output\pass1.h265
x265 [info]: HEVC encoder version 2.2+30-fa52b516f5ff
x265 [info]: build info [Windows][MSVC 1600][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZ
CNT BMI2
x265 [info]: Main 10 profile, Level-4 (Main tier)
x265 [info]: Thread pool created using 56 threads
x265 [info]: Slices : 8
x265 [info]: frame threads / pool features : 6 / wpp(45 rows)+pmode+pme
x265 [info]: Thread pool created using 8 threads
x265 [info]: Coding QT: max CU size, min CU size : 16 / 8
x265 [info]: Residual QT: max TU size, max depth : 16 / 3 inter / 3 intra
x265 [info]: ME / range / subpel / merge : star / 57 / 4 / 4
x265 [info]: Keyframe min / max / scenecut / bias: 25 / 250 / 40 / 5.00
x265 [info]: Lookahead / bframes / badapt : 40 / 16 / 2
x265 [info]: b-pyramid / weightp / weightb : 1 / 1 / 1
x265 [info]: References / ref-limit cu / depth : 6 / off / on
x265 [info]: AQ: mode / str / qg-size / cu-tree : 3 / 1.0 / 16 / 1
x265 [info]: Rate Control / qCompress : ABR-500 kbps / 0.75
x265 [info]: tools: rect amp limit-modes rd=6 psy-rd=1.60 rdoq=1 psy-rdoq=5.00
x265 [info]: tools: rskip signhide tmvp b-intra lslices=4 lthreads=8 slices=8
x265 [info]: tools: deblock stats-write
x265 [info]: frame I: 2, Avg QP:35.03 kb/s: 1850.71
x265 [info]: frame P: 7, Avg QP:46.64 kb/s: 652.66
x265 [info]: frame B: 21, Avg QP:48.98 kb/s: 353.33
x265 [info]: Weighted P-Frames: Y:0.0% UV:0.0%
x265 [info]: Weighted B-Frames: Y:0.0% UV:0.0%
x265 [info]: consecutive B-frames: 33.3% 11.1% 11.1% 11.1% 0.0% 33.3% 0.0% 0.0%
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%
encoded 30 frames in 26.79s (1.12 fps), 523.00 kb/s, Avg QP:47.50
Pass 1 erledigt, starte Pass 2:
y4m [info]: 1280x720 fps 30000/1001 i420p8 sar 1:1 unknown frame count
raw [info]: output file: .\temporary-output\pass2.h265
x265 [info]: HEVC encoder version 2.2+30-fa52b516f5ff
x265 [info]: build info [Windows][MSVC 1600][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX AVX2 FMA3 LZ
CNT BMI2
x265 [info]: Main 10 profile, Level-4 (Main tier)
x265 [info]: Thread pool created using 56 threads
x265 [info]: Slices : 8
x265 [info]: frame threads / pool features : 6 / wpp(45 rows)+pmode+pme
x265 [info]: Thread pool created using 8 threads
x265 [info]: Coding QT: max CU size, min CU size : 16 / 8
x265 [info]: Residual QT: max TU size, max depth : 16 / 3 inter / 3 intra
x265 [info]: ME / range / subpel / merge : star / 57 / 4 / 4
x265 [info]: Keyframe min / max / scenecut / bias: 25 / 250 / 40 / 5.00
x265 [info]: Lookahead / bframes / badapt : 40 / 16 / 2
x265 [info]: b-pyramid / weightp / weightb : 1 / 1 / 1
x265 [info]: References / ref-limit cu / depth : 6 / off / on
x265 [info]: AQ: mode / str / qg-size / cu-tree : 3 / 1.0 / 16 / 1
x265 [info]: Rate Control / qCompress : ABR-500 kbps / 0.75
x265 [info]: tools: rect amp limit-modes rd=6 psy-rd=1.60 rdoq=1 psy-rdoq=5.00
x265 [info]: tools: rskip signhide tmvp b-intra lslices=4 lthreads=8 slices=8
x265 [info]: tools: deblock stats-read
x265 [info]: frame I: 2, Avg QP:38.26 kb/s: 1383.78
x265 [info]: frame P: 7, Avg QP:44.42 kb/s: 713.25
x265 [info]: frame B: 21, Avg QP:48.13 kb/s: 360.57
x265 [info]: Weighted P-Frames: Y:0.0% UV:0.0%
x265 [info]: Weighted B-Frames: Y:0.0% UV:0.0%
x265 [info]: consecutive B-frames: 33.3% 11.1% 11.1% 11.1% 0.0% 33.3% 0.0% 0.0%
0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%
encoded 30 frames in 25.27s (1.19 fps), 511.07 kb/s, Avg QP:46.60
Schreibe Systembericht in .\RESULTS.txt...
Keine Instanzen verfügbar.
Die ungefähre Abschlußzeit war 10:47 am 21.02.2017. Die temporären
Dateien in `.\temporary-output\´ können nach Wunsch gelöscht werden.
Das Ergebnis kann nun aus der Datei `.\RESULTS.txt´ ausgelesen werden!
Drücken Sie eine beliebige Taste . . .
Alles anzeigen
shooock! kuma shock!
da bencht man haufenweise kisten und vergisst auf seine eigene (mit aktueller taktung). der vollständigkeit halber also:
48:45.891 | X | 1/4/8 | Umlüx | Intel Core i7-2600K 3.40GHz @ 4.30GHz | 16GB DDR-III/1600z | ASUS P8Z68-V | Windows 10 pro x64 (Offical r2705 Build)
1:27:51.222 | X | 1/4/8 | Umlüx | Intel Core i7-2600K 3.40GHz @ 4.30GHz | 16GB DDR-III/1600z | ASUS P8Z68-V | Windows 10 pro x64
so!
wir haben eh schon drüber gesprochen thrawn, deine binary hats leider nicht gebracht. dennoch danke für die mühe.
was mich schlussendlich weitergebracht hatte war Node Interleaving im bios. er lastete zwar großteils weiterhin nur die hälfte der zur verfügung stehenden threads voll aus, sprang aber zwischendurch immer wieder auf bis auf 90% auslastung hoch.
und was ausserdem noch einen starken schub verschafft hat, war das deaktivieren von HyperThreading. nur die physikalischen cores gut auszulasten scheint in diesem szenario wesentlich günstiger auf den x264 code zu wirken als einen ganzen haufen threads zur verfügung zu haben.
ebenfalls noch interessant: Server2016 war durchwegs und reproduzierbar um die 10 sekunden langsamer als Windows7 unterwegs
ich will aber nicht lange herumreden, hier die ergebnisse:
00:38:37.774 | X | 2/16/32 | Umlüx | Intel Xeon E5-2683 v4 2.10 GHz | 256GB DDR4 2400MHz |ProLiant BL460c Gen9 (ID6F00) | Windows 7 pro x64
00:16:35.234 | X | 2/16/32 | Umlüx | Intel Xeon E5-2683 v4 2.10 GHz | 256GB DDR4 2400MHz |ProLiant BL460c Gen9 (ID6F00) | Windows 7 pro x64 (offz. r2705)
00:12:45.399 | X | 2/16/32 | Umlüx | Intel Xeon E5-2683 v4 2.10 GHz (HT off) | 256GB DDR4 2400MHz |ProLiant BL460c Gen9 (ID6F00) | Windows 7 pro x64 (offz. r2705)
wärend ich noch den server in die mangel nehme, gibts zwischendurch noch eine kleinigkeit:
die prozessorfrequenz ist bei der cpu ein wenig kompliziert. angegeben ist sie mit 1,90-3,00GHz
ich gebe mal die an, die er mehr oder weniger über den ganzen bench lange halten konnte
04:13:19.687 | X | 1/2/4 | Umlüx | Intel Core i7-3517U 2,7GHz | 4GB DDR3-800 | Asus Zenbook Prime (Intel HM76) | Win10 pro x64
02:22:14.709 | X | 1/2/4 | Umlüx | Intel Core i7-3517U 2,7GHz | 4GB DDR3-800 | Asus Zenbook Prime (Intel HM76) | Win10 pro x64 (r2705)
und noch eine kleinigkeit von mir. leider nicht ganz ohne kopfzerbrechen:
00:45:18.021 | X | 2/16/32 | Umlüx | Intel Xeon E5-2683 v4 2.10GZh @ 2.58GHz| 256GB DDR4 2400MHz |ProLiant BL460c Gen9 (ID6F00) | Windows Server 2016 Trial
00:21:26.713 | X | 2/16/32 | Umlüx | Intel Xeon E5-2683 v4 2.10GZh @ 2.58GHz| 256GB DDR4 2400MHz |ProLiant BL460c Gen9 (ID6F00) | Windows Server 2016 Trial (offz. r2705)
der benchmark hat hier nur 32 threads verwendet. bios/windows zeigt aber brav alle 64 an? ich hab leider keine ahnung woran das liegen könnte. ich habe es parallel dazu auch mit einem Server 2008 R2 Enterprise versucht - selbes ergebnis. kann es sein, dass man eine noch dickere version braucht (z.b. datacenter) um alle threads auszulasten?
hat dazu jemand eine idee?
wie funktioniert das? läuft das in einer schleife für alle dateien durch? oder wird der code für jede datei extra aufgerufen?
die aller primitivste und schnellste lösung wäre wohl einfach den letzten dateinamen in einer weiteren variable abzuspeichern und dann per if mit dem aktuellen dateinamen zu vergleichen. unterscheiden sie sich, setzt du die zählervariable zurück.
echte männer verlieren keine haare
sie rutschen mit dem alter nur nach unten und werden zum bart!
mein neues zuhause: ein thermaltake core v41
eigentlich nichts besonderes. nichts verändert. ich wollte nur GATs überflüssigen 140mm noctuas ein zuhause bieten
[Blockierte Grafik: http://www.umluex.at/bilder/tt_core_v41/IMG_7639.jpg]
[Blockierte Grafik: http://www.umluex.at/bilder/tt_core_v41/IMG_7641.jpg]
[Blockierte Grafik: http://www.umluex.at/bilder/tt_core_v41/IMG_7646.jpg]
[Blockierte Grafik: http://www.umluex.at/bilder/tt_core_v41/IMG_7644.jpg]
so, von mir gibts jetzt auch wieder mal was neues da wir frische hardware bekommen haben und ich jetzt zugriff auf ein paar threads mehr habe. genauer gesagt 40 davon! das wird auch gleich ein netter test, wie gut der x264 codec skaliert.
das system ist ein HP Blade BL460c Gen8 in einem c7000 blade center und verfügt über zwei E5-2660 v2 und 128GB RAM.
für die die es interessiert: drei davon werden künftig unsere Citrix XenDesktop virtualisierung befeuern.
aussehen tut es schonmal sehr nett!
[Blockierte Grafik: http://www.umluex.at/bilder/x264/2.JPG]
[Blockierte Grafik: http://www.umluex.at/bilder/x264/1.JPG]
aber aussehen gewinnt natürlich keinen blumentopf. schauen wir mal, was das unterm strich bringt. erstmal lassen wir den vanilla bench laufen, so wie GAT ihn zusammengestellt hat.
man merkt schon, die inzwischen etwas ältere x264 binary hat merkliche probleme soviele threads voll auszulasten. und der takt der cpu ist nicht sonderlich hoch.
[Blockierte Grafik: http://www.umluex.at/bilder/x264/3.JPG]
[Blockierte Grafik: http://www.umluex.at/bilder/x264/4.JPG]
damit haben wir das erste ergebnis:
0000:58:27.353 | Umlüx | 2/10/20 | Intel Xeon E5-2660 v2 2.2GHz | 128GB Reg. ECC DDR-III/1066 | HP BL460 G8 | Win7 x64 pro
damit geben wir uns aber noch nicht zufrieden und setzen der maschine mal den neuesten r2538 x64 build vor.
und hier läufts schon deutlich besser. alle threads sind mehr oder weniger gut ausgelastet und die cpu gibt richtig gas!
[Blockierte Grafik: http://www.umluex.at/bilder/x264/5.JPG]
[Blockierte Grafik: http://www.umluex.at/bilder/x264/6.JPG]
kann man, denke ich, so stehen lassen:
0000:21:53.319 | Umlüx | 2/10/20 | Intel Xeon E5-2660 v2 2.2GHz | 128GB Reg. ECC DDR-III/1066 | HP BL460 G8 | Win7 x64 pro (Official r2538 x64)
es ist beinahe schade, dass ich nun XenServer installieren gehn muss