x264 Benchmark (kein Schnelldurchgang! 32-Bit multicore und ≥1GB RAM)

3mbryoyo

Hat geklappt auch wenns gedauert hat. FÜr mich als Linux b00n wars ne gute Übung.

CryptonNite

ups...

3mbryoyo

Kabini nichPower I

Command rate muss ich noch rausfinden wenn der Schrotthaufen fertig ist.

CryptonNite

War das das gleiche Kompilat wie beim letzten Lauf?

Das geht nämlich, wenn die gleichen Bibliotheken vorhanden sind und der Kernel relativ gleich ist.

GrandAdmiralThrawn

MX Linux.. von dem habe ich auch noch nicht gehört.

3mbryoyo

Keine Ahnung Ich bin einfach zwei Male der Linux Anleitung für den Benchmark gefolgt. Einmal mit Fedora und einmal mit MX Linux. Hat sich ziemlich gleich angefühlt.

Wie finde ich das heraus?

Zitat von GrandAdmiralThrawn

MX Linux.. von dem habe ich auch noch nicht gehört.

Ich auch kürzlich erst, das Internet behauptet es wäre das beliebteste Linux des Interwebz,

GrandAdmiralThrawn

Ein "Kompilat" ist das Ergebnis, das der Compiler aus dem C/C++ Code baut. Du hast neu vom Quellcode gebaut, also isses nicht das selbe Kompilat gewesen. Das selbe wäre es gewesen, wenn du die fertigen ffmpeg Bibliotheken und das x264 Programm manuell einfach "rüberkopiert" hättest. Nicht sicher ob das funktioniert hätte. Wegen Dingen wie libc, libstdc++ usw.

3mbryoyo

Okay, ja hab ich neu kompiliert.

Sind zwei Kompilate zwangsläufig unterschiedlich? Oder entsteht unter gleichen Bedingungen (System, OS, Pipapo) auch ein identisches Kompilat?

GrandAdmiralThrawn

Solange du auf dem gleichen System mit exakt gleichem Betriebssystem und gleicher Compilerversion bleibst, dann in der Regel ja. Aber das trifft auch nicht immer und überall zu, hängt vom Verhalten des Compilers (Edit: Und des Linkers) ab. Ein Wechsel des Compilers wird wahrscheinlich dazu führen, daß sich der Binärcode unterscheidet. Vielleicht optimiert der Compiler ein bißchen besser, oder ein wenig anders, usw. Vielleicht geht er her und übersetzt "a = 3; a = a * 3 + 4" nicht in ein MUL 3, 3* und ein ADD 9, 4*, sondern in ein VFMADD132SS a, 3, 4*, weil er weiß daß deine CPU FMA3 kann, und weil der neuere Compiler damit umgehen kann.

Das ist nur ein kleines Beispiel.

*Das ist Pseudo-Assembler. Der echte Code sieht syntaktisch ein wenig anders aus, aber egal.

3mbryoyo

Zur Verdeutlichung reicht das ja.

Edit: Wie stellt man einen Custombiuld für Windows Versionen her?

CryptonNite

Nach dem gleichen Schema wie für Linux.

MinGW runterladen (inkl. GCC, NASM / YASM usw.), Quellcode runterladen, BASH starten (wegen der Shell-Skripte, die der Windows Prompt nicht kennt), entpacken usw.

3mbryoyo

Kabini nichPower II

ganz schön Kacke

3mbryoyo

Kabini Power IV

bevor das gänzlich untern Tisch fällt

GrandAdmiralThrawn

Hier ist die Diskrepanz zwischen Linux und Windows Mal wieder schön schlimm, wegen dem viel neueren x264 auf Linux. Es wurde ja schon drum gebeten, eine bessere Version des Benchmarks zu bauen (ähnlich dem x265er). Damit wäre dann auch eine bessere, offizielle Vergleichbarkeit von Betriebssystemen möglich (weil Version Lock statt Binary Lock). Also gültige Ergebnisse aus Linux & UNIX usw.

Bisher war ich aber zu faul dafür.

Ergebnisse sind eingetragen!

3mbryoyo

Das erklärt die doch nicht zu verachtende Diskrepanz. Hab mich ganz schön erschrocken.

Achja, bei dem Asus X102BA kann ich die command rate nirgends nachsehen.

GrandAdmiralThrawn

Ist ok, dann lassen wir sie einfach weg. Hilft nichts. Bei manchen Mainboards kann auch CPU-Z die CR nicht auslesen, da kann man dann halt nichts machen.

Um Linux und Windows in x264 halbwegs fair zu vergleichen, müßte man die exakt selbe Version des Quellcodes nutzen, um dann daraus das Programm zu bauen. Beim x265 Benchmark ist es so, deswegen sind z.B. Linux und Windows 10 nicht so weit auseinander. Der hat nur andere Krankheiten, sowie den NUMA Fuckup auf Windows, und die niedrige Fallback-Leistung auf XP x64 / Server 2003 x64 / Vista x64 und Server 2008 x64.

Aaber das wäre erst Mal ein Haufen Arbeit, das Ding neu zu bauen und zu modernisieren...

GrandAdmiralThrawn

So, endlich geschafft, nach zig Abbrüchen, von denen einige Tage gebraucht haben um zu passieren. Ganz habe ich den Luke nicht auf 400MHz Estherniveau hinuntergebracht, aber immerhin hat es mit 408MHz geklappt. Das sollte für einen halbwegsen IPC Vergleich zwischen Esther und Nehemiah reichen, hier das Ergebnis:

Damit zeigt sich, daß Esther mit 231½ Stunden bei 400MHz mit neueren SSE Einheiten zwar die Nase vorn hat, bei der Standardversion des Benchmarks aber gar nicht Mal um so viel. Die Rekordjagd muß ich jedoch leider abbrechen, Luke erlaubt es mir einfach nicht, den Takt noch weiter zu drücken, egal was ich versuche. Leider lassen sich keine Multiplikatoren ändern, um die Bustakte oben zu halten.

Edit: Und den gestörten Wahnsinn mit deaktivierten L1/L2 Caches (wo sogar notepad.exe bei der Texteingabe ruckt) mache ich derweil erst Mal noch nicht.

Maniac81

Sehr schönes Ergebnis. Echt geil!

Löschzwerg

Hier also das Ergebnis zur "China-CPU"

GrandAdmiralThrawn

Ist drin!

Ich beiße mir in den Arsch. Werde meinen Import wohl zugunsten eines KX-7000 abbrechen müssen. Hah...

Ajo! Du hast 16GiB RAM... Darf man auf einen x265 Benchmark Run hoffen?