Okay erste Ergebnisse.
Win10Pro/ AMD GX-424CC/ 8GB DDR3 1600/ AMD Radeon Pro WX 3100 @25W/ 4GB GDDR5/ Score: 115
Win10Pro/ Intel Pentium G4560T/ 16GB DDR4 2600/ Nvidia Quadro P2000/ 5GB GDDR5/ Score: 380
Okay erste Ergebnisse.
Win10Pro/ AMD GX-424CC/ 8GB DDR3 1600/ AMD Radeon Pro WX 3100 @25W/ 4GB GDDR5/ Score: 115
Win10Pro/ Intel Pentium G4560T/ 16GB DDR4 2600/ Nvidia Quadro P2000/ 5GB GDDR5/ Score: 380
Danke Marlon und undertaker_2 auch für eure Ergebnisse.
Die Fehlermeldung wurde mit aufgenommen und ist mit in die Arbeitsliste reingewandert.
Morgen ist unser Großes Weekly Meeting wo wir über Progress Sprechen und die Themen mal direkt Adressieren.
Ein kleiner Anstoß noch. Ramgeschwindigkeit also Taktung etc. wäre auch offen zum Testen.
Unsere Sammlung an Alpha Ergebnissen wächst:
Kann gut sein dass ich direkt auf euch nächste Woche nochmal drauf zu komme um da nochmals Details abzufragen.
Derzeit werden täglich Buildtests auf der 3090 z.B. durchgeführt.
Wenn noch fragen offen sind beantworte ich die Gerne.
CPU technisch sind bisher keine Minimalanforderungen aufgepoppt.
Der Test sollt ja auch egal auf welcher Gurke max. 5 min (plus Ladezeiten) laufen.
Gruß
Auf der WX3100 läuft der Benchmark nur beim ersten Run vernünftig durch. Beim zweiten oder dritten versuch sind's ungefähr 30% weniger. Hier hilft ein Neustart.
Eine Radeon HD 8730M (Mars Pro) kann den Benchmark nicht durchlaufen, da wohl nur Vulkan 1.1 unterstützt wird.
Unter Windows 8 und einer GT640 bleibt der Benchmark bei layer 8 (glaube ich) hängen. Das System stürzt nicht ab und rechnet sich "nen Wolf".
Aber weiß im Moment gar nicht, ob Kepler Vulkan unterstützt.
Das sind interessante Erkenntnisse. ich denke mit ner Win 7 Debuggte Version könnten bei ggf HD 8730M und GT640 unter Win 8 auch laufen.
Ich glaube Kepler hat schon Vulkan. 472.12 War Nvidias Vulkan support release Treiber. Ka was für eine Treiberversion du auf Win 8 Fährst
Gurke
Gut das du es ansprichst. Ich habe gerade in dem AMD Spezifikationen gesehen das eine AM1 5350 APU mit R3 Grafik wohl auch Vulkan unterstützt wird.
Desweiteren installiere ich gerade eine HD7770 auf einem weiteren Gurkensystem unter Win7. Nur um anzutesten ob der Fehler von bschicht86 ein lokales Problem darstellt oder ob es oder insgesamt mit Win7 ein Prob gibt. ( Einem AM2/+ System mit 2x 2.7GHz. )
Erwarte die Ergebnisse noch heute Abend!
Nebenbei. >Um den Thread nicht unnötig aufzublähen behalte mal Post #39 von mir im Auge. Dort werden weitere Ergebnisse von mir landen. Mein DELL Notebookbook mit dem I5 ist auch gleich fertig...
Strauchdieb Könntest du die 6900 XT mal im Stock durchlaufen lassen und deine Aktuelle Konfiguration dazu nochmal dazuschreiben ? OS/Ramspeed/CPU ...
WIN10/ AMD Ryzen 7 5800X3D/ 32GB DDR4 3200/ AMD Radeon 6900XT/ 16GB
Ich lass sie die Tage nochmal laufen. Daten werden sich nicht ändern.
So kleine Entwickler Update.
Leider gibt's Ressourcen Engpässe wegen der Beruflichen Situation des Hauptprogrammierers.
Aber der Funktionsumfang der V1.2.0 wurde festgelegt. Leider wird sich wohl diese Version auf Weihnachten verschieben.
Ich würde gerne euch ein schnelleres Voranschreiten des Projekts ermöglichen allerdings bleibt es ja auch ein Freizeitprojekt.
Aktuelle wird an einer Version getüftelt die schon einmal eine Berechnungsoptimierung enthält an der Datenkomplexität. Diese erhöht den score ca. um 10% da der Overhead reduziert wird. Hauptvorteil wird sein dass wir den benötigten Ram und Vram weiter Reduzieren können.
Außerdem sind einige Erkenntnisse dazugekommen.
- Der erste Run des Benchmarks "also kalt" ist immer schlechter so wie es aussieht. Hier planen wir einen "Aufheizrun" bevor die eigentliche Punkteermittlung erfolgt.
- Weiterhin hat die Konsistenz zwischen Run 2-3-4 derzeit eine Schwankung von bis zu 20% hier sind Nicht beachtete Lade-Delays das Problem. Diese wollen wir Rausrechnen. Also die Reine GPU Rechenzeit Pro Layer wird ermittelt. Ebenso soll die Punkteausgabe ein Gemittelter Wert werden im sinne von Schichten Pro 60 min
Heißt zum einen dass wir die Punkteanzahl erhöhen können ohne die Benchmark Zeit massiv nach oben zu schrauben und zum Anderen gibt es während der notwendigen Berechnung bereits Zwischenergebnisse die sich nur "Einpendeln" Heißt wenn ein Layer eine Laufzeit von durchschnittlich 300ms hat wird das auf 60 min geteilt und ergibt den score obwohl der Benchmark nur 5 min Läuft.
Ebenso durch das Herausrechnen der Delays soll ein weiterer Score hinzukommen die Grafikkarten Anbindung.
- Hier wurde Festgestellt dass bis zu 10% Leistung nur aus der RAM Geschwindigkeit kommt. Heißt es gibt dann einen schichtzahl Wert GPU Anbindung und einen Schichtzahl Wert GPU Speed und den Kombinierten Wert. Somit sieht man auch gut was das Bottleneck an der GPU ist.
Windows Taskmanager hat hier sehr langsame abtastraten was GPU Auslastung angeht. MSI Afterburner kann mit einer Abtastrate von 100 ms sehr gut die Schwankungen der GK anzeigen und hier könnt ihr auch gut im Graph währen des Benchmarks die 100% Peaks der GK sehen.
- Ebenso soll eine Ausführlichere Logdatei Erzeugt werden die Wesentlich mehr Informationen und Fehler Infos enthält.
Was genau abgefragt wird müssen wir noch aus der API raussuchen. Aber CPU/GPU/Ram Typ OS Version Vulcan Version sollte kein Problem sein.
GGF Kommt noch Takt und Temp mit dazu.
Hierauf soll auch erst einmal die Priorität gesetzt werden und die Unterstützung zu anderen Systemen wird nur im Kleinen Maßstab getestet (MAC/WIN 7/8/Linux/Android/IOS...)
Also Voraussichtliche Funktion von 1.2.0
- Aufheizrun
- Höherer Score
- Homogenere Schichtlaufzeit
- Aufgesplitteter Score Layer/h GPU Kommunikation, Layer/h GPU Performance, Layer/h Total
- Log Datei mit Systemdetails, Und Fehlerdetails
- Reduzierter Ram und Vram bedarf (angepeilt 256mb)
Grüße aus dem Entwicklerteam
Und danke fürs Fleißige Testen. Wir sind für jede Info Dankbar insbesonders Homogenität und Abhängigkeiten zu anderen Faktoren als GPU sind sehr wertvoll.
undertaker_2 Die HD7770 scheint einfach wieder ans limit zu stoßen mit dem Vram. und die FM Plattform müssen wir schauen ob 1.2 möglich sein wird. aber mehr kann ich dir mit version 1.2.0 sagen
Hmm es wird kurios.
Gerade die HD7770 in den Ryzen 1700 gezimmert. Nun kommt eine Fehlermeldung das die Karte auch die falsche API haben soll? (1.2 vs. 1.3)
Zudem meldet sich der AMD Treiber noch (siehe Bild bzw. Textanhang)
Den Bug-Report an AMD habe ich einmal mitangehangen.
EDIT: Scheinbar schafft die Karte aber zumindest den ersten Layer, also Layer 0 erst beim zweiten also Layer 1 schließt sich der Bench. (Siehe Textanhang)
Ich glaube du hast da noch ein kleines Problem. Nämlich Caching. Sowohl Windows als auch Linux nutzen den RAM mit als Festplatten / SSD Cache. Somit kann es sein, dass du bei mehreren RUNs unterschiedliche Ladezeiten der Daten von Festplatte / SSD ---> RAM hast. Weiterhin wird die Grafikkarte auch mit Caching arbeiten. Ich bin nicht so Tief im Thema drin, dass ich exakt sagen kann wie weit dies deinen Test beeinflusst. Allerdings gehe ich davon aus, dass der erste Run die Caches füllt, alle anschließenden Runs bedienen sich aus diesen Caches. Die schwankenden Ladezeiten können daher kommen, dass mit der Zeit die GPU besser entscheiden kann, was öfter gebraucht wird oder dass einige Daten aus dem Cache gekickt werden.
Interessant wäre hier, wenn man zwischen den Tests sicher stellt, dass alle Caches geleert werden. Dies ist keine einfache Aufgabe. Da selbst je nach System der Cache einen Neustart überleben kann. (ZFS z.b.) Weiterhin könnte ein Caching die Ergebnisse deines Speicherbandbreiten Tests absolut zerstören.
Ab hier wird es von meiner Seite rein Spekulativ, hier musst du selber weiter nachforschen. Für C++ gibt es ein Programm das nennt sich ccache dies ermöglicht es, wenn man Software neu Kompiliert nur Änderungen zu Kompilieren (siehe genaues Link). Ein ähnliches Verhalten könnten GPUs aufweisen. Wieso sollten sie noch einmal 0.58888234*0.3444533 Rechnen, wenn das Ergebnis schon im Speicher liegt. Allerdings bin ich hier nicht weit genug in der Materie drin um zu wissen wie genau sich das verhält.
Display MoreHmm es wird kurios.
Gerade die HD7770 in den Ryzen 1700 gezimmert. Nun kommt eine Fehlermeldung das die Karte auch die falsche API haben soll? (1.2 vs. 1.3)
Zudem meldet sich der AMD Treiber noch (siehe Bild bzw. Textanhang)
Den Bug-Report an AMD habe ich einmal mitangehangen.
EDIT: Scheinbar schafft die Karte aber zumindest den ersten Layer, also Layer 0 erst beim zweiten also Layer 1 schließt sich der Bench. (Siehe Textanhang)
Dieses Problem habe ich mit der besagten HD8730M 2GB auch.
undertaker_2 Das könnte tatsächlich mit Der Vulkan Version zusammenhängen. Wenn die Installierte Treiberversion nur 1.2 Unterstützt erklärt das auch die Treiberfehlermeldung. Eventuell kannst du es mit einer neueren Treiberversion nochmal überprüfen.
Der Erste Layer wurde ja sogar noch gerechnet da dieser aber wohl die kleinste Datenmenge Aufweist und schon 4s Rechnet denke ich dass das Ergebniss unter 50 ausgefallen wäre. Hier wird es wohl interessant werden wenn die Datenmenge Kleingenug wird und auch GK mit wesentlich weniger Grafikspeicher dann funktionieren.
Bier.jpg Das Caching Problem soll mit der "Aufheizphase" erschlagen werden um vorladen und Zwischenladen zu eliminieren. Sozusagen Startet das Hochzählen erst nach Abschluss der ersten 80 Schichten. Das einladen der Daten und das Leeren der Caches zwischen jeder Schicht wird Programmierseitig bereits berücksichtigt um die Querabhängigkeiten zwischen Auslagerungsdatei und Ram /Vram zu eliminieren ist ein erster Durchlauf notwendig. Dann sind die Ergebnisse auch homogen : Siehe Ergebnisliste unten. Das Chache Leeren ist inherent Bestandteil des Vorgangs zwischen den schichten und Erklärt auch die derzeitig auftretenden 15 ms Delay zwischen jeder Schicht. Diese Zeiten werden wie bereits geschrieben in V1.2.0 Herausgerechnet so dass der reine Rechenanteil der Kompletten einzelnen Schicht gemessen wird genauso wie das Raus-schreiben und Reinladen aus dem Ram getrennt davon. Siehe vorheriger Post.
Da wir außerdem eine Auslagerungsdatei auf der Festplatte unbedingt vermeiden wollen ist auch hier die Verkleinerung der Berechnungsdatei essenzieller schritt. Hier wird bereits an einem 3D Modell gearbeitet was nicht nur unter die 265MB Verarbeitungsgröße fällt sondern auch eine Vertikale konstante Komplexität aufweist so dass die Schichten 1-4 auch vergleichbar werden wir zum Rest. derzeit sind diese mit einer Laufzeit von knapp unter 200ms (Titan V) im Vergleich zu den Restlichen Schichten ca. 300ms nur 2/3 so komplex wie der Rest.
Aktueller Stand Sensitivitäts-testing
- Nach aktuellem Stand ist nach "Aufheizphase"/ erstmaligem Durchlaufen des Benchmarks die Konsistenz sehr gut
Die Testumgebung:
Windows 10 Pro 22H2 x64 |AMD Ryzen 9-5950 X | 32 GB DDR4/XXXX 16-18-18-35-63-1T | Nvidia Titan V
Kühlung Gepinnt auf 60°C, Power und Temp. Target der V hochgesetzt dass ich während des Benchmarks keine Frequenzeinbrüche auftreten.
Hier die Ergebnisse dazu als Referenz Durchnummeriert:
1: 925 @1866 Ram, 4x Durchlaufen (Referenz) 0,22% Abweichung
2: 930 @1866 Ram Mem +100Mhz, 3x Durchlaufen 0,10% Abweichung
3: 948 @1866 Ram Core +100Mhz, 3x Durchlaufen 0,05% Abweichung
4: 953 @1866 Ram Core & Mem +100Mhz, 3x Durchlaufen 0,14% Abweichung
Hier Zeigt sich:
V-Ram Geschwindigkeit hat nur 0,52-0,54% Einfluss pro 100 Mhz Sowohl zwischen 1 und 2 als auch zwischen 3 und 4
Dagegen hat Core Clock Zwischen 2,47-2,49% Einfluss pro 100 Mhz Ebenso Zwischen 1 und 3 als auch zwischen 2 und 4
Als nächstes wurde Ram Einfluss getestet:
5: 1007 @2666 Ram, 3x Durchlaufen 0,11% Abweichung
6:1032 @2666 Ram Core +100Mhz, 3x Durchlaufen 0,5% Abweichung
7:1038@2666 Ram Core & Mem +100Mhz, 3 x Durchlaufen 0,47% Abweichung
V-Ram erneut nur mit 0,58% Einfluss zwischen 6 und 7
Core Clock ebenso 2,48% Einfluss Zwischen 5 und 6
Neu dagegen ist der Einfluss von 8,86% - 8,92% höheren Ergebnissen im vergleich von 1 zu 5, 3 zu 6 und 4 zu 7
Also somit ca. 1,1% höhere Ergebnisse pro 100Mhz Ram Geschwindigkeit.
Demnach macht die Aufspaltung der Punkteberechnung in die 2 Separaten Schritte und einzelne Bewertung absolut sinn.
Hier Kann dann auch gut abgelesen werden ob der Ram oder die GK Leistung Limitiert.
Ich schaue mal ob ich mit noch 2 Zwischendatenpunkten da eine Linearität rausfahren kann. Dann mache ich ein Paar ordentliche Graphen mit dem man den Einfluss gut sehen kann.
GGF ist hier auch ein Scatter mit allen bisherigen Ergebnissen in einer Punktewolke interessant.
Liebe Grüße
Eisfuchs
Ich wüsste jetzt nicht, warum der erste Lauf langsamer sein sollte und alle nachfolgenden schnell, wenn der Cache nicht zuschlägt.
Wenn nichts gecached wird, sollte der erste Lauf genauso schnell sein wie die Restlichen. Evlt sogar Schneller (je nach System und Kühlung). Für mich macht es nur Sinn, dass der erste Lauf langsamer ist, wenn in allen Nachfolgenden Läufen etwas vom ersten Lauf genutzt werden kann um diese zu beschleunigen.
Kleiner Hinweis für alle Alpha Tester:
Derzeit vermutlich nur ab Vulkan 1.3 ist ein erfolgreicher Run möglich:
Für die Kompatibilität könnt ihr die Karten/ Treiber und OS hier nachsehen:
Devices - Vulkan Hardware Database by Sascha Willems
undertaker_2 auch wenn die 7700 derzeit in Windows vom Treiber nicht läuft hab ich nachgesehen Auf Ubuntu ist sie mit 1.3 integriert also vielleicht auf unsere Linux Version warten.
Ich wüsste jetzt nicht, warum der erste Lauf langsamer sein sollte und alle nachfolgenden schnell, wenn der Cache nicht zuschlägt.
Wenn nichts gecached wird, sollte der erste Lauf genauso schnell sein wie die Restlichen. Evlt sogar Schneller (je nach System und Kühlung). Für mich macht es nur Sinn, dass der erste Lauf langsamer ist, wenn in allen Nachfolgenden Läufen etwas vom ersten Lauf genutzt werden kann um diese zu beschleunigen.
Das einladen in den Speicher. Im Detail kann ich nochmal im Entwicklerteam Fragen wenn es dich interessiert.
Höchste Priorität hat Homogenität.
Wenn die Installierte Treiberversion nur 1.2 Unterstützt erklärt das auch die Treiberfehlermeldung.
Jetzt haben wir mit der HD7770 allerdings ein Problem. Lt. AMD wird es keine neuen Treiber mehr geben. Der bei mir installierte ist tatsächlich der Letzte.
Habe aber mal selber nachforscht und bin bei techpowerup.com (die GPU-Z Jungs) auf folgenden Eintrag gestoßen:
Es entzieht sich mir ob AMD hier "großzügig" aus der Version 1.2.170 kurzerhand eine 1.3 Version gemacht hat.
Allerdings hatte ich kurz danach nochmals den Bench gestartet und folgendes kam raus:
Ich hänge den zweiten *.log auch mal an. Er war also eine gute Sekunde schneller.
undertaker_2 Wenn du den Test nochmal Widerholen Kannst wäre interessant zu wissen bei welcher zeit sich die 7770 einpendelt für die ersten 2 schichten. Ich gehe aber auch davon aus dass die 1024 MB V-RAM einfach volllaufen bei Schicht 3. Hier macht es wohl sinn auf V1.2.0 vom benchmark zu warten. Dann kommt der (hoffentlich) auch mit weniger Speicher aus. Das Gleiche Ergebnis mit 1.2 hab ich auch bei vulkan.gpuinfo.org gefunden.
Apropo GPU-Z
das Progrämmchen bietet genaue Details über die Grafikkarte. Also auch gut für euch mal zum Nachschauen.
Unter Advanced, Vuklan
undertaker_2 vielleicht kannst du deine HD7700 zu einer etwas neueren Radeon flashen?
U.U. hast du anschließend Zugriff auf neuere Treiber Revisionen. Wenn ich die Zeit finde, kann ich aber mal eine R7 250 gegentesten, welche auf den selben Chip basiert.
Edit. Ein paar Pascal GPU's wären noch echt interessant, da wir hier mit der P1000, 1050Ti und P2000 schon eine sehr schöne Skalierung sehen.
Klar, sehr gerne.
Habe jetzt 4x den Bench gestartet. Beim 4x gab es einen Blackscreen der sich zum Glück selber erholt hat.
Weitere Tests kann ich erst wieder machen nachdem ich meine offenen Daten mal abgespeichert habe.
Auf korrekte Bezeichnungen verzichte ich mal, wir wissen ja worum es geht...
EDIT: Es geht bis auf 2.9 runter um wieder auf 4.x zu landen?!?
undertaker_2 uhh die Ergebnisse sind schon ein bisschen arg inkonsistent aber danke dafür. Wir schauen mal in der nächsten revision ob wir 1.2 mit abdecken können.
Marlon Die R7 250 hat anscheinend auch nur auf Linux 1.3 support. Aber ich denke das momentan mit V1.1.0 des Benchmarks sowieso der Grafikspeicher das Hauptproblem sein wird.
undertaker_2 vielleicht kannst du deine HD7700 zu einer etwas neueren Radeon flashen?
U.U. hast du anschließend Zugriff auf neuere Treiber Revisionen. Wenn ich die Zeit finde, kann ich aber mal eine R7 250 gegentesten, welche auf den selben Chip basiert.
Edit. Ein paar Pascal GPU's wären noch echt interessant, da wir hier mit der P1000, 1050Ti und P2000 schon eine sehr schöne Skalierung sehen.
Das ist eine Idee die man mal im Hinterkopf behalten sollte...
Wie wäre es eigentlich wenn ich die zweite HD 7770 einbaue? Sollte sich das vollaufen des Graka-Speicher nicht erledigen?