Posts by eLuSiVe

    Welcome to the forums, Skyye! :)


    Not to confuse the different compute units or shader cores is actually a very good point.

    I think there is much more to it than the amount of cores or CUs when comparing the different ASICs from NV, AMD and Intel in the future.

    AMD's GCN was very strong in pure compute with for instance Fiji being faster than NVidia's Maxwell back in the day.

    The problem with GCN's gaming performance seemed to be more at the front end as well as the geometry throughput.


    The following was put together based on scattered memories of the chip schematics... if something seems wrong, by all means feel free to correct me ;)


    RDNA 2 now has just like RDNA 1 so called WGPs (Work Group Processors / 40 in total) each combining two CUs. One WGP group contains 4 blocks.

    Each block as 32 Lanes for FP32, FP16 and INT32 as well as 2 Lanes for FP64. The results are way more memory bandwidth as well as compute power.


    One Ampere CU (82 in total) contains 4 blocks. Each block has 16 ALUs and 16 FPs. Only block 1 has 2 DPs, the others don't. The 16 ALUs are accessible through port 0 and seem to handle FP16, FP32 and INT32. The remaining 16 FPs are accessible via port 1. Looks like the interesting part is that only FP32 instructions can be scheduled onto both issue ports 0 and 1 which gives them access to all 32 ALUs that can double their performance. That's probably why they talk about "10496 Shaders".


    I'm very curious about what Intel might be able to pull off. I don't expect a killer chip that will compete in the high ranks with both AMD and NVidia.

    However a solid start in the right direction is something I'm hoping for.



    DEU:

    Die verschiedenen shader cores und CUs nicht miteinenander zu verwechseln, ist ein guter Hinweis.

    Ich denke auch, wenn man AMDs, NVidias und später Intels ASICs miteinander vergleicht, gilt es mehr zu beachten als die reine Anzahl der CUs.

    AMDs GCN Architektur wer sehr stark im reinen Compute. Zum Beispiel Fiji vs. Maxwell damals.

    Das Problem bei GCN schien damals am Front End und am Durchsatz der Geometry zu liegen.


    Folgendes habe ich aus meiner nebulösen Erinnerung an die Blockdiagramme zusammengetippt... korrigiert's mich also bitte, falls ich wo falsch liege ;)


    Bei RDNA heißen die Dinger Work Group Processors (40 insgesamt), von denen jeder zwei CUs zusammenfasst. Ein WGP besteht aus 4 Blöcken, von denen jeder 32 Lanes hat, die FP32, FP16 und INT32 können. Für FP64 sind zwei DP Lanes pro Block vorhanden. Das Ergebnis sind mehr Speicherbandbreite und mehr Leistung.


    Eine CU bei Ampere hat ebenfalls 4 Blöcke. Jeder Block besteht aus 16 ALUs und 16 FPs. Nur der erste der vier Blöcke hat zwei DPs. Auf die 16 ALUs kann über Port 0 zugegriffen werden, was Berechnungen in FP16, FP32 und INT32 erlaubt. Die übrigen 16 FPs sind erreichbar über Port 1, was angeblich nur den FP32 Instructionen vorbehalten ist.

    So hat man für FP32 über beide Ports alle 32 ALUs zur Verfügung, was die Performance verdoppeln kann. Wahrscheinlich redet man deswegen von "10496 Shadern".


    Ich bin sehr neugierig was Intel rausbringen wird. Ich erwarte keinen Killerchips, der es mit den großen von AMD und Nvidia aufnehmen kann.

    Aber ich hoffe auf einen guten Start in die richtige Richtung.

    Danke für den Link und das Bild! Mit 1366 bin ich aber erstmal mit dem einen System bedient.

    Ich könnte sicher auch bei eBay nach einer 7800GTX stöbern und eine besorgen. Hier aus'm Forum wär's mir trotz allem erstmal lieber.
    Wennst eine abgeben kannst, wär prima. Falls nicht, ist es auch kein Weltuntergang ;)


    Hast Du noch DDR3 (ab 1600) rumliegen?
    An 3 der 500er SATAs (3.5 und 2.5) hätte ich auch Interesse.

    Ich will mich bei Backfire eh nochmal melden. Habe noch eine V55, die ich ihm zum Durchchecken schicken möchte.
    Da könnte ich gleich mal fragen, ob er auch BGA macht bzw. sich das ansehen will.

    Wenn er das machen kann und die Karte am Ende auch wieder läuft, würde ich sie gegen ein paar IDE HDDs (60er / 80er) eintauschen, falls Du noch solche hast.

    Ich hätte noch eine Hercules 8500 128MB (275/275).


    Aber: bei der bräuchten die BGA Rams auf der linken Seite oben (Vorderseite/Rückkseite oder beide) einen Reflow.
    Vielleicht kann ich die vorher nochmal jemanden hier im VA mit der entsprechenden Erfahrung und Ausrüstung anvertrauen.
    Die produziert nämlich Grafikfehler. Es sei denn man drückt sie an der Stelle über die Kühlkörper leicht zusammen, so dass die RAMs wieder Kontakt haben.
    Da müsste also erstmal ein Fachmann ran.

    Die Westmere Xeons von Löschzwerg kamen gestern an :):thumbup: Den X5680 eingebaut, eingeschaltet, läuft! Bin echt froh drüber.
    Erstens isses nen B0 ES und zweitens sind X5xxx Xeons + das MSI Board generell ein Pokerspiel.
    Den RAM auf 1600 MHz mag der IMC des Engineering Samples anscheinend nicht. An der DRAM oder QPI Voltage will ich aber auch nicht weiter drehen.

    Bleibt auch um einiges Kühler als der vorherige i7 950. Unter Last hängt er bei so 54°C rum.

    Klar, kann man da nochmal Feineinstellungen betreiben. Läuft bisher prima so und hat den x264 auch gerade durch.


    01:09:02.806 | eLuSiVe | So 1366/6/12 | Intel Xeon X5680 ES B0 @ 4,15GHz | MSI X58 Pro-E | X58 | 16GB DDR3 1333 | Win10 20H2


    Hier noch die Timings


    Files

    • RESULTS.txt

      (41 Byte, downloaded 61 times, last: )

    Meine RX 6900 XT ist Bulk, also Karte ohne Zubehör und Schachtel, daher kann ich dir leider kein Mauspad anbieten. :(


    Zum Rest: Schaut fast so aus, als würde ich die Karte auf VA nicht um UVP+Versand loswerden? Das wäre ja fast grotesk... Aber egal, ich warte einfach noch eine Woche ab... Mal schauen was passiert.


    Wenn sich nur ein einziger Interessent meldet, dann wird der Zufallszahlengenerator ad absurdum geführt, und der erste und einzige Kaufinteressent würde die Karte unmittelbar bekommen...

    Joa, einfach mal ne Woche stehen lassen.
    Generell hätte ich schon Interesse an den neuen AMDs. Zum Zocken lohnt es sich für mich nur aus Zeitmangel nicht und Redshift (der Renderer, den ich überwiegen nutze) kann leider nur CUDA. OpenCL leider noch nicht. Bei letzterem ist die Implementierung auch manchmal so unterschiedlich "gut" gemacht, dass, wenn man Pech hat, ne 6900xt hinter eine 3060 fällt X(
    Mit der Vega64 bin ich damals auch so auf's Gesicht gefallen. Ne 1050Ti hatte eine bessere Viewport Performance.
    Aber die Spieleleistung hat gepasst.

    Latenzen kann ich gern noch nachreichen.

    Über die Triple-Channel Geschichte bei 16GB (4x4) hatten wir im CPU-Z Screenshot thread mal gesprochen.
    Seitdem bin ich der Geschichte leider nicht mehr weiter nachgegangen. Gäbe es so etwas wie einen RAM-Bench dem man sagt "Du hast 16GB RAM (4x4 angeblich Triple Channel) verfügbar, mach das voll und teste die Bandbreite.", dann hast du 12GB (3x4 Triple Channel) und machst das ganze nochmal.
    Am Ende vergleicht man dann.

    Erinnert irgendwie an die GTX 970 mit ihren 3,5GB + 500MB.

    Ich glaube da hängen viele Ursachen mit drin. So aus dem Stegreif würde ich meinen klar, die aktuelle Covidsituation: Hardware für Home Office, zur Unterhaltung (Urlaube fallen ja aus -> mehr Geld für Unterhaltungselektronik), Zulieferung schwer, Angst um Wirtschaftliche Folgen -> Investitionen in Kryptogeld (Hardware für's Mining), die Strafzölle der USA gegen China, etc... man wird der Nachfrage nicht Herr und hat selbst Probleme mit Baugruppenengpässen.


    Auf PCGH stand am Samstag etwas darüber klick

    Gut möglich, dass das noch bis in den Herbst dauern wird, bis sich die Lage ansatzweise entspannt.
    Meinen Plan für zwei RTX 3090 im NVLink habe ich auch erstmal nach hinten verschoben. Vor allem wegen der Preise. Eine große Notwendigkeit besteht Gott sei Dank noch nicht.
    Aber wenn mir die Titan, die im März auch schon zwei Jahre alt wird morgen verrecken würde, dann wär's schlecht. Das wäre dann nen Work Stopper :|