ELSA Erazor X DVI Speicherfehler durch ehemals überhitzte GPU?

  • Kurzfassung: Können durch Überhitzen der GPU bei älteren FCBGA-Chips (speziell NV10) tatsächlich die BGA-Lötstellen brechen? Oder ist es wahrscheinlicher, dass die Verbindungen zwischen Chip und Substrat Schaden nehmen?

    -

    Hintergrund: Eine Geforce 256 32MB SDRAM von ELSA, sogar mit DVI.:thumbup:

    Anamnese: Sie produziert Speicherfehler, aber immer wieder unterschiedliche.

    Offenbar war einem Vorbesitzer das Lüfterkabel abgerissen. Der Konnektor ist mehr schlecht als recht wieder angelötet und Kühler, Lüfter und Lüfterkabel sind verformt oder verfärbt. Sie wurde also einige Zeit ohne aktiven Lüfter betrieben.

    Da dachte ich mir: Betreib die Karte mal 'nen Moment ohne Lüfter im BIOS, lass sie schön warm werden, resette die Maschine und lass erneut Video Memory Test CE laufen.

    Ergebnis: Zwei Durchläufe ohne Fehler.

    Nach Abkühlen dann ein erneuter Versuch und die bekannten Probleme sind zurück.

    -

    Meine Folgerung: Einige Verbindungen zwischen GPU und Platine (hoffentlich die Lotbälle) sind durch die starke Ausdehnung bei Betrieb ohne Lüfter gerissen und sorgen jetzt für Fehler in der Signalübertragung, was sich in Speicherfehlern ausdrückt. Wenn die teile die richtige Temperatur erreichen, verbinden sich die Lötstellen temporär mechanisch, sodass zwischenzeitlich keine Fehler auftreten.

    Macht das Sinn und wäre das mit überschaubarem Aufwand zu reparieren?

  • Ja das macht Sinn.

    Diese Phänomen der porösen Lötverbindungen des Bonding wurde erstmals bei fehlerhaften Nvidia GeForce 8600M/8400M in Laptops bekannt.
    Damals fielen massenhaft die mobilen GPUs aus und bescherte dem Konzern einen Milliardenverlust durch Entschädigungen.

    Das von dir beschriebene Verhalten paßt da zu einhundert Prozent.
    Theoretisch müßte man die GPU ersetzen und einen Ersatzchip auf die Platine bonden (in deinem Fall also eher ersetzen als reparieren).

    "Ich habe einen Penis! Und ich werde ihn benutzen..." ~Gronkh

  • Also würdest du eher von defekten Chip-Substrat-Verbindungen als von BGA-Lötstellen ausgehen?

    Damals war es wenn ich es richtig verstanden habe ein Problem mit dem Material der Chip-Substrat-Verbindungen. Die "Reparaturen" durch Reflow des Chip ließen diese neu verschmelzen, sie brachen aber immer wieder, weil eben das Material nicht geeignet war.

    Sollten nun beim NV10 auch diese Verbindungen defekt sein, das Material aber grundsätzlich geeignet, müsste die Reparatur durch Reflow ansich dauerhafter sein, solange der Chip nicht wieder überhitzt, sehe ich das richtig?

    Ist es also wahrscheinlich, dass ein Reflow (in diesem Fall und im Gegensatz zu Chips von Ende der 2000er) dauerhaft beide möglichen Fehlerursachen beheben könnte?:/

  • Die GPU selber wird wohl eher nicht defekt sein, nen Reflow (so heißt das doch?) müsste also reichen. Für sowas sind auch die Platinen von IBMs T43 und T61 Thinkpads bekannt...hab auch zwei, die ein entsprechendes Problem haben. :(

    Viele Grüße

    soggi

  • Das macht Hoffnung. :thumbup:

    Bietet jemand im Forum derzeit so eine Reparatur an? Anständiges Werkzeug für ein Reflow habe ich nicht und auch null Erfahrung damit.

  • Bonden ist ein Kaltschweißverfahren und es ist unwahrscheinlich, daß eine vergossene Bondverbindung bricht.

    Hier werden wohl eher die Lötverbindungen schlecht geworden sein. Gleiches Problem wie beim G80. Ein Reflow oder besser noch ein Reballing, sind hier angebracht.

    "Du bist und bleibst a Mensch und du kannst eben net deine menschlichkeit überwinden."

    Dennis_50300

  • Die amateurhafte Variante, sowas (zumindest für einen gewissen Zeitraum) wieder hinzubekommen, wäre das Backen im Backofen - bitte keinen verwenden, der auch zur Lebensmittelzubereitung verwendet wird. Die Erfolgsaussichten sind allerdings so "naja"...hatte bei ein, zwei Grafikkarten von 5-10 (weiß nicht mehr) Erfolg damit. Dabei wird das Lötmaterial im Idealfall nicht so heiß, dass dir die Teile abfallen bzw. verrutschen, aber im Material selbst eine Restrukturierung stattfindet. Bevor man sowas macht, alles abbauen, was abzubauen geht. Anfangen mit 120 °C / 20 Min. z.B., dann testen, bei Misserfolg höher gehen, über 180 °C würde ich nur gehen, wenn dir die Karte nicht so wichtig ist - bis dahin sollten alle Teile das ohne Probleme aushalten. Kein Vorheizen, keine Umluft, Karte langsam auskühlen lassen.

    Nen richtigen Reflow ersetzt dir das nicht, aber finde da erstmal jmd für und bevor die Karte in den Schrott geht, kann man's mal versuchen.

    Viele Grüße

    soggi

  • Alternativ für einen Reflow geht auch ein entsprechend großes Waffeleisen, gefüllt mit Quartzsand (das ist ja doppelt gemoppelt).

    Es gibt zwei Möglichkeiten: Temperatur bei ca. 110 bis 120 °C für nicht mehr als 15 Minuten, oder die brutalere Variante bei 200 °C für maximal 5 Minuten. Ich war in beiden Bereichen erfolgreich.

    "Du bist und bleibst a Mensch und du kannst eben net deine menschlichkeit überwinden."

    Dennis_50300

  • Große Waffeleisen und sekundäre Backöfen habe ich leider keine. ;)

    Aber hier in der Nähe bietet ein Laden ein Reflow für defekte Xbox360 für knapp 30€ an. Wenn man mit der nackten Karte dort aufkreuzt, für die also keine weitere Arbeit durch Auseinander- und Zusammenbau entsteht, vielleicht reflowen die mir die dann ein Stück günstiger.

    Leider ist der Kühlkörper auf der Karte verklebt. Also steht vorher meine erste Eisspray-OP an. Viel kann ja nicht kaputt gehen.^^

  • 1. Also würdest du eher von defekten Chip-Substrat-Verbindungen als von BGA-Lötstellen ausgehen?

    Damals war es wenn ich es richtig verstanden habe ein Problem mit dem Material der Chip-Substrat-Verbindungen. Die "Reparaturen" durch Reflow des Chip ließen diese neu verschmelzen, sie brachen aber immer wieder, weil eben das Material nicht geeignet war.

    2. Ist es also wahrscheinlich, dass ein Reflow (in diesem Fall und im Gegensatz zu Chips von Ende der 2000er) dauerhaft beide möglichen Fehlerursachen beheben könnte?:/

    3. Aber hier in der Nähe bietet ein Laden ein Reflow für defekte Xbox360 für knapp 30€ an. Wenn man mit der nackten Karte dort aufkreuzt, für die also keine weitere Arbeit durch Auseinander- und Zusammenbau entsteht, vielleicht reflowen die mir die dann ein Stück günstiger.

    1. Es kommen beide Möglichkeiten als Ursache infrage. In deinem Fall ist ein Defekt der Lötverbindungen zwischen Chipträger und Grafikkartenplatine wahrscheinlicher, da bei deiner Serie keine Mängel im Bonding bekannt wurden.

    2. Ist möglich, aber nicht sicher. An deiner Stelle würde ich vermutlich eher eine Ersatzkarte suchen als die defekte reparieren zu lassen (Kostenfaktor).

    3. Der Laden, der einen Reflow für Konsolen anbietet, wird vermutlich keine GPUs auf Grafikkarten "reballen" können (mangels geignetem Zubehör dafür). Du kannst aber gerne mal dort nachfragen - nur Hoffnung würde ich mir keine machen. Wie soggi vorschlug wäre backen oder die Waffeleisenmethode von CryptoNite vermutlich genauso unsicher wie der Versuch im Laden (aber gratis).

    Bonden ist ein Kaltschweißverfahren und es ist unwahrscheinlich, daß eine vergossene Bondverbindung bricht.

    Hier werden wohl eher die Lötverbindungen schlecht geworden sein. Gleiches Problem wie beim G80. Ein Reflow oder besser noch ein Reballing, sind hier angebracht.

    Richtigstellung: Bei der CPU/GP- Branche benutzt man den Prozess "Bonding" nachwievor für das Aufbringen (verheiraten) des Die auf dem Trägermaterial - auch wenn heute keine Drähte mehr verschweißt werden wie früher, sondern die Punktverbindung mittels schmelzenden Lotkugeln hergestellt wird. Als ich vom mangelhaften "Bonding" bei der GPU sprach, meinte ich gebrochene Lötverbindungen zwischen dem Die und dem Die-Träger (1. Level Interconnect).

    Da ich selbst von dem Problem betroffen war, hatte ich damals das Verfahren nachgelesen.

    Quelle: Nvidia-Grafikchips mit Lebensdauerproblemen (Update) (letzter Abschnitt mit dem Bild)

    "Ich habe einen Penis! Und ich werde ihn benutzen..." ~Gronkh

    Einmal editiert, zuletzt von Xenozid (21. Juni 2018 um 16:39)

  • Ach das meinst du. Jo, stimmt ;)

    Unter "Bonden" kenne ich eigentlich nur das Drahtbonden. Daß man Lötverbindungen ebenfalls als "Bonden" bezeichnet, ist mir neu.

    Anyway...

    Die sicherste Methode wäre das Austauschen des Schaltkreises. Also alter Schaltkreis runter, neuer Schaltkreis drauf. Viele Versuche hat man nicht, weil die Lötaugen auf der Leiterplatte ziemlich gestresst werden.

    Gleiches Problem ergibt sich auch beim Löten generell. Zu oft nachgelötet, oder Teile falsch eingelötet produzieren unweigerlich fehlerhafte Verbindungen. So ist es z.B. empfehlenswert, nach dem Einstecken des Bauteils erst die Drähtchen zu kürzen und dann zu verlöten. Hinterher stresst man nämlich die Lötstelle. Ein Fehler, den viele machen... So sagte mal ein Ausbilder meinerseits.

    "Du bist und bleibst a Mensch und du kannst eben net deine menschlichkeit überwinden."

    Dennis_50300

    3 Mal editiert, zuletzt von CryptonNite (21. Juni 2018 um 16:47)

  • -Ersatzkarte

    Woher nehmen, wenn nicht stehlen? ^^ Eine ohne DVI hab ich, aber mit DVI ist die selten.

    Und stehst du nicht drauf, den alten Kram zu reparieren?8)

    -reballen

    Ich hoffe ja nur auf ein(en?) Reflow. Und das ist ja genau das, was sie bei der Xbox machen, richtig?

    Backofen und Waffeleisen wird für mich teurer als alles andere, weil ich dafür ein Gerät anschaffen müsste.

    -Austauschen des Schaltkreises

    Haste einen übrig? ;)


    Ich muss mir wohl nochmal Gedanken machen, ob sich das Gebastel lohnt. Ich brauche die Karte natürlich nicht, aber ich fände es schon töfte, wenn sie wieder liefe.:spitze:

  • Sind da die lustigen Plastiknippel zum Besfestigen des Kühlkörpers dran?

    Tausche die doch mal gegen Schrauben aus und ziehe den Kühler behutsam, aber ordentlich fest. Die Karte darf sich dabei nicht verbiegen. Das behebt zwar das Problem ansich nicht, aber könnte schon ausreichen, Kontaktschwierigkeiten auszugleichen.

    "Du bist und bleibst a Mensch und du kannst eben net deine menschlichkeit überwinden."

    Dennis_50300

  • Am besten, du stellst hier mal nen Bild der Karte rein, Roland.

    Wenn der Kühler ohne Plastikkram verklebt ist, kann er mMn auch drauf bleiben.

    Ich nehme auch an, dass die das nur speziell bei der XBOX machen und nicht für irgendwelche anderen Chips.

    Viele Grüße

    soggi

  • Moin! Das Wochenende war ausgelastet. Hier die Bilder.

    Der Kühler ist etwas grünstichig verfärbt, ursprünglich war der mal schwarz. Wenigstens ist er das bei meiner anderen ohne DVI.

    Das Kabel ist wo es Kontakt zum Kühler hatte schwarz verfärbt und steif.

    Auf den Bildern kommt etwas schlecht rüber, wie sich der Kühlkörper in den Lüfterrahmen abgedrückt hat - mit dem Fingernagel lässt es sich spüren.

    Der Kühler ist anscheinend so verklebt wie V3 2k- und V5500-Kühler. Nur mit mehr Sorgfalt.;)

    Im letzten Bild eine Aufnahme des wiederbefestigten Lüfterkonnektors. Ich war das nicht!^^

    Einmal editiert, zuletzt von Roland (25. Juni 2018 um 11:44)

  • Sehr schön. Hast du die Fehler über VGA UND DVI? Komplette Reinigung mit Pinsel, Ausblasen und AGP abwischen hast bestimmt schon durch?

    Ansonsten, wenn du doch noch jmd. mit nem alten Backofen findest...Slotblende mit diesem DVI Board inkl. Kabel und die Pushpins abmachen...dann brutzeln.

    Viele Grüße

    soggi

  • -VGA UND DVI

    DVI läuft derzeit garnicht.:thumbdown:Ich vermute, dass es da auch BGA-Schwierigkeiten gibt, habe aber zu wenig Ahnung, um das zu untermauern. ^^

    -Reinigung

    Im sinnvollen Rahmen ist die Karte sauber.:thumbup: Sie war vorher recht sauber und an ein, zwei Ecken habe ich mit der Zahnbürste nachgeholfen.

    Ein Bisschen Dreck hat sie noch, wie man sieht, aber nichts, was den Betrieb stören dürfte. Sollte ich sie tatsächlich noch toasten, werde ich die Aufkleber entfernen und sie mit Alkohol und Zahnbürste reinigen.

    Vielleicht kann ich demnächst auch nochmal eine Heißluftstation für ein paar Dinge benutzen. Da könnte man ja...:/ Mal sehen. ^^

  • Dann ist vll dieses ulkige Flachbandkabel hinüber!? Abpinseln und ordentlich drüberpusten + anhauchen das AGP + Abwischen reicht vollkommen. Da brauchst du nicht noch deinen guten Schnaps drüberschütten. ;)

    Weiß nicht wie diese Heißluftstation aussieht, aber klingt nicht gerade nach gleichmäßiger Erwärmung!?

    Viele Grüße

    soggi

  • Das Kabel ist gut und die Kontkate sauber. Und wenn ich Kuchen backe, kommt da eben Schnaps rein!:topmodel:

    Nee, ernsthaft: Die Alkoholreinigung soll verhindern, dass sich Rückstände von Aufklebern einbrennen, sollte die Karte tatsächlich in den Ofen wandern.

    Ja, mit der Heißluftstation müsste ich mal schauen, ob sie genug Heizleistung und Luftstrom hat, um so große Bauteile zügig zu erwärmen. Wenn sich überhaupt die Chance ergibt, sie zu nutzen. Der Vorteil wäre, dass die restliche Karte geschont würde. Die endgültige Reparatur der Geforce wird so wie es derzeit aussieht wohl nicht das unmittelbar nächste Projekt. Ich will sie nicht komplett ruinieren.

    Heute habe ich erstmal ein Abit VH6-II repariert, bei dem ein SMD-Widerstandsnetzwerk direkt unter/neben der Haltenase für den Kühler beschädigt war. Wie kam Abit darauf, den da zu platzieren?:mauer: 2mm weiter außen und alles wäre cool. Ich mache dem Vorbesitzer keinen Vorwurf, dass er das Board beschädigt hat.
    Naja, man wächst mit seinen Aufgaben.:spitze: Aber SMD ist immer noch gruselig für mich und meine zittrigen Hände.^^