Präsentation: 54.45TiB "Taranis" RAID-6 Array (War: 5.45TB "Helios" RAID-6 Array & 10.9TB Stage 2)

  • So, und für's Archiv: Das erste Verify/Scrub ist auch durch, selbstverständlich keine Fehler gefunden. ;) Laufzeit bei 12 × 6TB in RAID-6 belief sich auf 29:07:29, also 29 Stunden. Das is ned grade extrem rasant (ca. 550MiB/s), aber der Array wurde ja auch aktiv benutzt in dieser Zeit (ca. 150GiB I/O derweilen) und die Priorität für Hintergrundtasks steht bei nur 20%.

    Ist auf jeden Fall tragbar.

    Edit: Ah, und hier noch'n normales Foto der finalen Kiste. Ich bitte den extrem beschissenen Farbraum des Bilds zu entschuldigen, die gemischten Lichtquellen (Kalt-, Warm-LED- und Tageszwielicht) waren ein Alptraum.

    Taranis RAID-6 bei der Arbeit (Klicken zum Vergrößern)

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

    4 Mal editiert, zuletzt von GrandAdmiralThrawn (17. August 2023 um 15:41)

  • Und nach ~1 Jahr Betrieb das erste grobe Problem: Der Controller wirft eine Disk aus dem Array. Laut Controllerlogs und SMART Logs hat die Platte aber absolut gar keine Probleme. Also reaktiviert, Rebuild. Dann, vor 2 Tagen: Plötzlich klackts und drei Disks einer kompletten Bay (worin auch der Rebuild war) stecken mit Activity LEDs im Dauerlicht. Kein Zugriff mehr. Nach ~30sec hat's die Delayed Write Errors im Windows zu hageln begonnen.

    Maschine Off/On, rannte wieder. Und grade vor einer knappen Stunde ist in der selben Bay eine andere Disk gefallen. Schaut nach einem Problem der Backplane aus. Habe zwar in weiser Voraussicht noch eine fünfte Bay angeschafft für Notfälle, aber daß ich die wirklich brauchen soll?

    An den Disks scheint's jedenfalls nicht zu liegen, Verkabelung schaut auch sauber aus...

    Pffh, dabei sind's eh passive Bays, also eigentlich nur "dumme" Platinen hinten drin, die kaum was intelligentes können.

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

  • Das kann schon noch passieren! Allerdings kann der Areca den Array auch mit Gewalt reaktivieren (wenn die Disk konsistent ist, isses ja kein Problem), soweit ich das auf'm Admininterface gesehen habe. Ein Ärger isses halt einfach.

    Najo, eine Ersatzbay hab ich ja wie gesagt. Da werd ich die bestehende wohl tauschen, bzw. die Backplane rüberbauen.

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

  • Obwohl es da doch auch diese Statistik gab, dass SMART Werte nur ein Indikator für (bestehende) Festplatten-defekte sind. Failure w/o Smart Error war auch nicht wahrscheinlicher als Platten die schon SMART errors hatten. Vielleicht doch nicht gleich die Backplane verdächtigen, ist ja wie du gesagt hast ein dummes Bauteil. Strominstabilitäten können es aber nicht sein? Eure Gletscher schmelzen ja laut Lesch....

  • Die zweite Disk die failed ist, sitzt in der selben Bay wie die erste. Und nein, es ist nicht die selbe Platte! Und einmal ist genau diese Bay schon als ganzes komplett failed. Ich denke das issn starker Indikator.

    Zudem gibt es keine physischen Oberflächenfehler, keine Seek Errors, keine Probleme mit dem Spin und keine Timeouts. Sowohl Elektronik wie auch mechanische Komponenten der Disks schauen sauber aus. Auch ein Rebuild auf eine betroffene Disk ist fehlerfrei durchgelaufen.

    Ich will nicht sagen es wäre "eindeutig", aber ich laufe einfach Mal dem deutlichsten Indiz nach.

    AC Probleme würde ich sofort an der USV sehen, und auch auf dem USB Managementinterface vom Corsair Netzteil.

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

  • Hatte ich auch schon, also:
    1. HDD failed
    2. neue HDD ins Bay
    3. noch im Rebuild gefailed
    4. neue Bay rein - alles gut

    Obwohl die sauteuer sind, scheinen die nicht unbedingt mit zusätzlicher Sorgfalt gebaut zu sein
    (ich hab welche von Icy Box).
    Erinnert an so billige USB Platten, die dann auch einfach mal im Betrieb im System verschwinden.

  • Vom Frame her wirken die Chieftecs ja eigentlich sehr hochwertig. Aber jo, ich werd's einfach demnächst tauschen müssen und aus. Ich seh's auch im Rebuild, daß die entsprechende Bay immer kurz steckt, und die Activity LEDs leuchten bei allen drei Disks der Bay weiter, während die anderen 9 Einschübe derweil kurz dunkel bleiben. Als würde diese eine Bay den Rebuild irgendwie bremsen. Das läuft periodisch so.

    Mal schaun. Frische Backups hab ich, viel kann nicht passieren (außer erheblichen Zeitverlustes).

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

  • Rebuild wieder abgebrochen, Bay wieder im Lockup. Und *ding ding* die SMS dahergeträllert, Disk Failure, die nächste. Also 2 Disks down, tlw. hat er die zweite gar nicht mehr gesehen und ich mußte sie raus- und wieder reinstecken, sonst war einfach der Einschub dunkel. "Langsam wird's haarig" dachte ich mir dabei. Also Maschine gestern Nacht abgedreht und ins Bett verpflanzt.

    Diese ganzen scheiß Probleme. Ich hatte ja auch Performanceschwierigkeiten die letzten Wochen, so wechselhaft zu- und abnehmende Leistung, fiel mir grade wieder ein. Vielleicht hängte das ja zusammen?

    Natürlich hat's mir keine Ruhe gelassen, um 5 Uhr Mal aufgestanden für eine Klovisite, schau ich so rein... so dunkel da im Arbeitszimmer und so still... hat mich alles derart gewurmt.. Licht an, begonnen den Rechner zu zerreißen. Bay raus, komplett zerlegt, neue Bay auch zerlegt, Platinen und Lüfter verpflanzt, alles wieder zusammengebaut und reingesteckt. Knapp zwei Stunden Arbeit. So gegen 07:15 war's dann aber wirklich höchste Zeit, da muß ich einfach echt los zur Arbeit.


    07:00 - 07:05: A Moment of Zen! (oder man könnte auch sagen: Ich hab mich nicht getraut, den Rechner einzuschalten ;)).
    07:05 - 07:10: Rechner up im Controller BIOS und im 2-Disk Rebuild.
    08:12: Grade vorher aufs Ethernet Management Interface eingelogged von der Arbeit aus: "Rebuilding(11.0%)" steht da. Der Speed ist scheints wieder da nach dem Bay Umbau! Der letzte Rebuild hat ja knapp 8 TAGE gedauert (!!).

    Bin Mal vorsichtig optimistisch!

    Edit: Wenn das jetzt echt so durchrennt und danach auch die Leistung wieder passt wie ganz am Anfang, dann kauf ich mir noch eine sechste (!) von den Bays als Spare. Scheinbar sterben die Bays ja flotter als die Disks. :topmodel: Schäden wie Brandflecken, gebrochene Lötstellen oder ähnlich waren aber visuell nicht zu erkennen.

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

    5 Mal editiert, zuletzt von GrandAdmiralThrawn (3. November 2016 um 08:48)

  • Vorsichtig, :respekt::topmodel:

    In meinen Augen ein Fakt ist, egal ob Gott oder die Philosophie werken will, ein bedauerliches Übel bleibt erhalten, das Erbe, was an Menschen weiter gegeben wird, die es selbst nicht erwirtschaftet haben.

    Das Erbrecht muss erlöschen, erst dann wird die Vernunft triumphieren können über die Macht des Geldes als Druckmittel oder Sklavenpeitsche hinter dem Menschen selbst und die Erde wieder für folgende Generationen befreien.

    Zitat: V.F

  • ha ich kann das echt gut nachfühlen (hab netto ja auch an die 54TB).
    Als ich die Probleme hatte, war mir auch teilweise ganz schön mulmig. vor allem weil ich nicht alles backuppen konnte
    (mirror-nas war einfach nicht groß genug). Dann mal viel Glück mit dem Rebuild :spitze:

  • Du hast auch ein 50+TB-NAS zu Hause und kein Thread mit Beschreibung und Bildern?

    Das wird aber nachgeholt oder? :adsh::topmodel:

    :topmodel:

    Jau ganz schön frech :D

    Ich glaub vereinzelte Bilder habs da aber mal zu.

  • Zeit wird's! :)

    Status: Rebuilding(39.6%)

    Edit: Und um 13:58: Rebuilding(66.8%)

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

    Einmal editiert, zuletzt von GrandAdmiralThrawn (3. November 2016 um 13:58)

  • Und zu früh gefreut. RAID Set Failed.

    Jetzt hats die dritte Disk. Allerdings wieder die selbe Bay. Jetzt weiß ich aber ned mehr weiter..?!

    Edit: SAS Kabel kanns auch ned sein, da haben wir schon 2 verschiedene dabei jetzt.

    Edit 2: Und lahm isses jetzt auch wieder.

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

    2 Mal editiert, zuletzt von GrandAdmiralThrawn (3. November 2016 um 16:11)

  • Jo, SAS kanns wie gesagt ned sein. Weil die dritte Disk die failed is war an einem anderen Breakoutkabel. Habe soeben die Stromkabel von Bay 1 (sauber) und Bay 2 (betroffen) durchrotiert. Mal schaun ob als nächstes eine Disk in Bay 1 failed.

    Wenns das auch nicht sein sollte, dann kann ich noch die Disks durchtauschen, obwohl das eigentlich nix bringen sollte.. Dann hab ich echt KEINE Ahnung mehr.

    Irre aber: Die Daten sind IMMER noch da.. Und intakt.

    (Fehlerhaften Rebuild würde ich sofort bemerken, da zerhackts mir die Cryptoscheiße, und es würd gar nichts mehr gehn.)

    Man sollte auch dazusagen: Die Maschine wird nicht angefaßt. Die war nach Abschluß des Baus nie wieder offen... Wenn sonst noch jemand Ideen hat, nur her damit!

    Edit: Was auch spannend ist: Nach einem Kaltstart ist der Array wieder schnell beim Rebuilden. Also irgendwas "passiert" da, was nicht nur Disks rauswirft, sondern auch noch die nachfolgende Leistung des RAID Arrays drastisch reduziert...

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"

  • Ich habe den Noctua noch in der Anfangsphase wieder entfernt, und den Originallüfter wieder montiert, weil mir das letzten Endes doch nicht ganz geheuer war, das isses also nicht. Der kleine Fan ist halt etwas laut, aber was solls. Ich schau auch immer wieder Mal auf die Temps, der Areca hat ja einen Haufen Sensoren.

    So, die Stromkabel sind von Bay 2 zu Bay 1 gewandert, und umgekehrt.

    Bay 1 ist soeben (statt der 2er) ausgefallen. Das Problem "scheint" mit den Stromkabeln gewandert zu sein. Ich nutze die beiden jetzt Mal nicht mehr, und Teile die beiden verbleibenden Stromkabel von Bay 2 auf 1 und 2 auf.

    Zur Erklärung: Jede Bay hat 2 Stromkabel. Allerdings läuft eine Bay laut Dokumentation auch mit nur einem Kabel. Also mach ich's jetzt so und versuche es erneut. Wie der Array diesen ganzen Wahnsinn bis jetzt überlebt hat ist mir echt schleierhaft...

    Beim 3-Disk Fail muß man die LETZTE zuerst reaktivieren (also die, auf die noch konsistent mit dem RAID Zustand ist), und dann die beiden anderen. Danach kann man den Rebuild 1:1 fortführen. Haarig³, aber es funktioniert. Mal schauen wie lange... Glauben tu ich hier nicht mehr an viel...

    1-6000-banner-88x31-jpg

    Stolzer Besitzer eines 3dfx Voodoo5 6000 AGP Prototypen:

    • 3dfx Voodoo5 6000 AGP HiNT Rev.A-3700

    [//wp.xin.at] - No RISC, no fun!

    QotY: Girls Love, BEST Love; 2018 - Lo and behold, for it is the third Coming; The third great Year of Yuri, citric as it may be! Edit: 2019 wasn't too bad either... Edit: 2020... holy crap, we're on a roll here~♡!

    Quote Bier.jpg@IRC 2020: "Je schlimmer der Fetisch, desto besser!"