Hallo Leute!
Heute, als ich die Logs geprüft habe, habe ich diese Meldung von Smart gelesen:
Mar 2 15:21:32 frodo smartd[1699]: Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
Dann kam noch das:
Mar 2 18:30:47 frodo kernel: [81552.424382] ata3.00: exception Emask 0x0 SAct 0x1000000 SErr 0x0 action 0x0 Mar 2 18:30:47 frodo kernel: [81552.424389] ata3.00: irq_stat 0x40000008 Mar 2 18:30:47 frodo kernel: [81552.424395] ata3.00: failed command: READ FPDMA QUEUED Mar 2 18:30:47 frodo kernel: [81552.424402] ata3.00: cmd 60/00:c0:b8:fa:5d/01:00:22:00:00/40 tag 24 ncq 131072 in Mar 2 18:30:47 frodo kernel: [81552.424402] res 41/40:00:c5:fa:5d/00:00:22:00:00/40 Emask 0x409 (media error) <F> Mar 2 18:30:47 frodo kernel: [81552.424407] ata3.00: status: { DRDY ERR } Mar 2 18:30:47 frodo kernel: [81552.424410] ata3.00: error: { UNC } Mar 2 18:30:47 frodo kernel: [81552.439316] ata3.00: configured for UDMA/100 Mar 2 18:30:47 frodo kernel: [81552.439339] sd 2:0:0:0: [sda] Unhandled sense code Mar 2 18:30:47 frodo kernel: [81552.439343] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439345] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Mar 2 18:30:47 frodo kernel: [81552.439348] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439350] Sense Key : Medium Error [current] [descriptor] Mar 2 18:30:47 frodo kernel: [81552.439355] Descriptor sense data with sense descriptors (in hex): Mar 2 18:30:47 frodo kernel: [81552.439357] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Mar 2 18:30:47 frodo kernel: [81552.439368] 22 5d fa c5 Mar 2 18:30:47 frodo kernel: [81552.439374] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439377] Add. Sense: Unrecovered read error - auto reallocate failed Mar 2 18:30:47 frodo kernel: [81552.439380] sd 2:0:0:0: [sda] CDB: Mar 2 18:30:47 frodo kernel: [81552.439382] Read(10): 28 00 22 5d fa b8 00 01 00 00 Mar 2 18:30:47 frodo kernel: [81552.439391] end_request: I/O error, dev sda, sector 576584389 Mar 2 18:30:47 frodo kernel: [81552.439448] ata3: EH complete
Langsam kriege ich Angst... Die Festplatte ist zwar nicht mehr der neuste, aber so alt ist es ja auch nicht (3 Jahre).
Ich habe was in Internet gesucht und bin nicht ganz sicher, was das bedeutet... Es ist also ein LESEfehler, was u.U. auch von Kabel oder was anderes verursacht werden kann. Und es sollte nur eine VERMUTUNG, dass der Sektor defekt ist (das wird erst beim schreiben festgestellt). Oder verstehe ich falsch?
Was ist eure Empfehlung?
Danke Luca Bertoncello (lucabert@lucabert.de)
Ein paar kaputte Sektoren sind nicht schlimm, die werden als kaputt markiert und nicht mehr beschrieben. Ein Indikator dass etwas nicht stimmt sind sie aber IMHO.
Ich persönlich würde das tun: Backup machen und nicht mehr auf die Platte verlassen. Du weißt ja, die Frage ist nicht ob eine Platte stirbt, sondern wann...
On 2 March 2017 21:23:09 CET, Luca Bertoncello lucabert@lucabert.de wrote:
Hallo Leute!
Heute, als ich die Logs geprüft habe, habe ich diese Meldung von Smart gelesen:
Mar 2 15:21:32 frodo smartd[1699]: Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
Dann kam noch das:
Mar 2 18:30:47 frodo kernel: [81552.424382] ata3.00: exception Emask 0x0 SAct 0x1000000 SErr 0x0 action 0x0 Mar 2 18:30:47 frodo kernel: [81552.424389] ata3.00: irq_stat 0x40000008 Mar 2 18:30:47 frodo kernel: [81552.424395] ata3.00: failed command: READ FPDMA QUEUED Mar 2 18:30:47 frodo kernel: [81552.424402] ata3.00: cmd 60/00:c0:b8:fa:5d/01:00:22:00:00/40 tag 24 ncq 131072 in Mar 2 18:30:47 frodo kernel: [81552.424402] res 41/40:00:c5:fa:5d/00:00:22:00:00/40 Emask 0x409 (media error) <F> Mar 2 18:30:47 frodo kernel: [81552.424407] ata3.00: status: { DRDY ERR } Mar 2 18:30:47 frodo kernel: [81552.424410] ata3.00: error: { UNC } Mar 2 18:30:47 frodo kernel: [81552.439316] ata3.00: configured for UDMA/100 Mar 2 18:30:47 frodo kernel: [81552.439339] sd 2:0:0:0: [sda] Unhandled sense code Mar 2 18:30:47 frodo kernel: [81552.439343] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439345] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Mar 2 18:30:47 frodo kernel: [81552.439348] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439350] Sense Key : Medium Error [current] [descriptor] Mar 2 18:30:47 frodo kernel: [81552.439355] Descriptor sense data with sense descriptors (in hex): Mar 2 18:30:47 frodo kernel: [81552.439357] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00 Mar 2 18:30:47 frodo kernel: [81552.439368] 22 5d fa c5 Mar 2 18:30:47 frodo kernel: [81552.439374] sd 2:0:0:0: [sda] Mar 2 18:30:47 frodo kernel: [81552.439377] Add. Sense: Unrecovered read error - auto reallocate failed Mar 2 18:30:47 frodo kernel: [81552.439380] sd 2:0:0:0: [sda] CDB: Mar 2 18:30:47 frodo kernel: [81552.439382] Read(10): 28 00 22 5d fa b8 00 01 00 00 Mar 2 18:30:47 frodo kernel: [81552.439391] end_request: I/O error, dev sda, sector 576584389 Mar 2 18:30:47 frodo kernel: [81552.439448] ata3: EH complete
Langsam kriege ich Angst... Die Festplatte ist zwar nicht mehr der neuste, aber so alt ist es ja auch nicht (3 Jahre).
Ich habe was in Internet gesucht und bin nicht ganz sicher, was das bedeutet... Es ist also ein LESEfehler, was u.U. auch von Kabel oder was anderes verursacht werden kann. Und es sollte nur eine VERMUTUNG, dass der Sektor defekt ist (das wird erst beim schreiben festgestellt). Oder verstehe ich falsch?
Was ist eure Empfehlung?
Danke Luca Bertoncello (lucabert@lucabert.de)
Karsten kalias@posteo.org schrieb:
Hallo
Ein paar kaputte Sektoren sind nicht schlimm, die werden als kaputt markiert und nicht mehr beschrieben. Ein Indikator dass etwas nicht stimmt sind sie aber IMHO.
Naja, aktuell sieht es so aus, dass nur EIN Sektor defekt ist. Du schreibst aber, dass ein paar kaputte Sektoren nicht schlimm sind, aber du würdest dich nicht mehr auf die Festplatte verlassen... Ist es nicht etwas widersprechend?
Ich persönlich würde das tun: Backup machen und nicht mehr auf die Platte verlassen. Du weißt ja, die Frage ist nicht ob eine Platte stirbt, sondern wann...
Also, eine Sicherung habe ich. Mehreren, sogar (eine nächtliche, auf meinem Server, mit den wichtigsten Daten und eine wöchentliche, auf DVD, mit allen Daten). Die funktionieren auch...
Wegen sterben... ich sage immer "früher oder später geht alles in die Mülltonne. Du auch, ich auch". Also, dass früher oder später die Festplatte sterben wird, war mir klar schon als ich sie gekauft habe.
Die Frage ist, ob ich schnellstmöglich eine neue Platte besorgen soll und alle Daten übertragen, oder ob ich noch entspannt warten soll, bis etwas mehr als nur eine kaputte Sektor gibt.
Danke Luca Bertoncello (lucabert@lucabert.de)
Ist halt schwer zu sagen was die/den kaputten Sektor verursacht hat. Verlassen, sprich sie als eine (von zwei) Backup HDDs zu verwenden, würde ich nicht mehr tun. Aber das mag jeder unterschiedlich machen/sehen. Was daran widersprüchlich ist, kann ich nicht erkennen. Wenn deine Backups funktionieren, warte doch einfach auf ein günstiges Angebot einer Platte, kauf' sie und ersetz' die Kaputte, wenn sie den Geist aufgegeben hat. Die Daten aus dem Backup wiederherstellen dürfte ja nicht unmengen an Zeit in Anspruch nehmen.
/K
On 03/02/2017 09:48 PM, Luca Bertoncello wrote:
Karsten kalias@posteo.org schrieb:
Hallo
Ein paar kaputte Sektoren sind nicht schlimm, die werden als kaputt markiert und nicht mehr beschrieben. Ein Indikator dass etwas nicht stimmt sind sie aber IMHO.
Naja, aktuell sieht es so aus, dass nur EIN Sektor defekt ist. Du schreibst aber, dass ein paar kaputte Sektoren nicht schlimm sind, aber du würdest dich nicht mehr auf die Festplatte verlassen... Ist es nicht etwas widersprechend?
Ich persönlich würde das tun: Backup machen und nicht mehr auf die Platte verlassen. Du weißt ja, die Frage ist nicht ob eine Platte stirbt, sondern wann...
Also, eine Sicherung habe ich. Mehreren, sogar (eine nächtliche, auf meinem Server, mit den wichtigsten Daten und eine wöchentliche, auf DVD, mit allen Daten). Die funktionieren auch...
Wegen sterben... ich sage immer "früher oder später geht alles in die Mülltonne. Du auch, ich auch". Also, dass früher oder später die Festplatte sterben wird, war mir klar schon als ich sie gekauft habe.
Die Frage ist, ob ich schnellstmöglich eine neue Platte besorgen soll und alle Daten übertragen, oder ob ich noch entspannt warten soll, bis etwas mehr als nur eine kaputte Sektor gibt.
Danke Luca Bertoncello (lucabert@lucabert.de)
Hi,
Am Thu, 2 Mar 2017 21:23:09 +0100 schrieb Luca Bertoncello lucabert@lucabert.de:
Mar 2 15:21:32 frodo smartd[1699]: Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
Es ist also ein LESEfehler, was u.U. auch von Kabel oder was anderes verursacht werden kann. Und es sollte nur eine VERMUTUNG, dass der Sektor defekt ist (das wird erst beim schreiben festgestellt). Oder verstehe ich falsch?
Ob das vom Kabel herrühren kann, weiß ich nicht genau, glaube aber nicht (das müsste anders aussehen). Ein pending sektor ist deswegen pending, weil die Platte gerade nichts damit anstellen kann. Solange du nicht in den Sektor schreibst, ist es sinnlos, ihn zu reallocaten (was sollte auch in den Ersatzsektor geschrieben werden, wenn der Quellsektor nicht lesbar ist?), und wer weiß, vielleicht kann der Sektor ja noch gelesen werden, wenn es kälter, wärmer, trockener, feuchter... ist. Du hast also eine Platte vor dir, der du nicht mehr vertrauen kannst.
Wenn es nur eine Betriebssystemplatte ist, kann man u.U. damit leben, aber als Datenplatte spielst du mit dem Feuer. Das würde ich nur riskieren, wenn du noch Redundanz übrig hast (mindestens also Raid6 bzw. raidz2), und am Besten ein prüfsummenbildendes Dateisystem wie ZFS verwendest. Darunter wären mir meine Daten zu schade für eine bekannt-defekte Platte.
Carsten
Am Donnerstag, den 02.03.2017, 21:23 +0100 schrieb Luca Bertoncello:
Hallo Leute!
Heute, als ich die Logs geprüft habe, habe ich diese Meldung von Smart gelesen:
Mar 2 15:21:32 frodo smartd[1699]: Device: /dev/sda [SAT], 1 Currently unreadable (pending) sectors
Dann kam noch das:
[..]
Langsam kriege ich Angst...
Verständlich.
Die Festplatte ist zwar nicht mehr der neuste, aber so alt ist es ja auch nicht (3 Jahre).
Ich habe was in Internet gesucht und bin nicht ganz sicher, was das bedeutet...
Ein Sektor ist mutmaßlich fehlerhaft. Das kann passieren. smartctl kann das z.B. während seiner Tests feststellen. Jede Festplatte hat hierfür noch genügend Reservesektoren. IIRC werden diese Sektoren von der Festplatte markiert und nicht wieder beschrieben. Dafür wird ein Reservesektor zur Verfügung gestellt. Soweit so normal oder eben auch nicht.
Zum einen weist das "pending" darauf hin, dass der Sektor noch nicht markiert wurde. IIRC muss man den fehlerhaften Sektor (via smartctl ermittelbar) gezielt ansprechen (z.B. mittels dd), damit er markiert und ausgetauscht wird. Dann wird sich der smartd auch nicht mehr beschweren. SMART zählt dann den entsprechenden Wert ausgetauschter Sektoren hoch. Aus dem Bauch heraus würde ich außerdem sagen, es wäre gut zu wissen, welche Datei den Sektor belegt und diese entsprechend wiederherstellen.
Es ist also ein LESEfehler, was u.U. auch von Kabel oder was anderes verursacht werden kann.
IMO unwahrscheinlich. Ich dachte S.M.A.R.T. läuft festplattenintern? Erfolgt nicht nur die Auswertung extern?
Und es sollte nur eine VERMUTUNG, dass der Sektor defekt ist (das wird erst beim schreiben festgestellt).
S.o. Beim Schreiben sollte der Sektor dann markiert und ersetzt werden.
Oder verstehe ich falsch?
Was ist eure Empfehlung?
Ich gehe davon aus, dass du Backups hast. Ohne die weiteren SMART-Daten deiner Festplatte, lässt sich kaum etwas zu ihrem Zustand sagen. Falls du Garantie hast, kannst du gerne auf Nummer sicher gehen.
HTH and Grüße, Daniel
lug-dd@mailman.schlittermann.de