Festplatte zum Walhalla? - Lug-dd

25 Oct 2013


      Hallo Leute!
Diese Nacht hat Nagios mir eine Nachricht geschickt, die ich eigentlich nie
sehen wollte, und zwar, dass der Status des Software-RAID auf einem Server
CRITICAL ist:
CRITICAL md0 status=[_U].
In der SysLog sehe ich:
Oct 25 06:10:03 dailyorder kernel: [2149906.181276] ata1: link is slow to respond, please be patient (ready=0)
Oct 25 06:10:08 dailyorder kernel: [2149911.030023] ata1: SRST failed (errno=-16)
Oct 25 06:10:08 dailyorder kernel: [2149911.030226] ata1: soft resetting link
Oct 25 06:10:13 dailyorder kernel: [2149916.230024] ata1: link is slow to respond, please be patient (ready=0)
Oct 25 06:10:18 dailyorder kernel: [2149921.090023] ata1: SRST failed (errno=-16)
Oct 25 06:10:18 dailyorder kernel: [2149921.090227] ata1: soft resetting link
Oct 25 06:10:23 dailyorder kernel: [2149926.290033] ata1: link is slow to respond, please be patient (ready=0)
Oct 25 06:10:53 dailyorder kernel: [2149956.110021] ata1: SRST failed (errno=-16)
Oct 25 06:10:53 dailyorder kernel: [2149956.110228] ata1: soft resetting link
Oct 25 06:10:58 dailyorder kernel: [2149961.130023] ata1: SRST failed (errno=-16)
Oct 25 06:10:58 dailyorder kernel: [2149961.130226] ata1: reset failed, giving up
Oct 25 06:10:58 dailyorder kernel: [2149961.130418] ata1.00: disabled
Oct 25 06:10:58 dailyorder kernel: [2149961.130426] ata1.00: device reported invalid CHS sector 0
Oct 25 06:10:58 dailyorder kernel: [2149961.130446] ata1: EH complete
Oct 25 06:10:58 dailyorder kernel: [2149961.130496] sd 0:0:0:0: [sda] Unhandled error code
Oct 25 06:10:58 dailyorder kernel: [2149961.130501] sd 0:0:0:0: [sda] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Oct 25 06:10:58 dailyorder kernel: [2149961.130509] sd 0:0:0:0: [sda] CDB: Write(10): 2a 00 1d 1c 57 80 00 00 08 00
Oct 25 06:10:58 dailyorder kernel: [2149961.130529] end_request: I/O error, dev sda, sector 488396672
Oct 25 06:10:58 dailyorder kernel: [2149961.130793] end_request: I/O error, dev sda, sector 488396672
Oct 25 06:10:58 dailyorder kernel: [2149961.131048] md: super_written gets error=-5, uptodate=0
Oct 25 06:10:58 dailyorder kernel: [2149961.131056] raid1: Disk failure on sda1, disabling device.
Oct 25 06:10:58 dailyorder kernel: [2149961.131059] raid1: Operation continuing on 1 devices.
Oct 25 06:10:58 dailyorder kernel: [2149961.171351] RAID1 conf printout:
Oct 25 06:10:58 dailyorder kernel: [2149961.171360]  --- wd:1 rd:2
Oct 25 06:10:58 dailyorder kernel: [2149961.171367]  disk 0, wo:1, o:0, dev:sda1
Oct 25 06:10:58 dailyorder kernel: [2149961.171374]  disk 1, wo:0, o:1, dev:sdb1
Oct 25 06:10:58 dailyorder kernel: [2149961.211271] RAID1 conf printout:
Oct 25 06:10:58 dailyorder kernel: [2149961.211277]  --- wd:1 rd:2
Oct 25 06:10:58 dailyorder kernel: [2149961.211283]  disk 1, wo:0, o:1, dev:sdb1
Oct 25 06:11:29 dailyorder kernel: [2149991.980053] ata2: lost interrupt (Status 0x51)
Oct 25 06:11:29 dailyorder kernel: [2149991.980090] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Oct 25 06:11:29 dailyorder kernel: [2149991.980376] ata2.00: failed command: FLUSH CACHE EXT
Oct 25 06:11:29 dailyorder kernel: [2149991.980606] ata2.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Oct 25 06:11:29 dailyorder kernel: [2149991.980609]          res 51/04:01:01:00:00/00:00:00:00:00/a0 Emask 0x1 (device error)
Oct 25 06:11:29 dailyorder kernel: [2149991.981214] ata2.00: status: { DRDY ERR }
Oct 25 06:11:29 dailyorder kernel: [2149991.981403] ata2.00: error: { ABRT }
Oct 25 06:11:29 dailyorder kernel: [2149992.321590] ata2.00: configured for UDMA/133
Oct 25 06:11:29 dailyorder kernel: [2149992.321616] ata2: EH complete
Also, ich würde wirklich sagen, dass die erste Festplatte (/dev/sda) diese
Welt verlassen hat.
Sage ich richtig?
Ich würde dann den Provider anrufen und eine neue Festplatte bestellen,
allerdings freue ich mich auf eure Kommentare über das Problem.
Außerdem, da es bisher mir glücklicherweise nicht passiert ist, dass ich
solches ein Problem habe, würde ich mich freuen wenn jemand, der schon
Erfahrung hat, mir sagen kann, was ich machen soll, nachdem der Provider die
Festplatte getauscht hat.
Danke
Luca Bertoncello
(lucabert@lucabert.de)