Moin,
Ich hab hier
drachi:[hille] >dpkg -l smarts* Desired=Unknown/Install/Remove/Purge/Hold |Status=Not/Installed/Config-files/Unpacked/Failed-config/Half-installed |/ Err?=(none)/Hold/Reinst-required/X=both-problems (Status,Err: uppercase=bad) ||/ Name Version Description +++-==============-==============-============================================ ii smartsuite 2.1-1 SMART suite - SMART utility suite for Linux
zur HD-Überwachung installiert. Vorvorgestern kam vom smartd doch glatt eine Meldung: Jan 1 16:40:01 drachi smartd: Device: /dev/hdb, S.M.A.R.T. Attribute: 9 Changed 1 Die SMART-Doku selber gibt nicht viel her, google auch nicht und den Quelltext des Programmes verstehe ich mangels ausreichender C-Kenntnisse nicht. Jetzt kommt die saudumme Frage: Benutzt jemand das Programm auch und weiß, was der smartd mir damit sagen will?
drachi:[hille] >more /proc/ide/hdb/model Maxtor 2B020H1
Thanks, H.
Hilmar Preusse wrote :
Moin,
Ich hab hier
drachi:[hille] >dpkg -l smarts* Desired=Unknown/Install/Remove/Purge/Hold |Status=Not/Installed/Config-files/Unpacked/Failed-config/Half-installed |/ Err?=(none)/Hold/Reinst-required/X=both-problems (Status,Err: uppercase=bad) ||/ Name Version Description +++-==============-==============-============================================ ii smartsuite 2.1-1 SMART suite - SMART utility suite for Linux
zur HD-Überwachung installiert. Vorvorgestern kam vom smartd doch glatt eine Meldung: Jan 1 16:40:01 drachi smartd: Device: /dev/hdb, S.M.A.R.T. Attribute: 9 Changed 1 Die SMART-Doku selber gibt nicht viel her, google auch nicht und den
aus "man smartd" folgere ich schluss, daß Attribut 9 oft nichtstandard verwendet wird und zwar entweder die "Power On Hours" oder die Temperatur angibt. => mostly harmless. Im Zweifelsfall fragen Sie ihren Festplattenhersteller oder Apotheker. Der Nachfolger der smartsuite sind übrigens AFAIK die smartmontools:
seife@heppo:~> rpm -qi smartmontools Name : smartmontools Relocations: (not relocateable) Version : 5.1.18 Vendor: SuSE Linux AG, Nuernberg, Germany Release : 20 Build Date: Di 23 Sep 2003 18:52:28 CEST Install date: Sa 08 Nov 2003 14:27:33 CET Build Host: tornrose.suse.de Group : Hardware/Other Source RPM: smartmontools-5.1.18-20.src.rpm Size : 390251 License: GPL Signature : DSA/SHA1, Di 23 Sep 2003 19:21:23 CEST, Key ID a84edae89c800aca Packager : http://www.suse.de/feedback URL : http://smartmontools.sourceforge.net/ Summary : Monitor of S.M.A.R.T. disks and devices Description : SMARTmontools controls and monitors storage devices using the Self-Monitoring, Analysis and Reporting Technology System (S.M.A.R.T.) built into ATA and SCSI Hard Drives. This is used to check the reliability of the hard drive and to predict drive failures. The suite is derived from the smartsuite package, and contains two utilities. The first, smartctl, is a command line utility designed to perform simple S.M.A.R.T. tasks. The second, smartd, is a daemon that periodically monitors smart status and reports errors to syslog. The package is compatible with the ATA/ATAPI-5 specification. Future releases will be compatible with the ATA/ATAPI-6 andATA/ATAPI-7 specifications. The package is intended to incorporate as much "vendor specific" and "reserved" information as possible about disk drives. man smartctl and man smartd will provide more information.
Ich kriege bisher keine "bogus" Meldungen vom smartd.
On 05.01.04 Stefan Seyfried (seife@gmane0305.slipkontur.de) wrote:
Moin,
aus "man smartd" folgere ich schluss, daß Attribut 9 oft nichtstandard verwendet wird und zwar entweder die "Power On Hours" oder die Temperatur angibt. => mostly harmless.
Was hast Du für 'ne merkwürdige Manpage? Bei mir steht sowas nicht.
Im Zweifelsfall fragen Sie ihren Festplattenhersteller oder Apotheker.
Gut, also die HD-Doku. Wenn ich Zeit hab.
Der Nachfolger der smartsuite sind übrigens AFAIK die smartmontools:
smartd[487]: smartd version 5.26 Copyright (C) 2002-3 Bruce Allen smartd[487]: Home page is http://smartmontools.sourceforge.net/ smartd[487]: No configuration file /etc/smartd.conf found, scanning devices smartd[487]: Device: /dev/hda, opened smartd[487]: Device: /dev/hda, not found in smartd database. smartd[487]: Device: /dev/hda, does not support SMART Self-test Log. smartd[487]: Device: /dev/hda, does not support SMART Error Log. smartd[487]: Device: /dev/hda, is SMART capable. Adding to "monitor" list. smartd[487]: Device: /dev/hdb, opened smartd[487]: Device: /dev/hdb, not found in smartd database. smartd[487]: Device: /dev/hdb, is SMART capable. Adding to "monitor" list. smartd[487]: Monitoring 2 ATA and 0 SCSI devices smartd[490]: smartd has fork()ed into background mode. New PID=490. smartd[490]: file /var/run/smartd.pid written containing PID 490
Mift, na ich werde die Sache weiter beobachten. Dankeschön.
Ich kriege bisher keine "bogus" Meldungen vom smartd.
Ein paar Attribute Changes ab und zu. Mal sehn, wie sich das weiter entwickelt, zumal ich mein System irgendwann von hda auf hdb umziehen will.
H.
On Thu, Jan 08, 2004 at 12:02:07PM +0100, Hilmar Preusse wrote:
On 05.01.04 Stefan Seyfried (seife@gmane0305.slipkontur.de) wrote:
Moin,
aus "man smartd" folgere ich schluss, daß Attribut 9 oft nichtstandard verwendet wird und zwar entweder die "Power On Hours" oder die Temperatur angibt. => mostly harmless.
Was hast Du für 'ne merkwürdige Manpage? Bei mir steht sowas nicht.
die von einer SUSE 9.0 bzw. SUSE unstable
cut and paste aus "man smartd":
Here is an example configuration file. It's for illustrative pur poses only; please don't copy it onto your system without reading to the end of the DIRECTIVES Section below!
################################################ # This is an example smartd startup config # file /etc/smartd.conf for monitoring three # ATA disks and two SCSI disks. # # First ATA disk on each of two interfaces: # /dev/hda -a -m admin@yoyodyne.com,root@localhost /dev/hdc -a -I 194 -I 5 -i 12 # # SCSI disks. Send a TEST warning email to admin on # startup. # /dev/sda /dev/sdc -m admin@yoyodyne.com -M test # # Strange device. It's SCSI: # /dev/weird -d scsi # # Three ATA disks connected to a 3ware controller # /dev/sdb -d 3ware,0 -a /dev/sdb -d 3ware,1 -a /dev/sdb -d 3ware,2 -a # # The following line enables monitoring of the # ATA Error Log and the Self-Test Error Log. # It also tracks changes in both Prefailure # and Usage Attributes, apart from Attributes # 9, 194, and 231, and shows continued lines: # /dev/hdd -l error \ -l selftest \ -t \ # Attributes not tracked: -I 194 \ # temperature -I 231 \ # also temperature -I 9 # power-on hours # ################################################
---nochmal cut'n'paste-----
-v N,OPTION Modifies the labeling for Attribute N, for disks which use non-standard Attribute definitions. This is useful in con nection with the Attribute tracking/reporting Directives.
This Directive may appear multiple times. Valid arguments to this Directive are:
9,minutes - Raw Attribute number 9 is power-on time in min utes. Its raw value will be displayed in the form 'Xh+Ym'. Here X is hours, and Y is minutes in the range 0-59 inclu sive. Y is always printed with two digits, for example Ž06' or Ž31' or '00'.
9,seconds - Raw Attribute number 9 is power-on time in sec onds. Its raw value will be displayed in the form 'Xh+Ym+Zs'. Here X is hours, Y is minutes in the range 0-59 inclusive, and Z is seconds in the range 0-59 inclusive. Y and Z are always printed with two digits, for example Ž06' or Ž31' or '00'.
9,halfminutes - Raw Attribute number 9 is power-on time, mea sured in units of 30 seconds. This format is used by some Samsung disks. Its raw value will be displayed in the form 'Xh+Ym'. Here X is hours, and Y is minutes in the range 0-59 inclusive. Y is always printed with two digits, for example Ž06' or Ž31' or '00'.
9,temp - Raw Attribute number 9 is the disk temperature in Celsius.
192,emergencyretractcyclect - Raw Attribute number 192 is the Emergency Retract Cycle Count.
--- und nochmal ----
Note: a table of hard drive models, listing which Attribute corresponds to temperature, can be found at: http://core%C2%AD dump.free.fr/linux/hddtemp.db
mit diesen Informationen habe ich mir dann einen "educated guess" erlaubt, was Attribut 9 sein könnte :-)
Gut, also die HD-Doku. Wenn ich Zeit hab.
Ja, auch wenn sowas in der Enduser-dokumentation nicht drinstehen wird.
Der Nachfolger der smartsuite sind übrigens AFAIK die smartmontools:
smartd[487]: smartd version 5.26 Copyright (C) 2002-3 Bruce Allen smartd[487]: Home page is http://smartmontools.sourceforge.net/ smartd[487]: No configuration file /etc/smartd.conf found, scanning devices smartd[487]: Device: /dev/hda, opened smartd[487]: Device: /dev/hda, not found in smartd database. smartd[487]: Device: /dev/hda, does not support SMART Self-test Log. smartd[487]: Device: /dev/hda, does not support SMART Error Log. smartd[487]: Device: /dev/hda, is SMART capable. Adding to "monitor" list. smartd[487]: Device: /dev/hdb, opened smartd[487]: Device: /dev/hdb, not found in smartd database. smartd[487]: Device: /dev/hdb, is SMART capable. Adding to "monitor" list. smartd[487]: Monitoring 2 ATA and 0 SCSI devices smartd[490]: smartd has fork()ed into background mode. New PID=490. smartd[490]: file /var/run/smartd.pid written containing PID 490
Mift, na ich werde die Sache weiter beobachten. Dankeschön.
Ich kriege bisher keine "bogus" Meldungen vom smartd.
Ein paar Attribute Changes ab und zu. Mal sehn, wie sich das weiter entwickelt, zumal ich mein System irgendwann von hda auf hdb umziehen will.
Die attribute changes sind normal, insbesondere wenn du die power-on-hours etc. nicht ignorierst. Die neueren smartmontools scheinen da aber schon recht sinnvolle defaults zu haben.
On 08.01.04 Stefan Seyfried (seife@gmane0305.slipkontur.de) wrote:
On Thu, Jan 08, 2004 at 12:02:07PM +0100, Hilmar Preusse wrote:
Moin,
Was hast Du für 'ne merkwürdige Manpage? Bei mir steht sowas nicht.
die von einer SUSE 9.0 bzw. SUSE unstable
cut and paste aus "man smartd":
Danke für die Doku. Nach Installation der smartmontools hatte ich die auch. Sorry an alle für den Traffic!
--- und nochmal ---- Note: a table of hard drive models, listing which Attribute corresponds to temperature, can be found at: http://core%C2%ADdump.free.fr/linux/hddtemp.db
Gut, da werde ich nochmal reinschauen. Danke.
mit diesen Informationen habe ich mir dann einen "educated guess" erlaubt, was Attribut 9 sein könnte :-)
Gut, also die HD-Doku. Wenn ich Zeit hab.
Ja, auch wenn sowas in der Enduser-dokumentation nicht drinstehen wird.
Stimmt. Da drin ist zwar dokumentiert, wie man SMART anspricht, aber nicht, was die einzelnen Parameter bedeuten.
Die attribute changes sind normal, insbesondere wenn du die power-on-hours etc. nicht ignorierst. Die neueren smartmontools scheinen da aber schon recht sinnvolle defaults zu haben.
Gut, da werde ich mir wohl mal ein Config-File bauen.
Danke, H.
Mahlzeit Hilmar
Am Donnerstag, 8. Januar 2004 12:02 schrieb Hilmar Preusse:
On 05.01.04 Stefan Seyfried (seife@gmane0305.slipkontur.de) wrote:
Moin,
aus "man smartd" folgere ich schluss, daß Attribut 9 oft nichtstandard verwendet wird und zwar entweder die "Power On Hours" oder die Temperatur angibt. => mostly harmless.
Der Test am (noch) lebenden Objekt ;-)
<------------- schnipp ---------------> debian:~ # smartctl --all /dev/hda
[...] Device Model: Maxtor 4D040H2 [...] SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE WHEN_FAILED RAW_VALUE 3 Spin_Up_Time 0x0027 235 234 063 Pre-fail - 5913 4 Start_Stop_Count 0x0032 253 253 000 Old_age - 128 5 Reallocated_Sector_Ct 0x0033 253 253 063 Pre-fail - 0 6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail - 0 7 Seek_Error_Rate 0x000a 253 252 000 Old_age - 0 8 Seek_Time_Performance 0x0027 251 241 187 Pre-fail - 39999 9 Power_On_Hours 0x0032 237 237 000 Old_age - 5915 10 Spin_Retry_Count 0x002b 253 252 223 Pre-fail - 0 11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail - 0 12 Power_Cycle_Count 0x0032 253 253 000 Old_age - 155 [...] <------------- schnapp --------------->
Hier bei der Platte steht die ID 9 anscheinend für die Power_ON_Hours. Die Zeit in Stunden hat die sicherlich schon auf dem Buckel. Eher noch mehr. Ansonsten brauch die Platte sofort kalte Wickel gegen Fieber :-)
Was hast Du für 'ne merkwürdige Manpage? Bei mir steht sowas nicht.
Implicit wird es wohl drin stehen. In "man smartd" kannst du mal nach "HOUR" suchen. Da findest du eine Bespielkonfiguration, wo die 9 mit Power_On bezeichnet wird. In dem Manual zu smartctl wird die Option -v beschrieben
<------------- schnipp ---------------> -v N,OPTION, --vendorattribute=N,OPTION [...] 9,minutes - Raw Attribute number 9 is power-on time in minutes. Its raw value will be displayed in the form 'Xh+Ym'. Here X is hours, and Y is minutes in the range 0-59 inclusive. Y is always printed with two digits, for example Ž06' or Ž31' or '00'.
9,temp - Raw Attribute number 9 is the disk temper ature in Celsius. [...] <--------------- schnapp -------------->
Eventuell ist auch noch der zweite Punkt aus der FAQ für deine Platte anwendbar.
<--------------- schnipp --------------> [Quelle: http://smartmontools.sourceforge.net/]
The power-on timer (Attribute 9 raw value) on my Maxtor disk acts strange.
There are three related problems with Maxtor's SMART firmware:
1 - On some disks from 2001/2002, the raw value of Attribute 9 (Power On Time) is supposed to be minutes. But it advances at an unpredictable rate, always more slowly than one count per minute. One (unconfirmed) theory is that when the disk is in idle mode, the counter stops advancing. This is only supposed to happen in standby mode.
2 - In Maxtor disks that use the raw value of Attribute 9 as a minutes counter, only two bytes (of the six available) are used to store the raw value. So it resets to zero once every 65536=2^16 minutes, or about once every 1092 hours. This is fixed in all Maxtor disks manufactured after July 2003, where the raw value was extended to four bytes.
3 - In Maxtor disks that use the raw value of Attribute 9 as a minutes counter, the hour time-stamps in the self-test and ATA error logs are calculated by right shifting 6 bits. This is equivalent to dividing by 64 rather than by 60. As a result, the hour time stamps in these logs advance 7% more slowly than they should. Thus, if you do self-tests once per week at the same time, instead of the time-stamps being 168 hours apart, they are 157 hours apart. This is also fixed in all Maxtor disks manufactured after July 2003. <--------------- schnapp -------------->
Jens
On 08.01.04 Jens Weisse (jens.weisse@gmx.net) wrote:
Moin,
Der Test am (noch) lebenden Objekt ;-)
<------------- schnipp ---------------> debian:~ # smartctl --all /dev/hda
[...] Device Model: Maxtor 4D040H2 [...] SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE WHEN_FAILED RAW_VALUE 3 Spin_Up_Time 0x0027 235 234 063 Pre-fail - 5913 4 Start_Stop_Count 0x0032 253 253 000 Old_age - 128 5 Reallocated_Sector_Ct 0x0033 253 253 063 Pre-fail - 0 6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail - 0 7 Seek_Error_Rate 0x000a 253 252 000 Old_age - 0 8 Seek_Time_Performance 0x0027 251 241 187 Pre-fail - 39999 9 Power_On_Hours 0x0032 237 237 000 Old_age - 5915 10 Spin_Retry_Count 0x002b 253 252 223 Pre-fail - 0 11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail - 0 12 Power_Cycle_Count 0x0032 253 253 000 Old_age - 155 [...] <------------- schnapp --------------->
SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 4 Start_Stop_Count 0x0032 253 253 000 Old_age Always - 62 9 Power_On_Hours 0x0032 252 252 000 Old_age Always - 27830
2783/24=115 so lange hab ich das Gerät doch noch gar nicht. Ist wohl doch nicht nagelneu. Nein, das sind Minuten. pffft gut gegangen.
194 Temperature_Celsius 0x0032 253 253 000 Old_age Always - 0
Ich werde die Abschaffung unseres Kühlschrankes beantragen ;-)
Implicit wird es wohl drin stehen. In "man smartd" kannst du mal nach "HOUR" suchen. Da findest du eine Bespielkonfiguration, wo die 9 mit Power_On bezeichnet wird. In dem Manual zu smartctl wird die Option -v beschrieben
Gut, danke.
<--------------- schnipp --------------> [Quelle: http://smartmontools.sourceforge.net/]
The power-on timer (Attribute 9 raw value) on my Maxtor disk acts strange.
There are three related problems with Maxtor's SMART firmware:
1 - On some disks from 2001/2002, the raw value of Attribute 9 (Power On Time) is supposed to be minutes. But it advances at an unpredictable rate, always more slowly than one count per minute. One (unconfirmed) theory is that when the disk is in idle mode, the counter stops advancing. This is only supposed to happen in standby mode.
Die sollte jünger sein. Na ja ich werd das prüfen.
2 - In Maxtor disks that use the raw value of Attribute 9 as a minutes counter, only two bytes (of the six available) are used to store the raw value. So it resets to zero once every 65536=2^16 minutes, or about once every 1092 hours. This is fixed in all Maxtor disks manufactured after July 2003, where the raw value was extended to four bytes.
Nochmal aus obigem Output: Note: timestamp "wraps" after 2^32 msec = 49.710 days.
OK, danke an Euch beide. Ich werde jetzt erstmal ein Konfig-File zusammenbauen damit mir die Uptime nicht ewig um due Ohren gehauen wird.
EOT, Hilmar
lug-dd@mailman.schlittermann.de