On Wed, Jun 20, 2001 at 10:22:16AM +0200, Jens Puruckherr wrote:
Hallo,
meine Odysse geht weiter.
... [tausende logs] ...
Da du immer noch gegen die springende Zeit ankämpftst und somit nach wie vor nicht nachvollziehen kannst, was wann passiert solltest du wirklich mal regelmäßige Logeintrage von einem Rechner mit funktionierender Zeit aus machen. Also etwa alle 5 minuten ein
orderlicher_host$ ssh kaputter_host logger +++++ ZEIT: `date` +++++
womit die Zeit von orderlicher_host im log von kaputter_host stehen sollte. Weiterhin wäre es nützlich, wenn du auf dem kaputten Ding dem syslogd eine temporäre Regel verpaßt, wodurch er ALLES IN EIN FILE loggt. Das ist deutlich übersichtlicher, als wenn man immer 10 logfiles parallel betrachten muss. Auch samba ist sicherlich dazu zu bewegen, per syslog zu loggen.
Dann siehst du auf dem kaputten Ding endlich mal, WANN wirklich WAS abgeht. Deinen Beschreibungen sind bis jetzt nämlich recht konfus, da du immer von samba, cron, backup und 83 anderen Dingen gleichzeitig berichtest.
Frohes Fehlersuchen, Reinhard
nachvollzie
Heute hatte ich mal das seltsame Glück, das der Server bis nachts zum Backup gekommen ist - um 23.30 Uhr. 0.01 Ihr erhalte ich auch noch eine Sensormeldung - selten genug geworden. Heute früh rufen mich die Kolegen an - Anmeldung am PDC war möglich(!) aber man konnte sich mit keiner Freigabe mehr verbinden. Ich konnte moch von der Ferne auch nicht einloggen, kein ping - also Anweisung durch Telefon: RESET Ich kann nichts, aber auch garnichts finden, was zu diesem Verhalten führt. Hier nochmal, was ich für wichtig erachte:
folgende Logs: /var/log/log.smb:
[2001/06/20 00:19:22, 1] nmbd/nmbd_processlogon.c:process_logon_packet(70) process_logon_packet: Logon from 192.168.1.3: code = 0x7
^^^^^^^^^^^^^^^^^^^^^^^^^^ letzter Request vom NT-Server nebenan
[2001/06/20 08:54:32, 1] nmbd/nmbd.c:main(757) Netbios nameserver version 2.0.7 started. Copyright Andrew Tridgell 1994-1998 [2001/06/20 08:54:33, 0] nmbd/asyncdns.c:start_async_dns(150) started asyncdns process 380
/var/log.volkmar: (ein Mitarbeiter)
[2001/06/19 12:04:48, 1] smbd/service.c:close_cnum(583) klaus (192.168.1.10) closed connection to service profile [2001/06/19 12:05:27, 1] smbd/service.c:make_connection(550) klaus (192.168.1.10) connect to service profile as user volkmar (uid=507, gid=801) (pid 9095) [2001/06/19 12:05:30, 1] smbd/service.c:close_cnum(583) klaus (192.168.1.10) closed connection to service Daten [2001/06/19 12:05:30, 1] smbd/service.c:close_cnum(583) klaus (192.168.1.10) closed connection to service bank [2001/06/19 12:05:30, 1] smbd/service.c:close_cnum(583) klaus (192.168.1.10) closed connection to service profile
^^^^^^^^^^^^^^^^^^ hier fehlt das Abmelden von gestern abend, aber vieleicht isses das ja auch; beu den Zeiten, die der Server hat....
[2001/06/20 08:58:36, 1] smbd/service.c:make_connection(550) klaus (192.168.1.10) connect to service netlogon as user volkmar (uid=507, gid=801) (pid 435) [2001/06/20 08:58:37, 1] smbd/service.c:make_connection(550) klaus (192.168.1.10) connect to service Daten as user elbvilla (uid=510, gid=801) (pid 435) [2001/06/20 08:58:37, 1] smbd/service.c:make_connection(550)
/var/log/messages:
Jun 19 20:58:00 file /USR/SBIN/CRON[9432]: (root) CMD (/root/zeitstempel) Jun 19 20:59:00 file /USR/SBIN/CRON[9436]: (root) CMD (/root/zeitstempel) Jun 19 21:01:00 file /USR/SBIN/CRON[9440]: (pummel) CMD (/usr/local/bin/watch_sensors) Jun 19 21:27:00 file -- MARK -- Jun 19 21:47:00 file -- MARK -- Jun 19 22:01:00 file /USR/SBIN/CRON[9448]: (pummel) CMD (/usr/local/bin/watch_sensors) Jun 19 22:27:00 file -- MARK -- Jun 19 22:47:00 file -- MARK -- Jun 19 23:01:00 file /USR/SBIN/CRON[9456]: (pummel) CMD (/usr/local/bin/watch_sensors) Jun 19 23:27:00 file -- MARK -- Jun 19 23:30:00 file /USR/SBIN/CRON[9464]: (root) CMD (/usr/local/bin/backup) Jun 19 23:47:00 file -- MARK -- Jun 20 00:00:00 file /USR/SBIN/CRON[9482]: (root) CMD (/root/zeitstempel) Jun 20 00:01:00 file /USR/SBIN/CRON[9487]: (pummel) CMD (/usr/local/bin/watch_sensors) Jun 20 00:01:00 file /USR/SBIN/CRON[9488]: (root) CMD (/root/zeitstempel) Jun 20 00:02:00 file /USR/SBIN/CRON[9498]: (root) CMD (/root/zeitstempel) Jun 20 00:03:00 file /USR/SBIN/CRON[9502]: (root) CMD (/root/zeitstempel) ....minütlich weiter..... Jun 20 00:27:00 file /USR/SBIN/CRON[9598]: (root) CMD (/root/zeitstempel) Jun 20 08:54:20 file syslogd 1.3-3: restart. Jun 20 08:54:24 file kernel: klogd 1.3-3, log source = /proc/kmsg started.
# Interessant ist, das der Cron die zeitstempeljobs nicht immer ausführt, sondern so, wie er es für richtig hält - macht uns das stutzig?
der letzte zeitstempel.dat: ##################### Wed Jun 20 00:27:00 CEST 2001 USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1 0.0 0.1 344 196 ? S Jun17 0:05 init root 2 0.0 0.0 0 0 ? SW Jun17 0:09 [kflushd] root 3 0.0 0.0 0 0 ? SW Jun17 0:03 [kupdate] root 4 0.0 0.0 0 0 ? SW Jun17 0:00 [kpiod] root 5 0.0 0.0 0 0 ? SW Jun17 0:23 [kswapd] root 6 0.0 0.0 0 0 ? SW Jun17 0:00 [md_thread] root 34 0.0 0.0 0 0 ? SW Jun17 0:00 [kreiserfsd] root 293 0.0 2.1 5220 2792 ? S Jun17 0:00 /usr/sbin/httpd -f /etc/httpd/httpd.conf -D SSL -D SUSEHELP wwwrun 303 0.0 2.1 5220 2804 ? S Jun17 0:00 /usr/sbin/httpd -f /etc/httpd/httpd.conf -D SSL -D SUSEHELP root 329 0.0 0.3 1120 508 ? S Jun17 0:00 /usr/sbin/lpd root 377 0.0 0.9 2088 1184 ? S Jun17 0:00 sendmail: accepting connections root 388 0.0 0.8 1896 1096 ? S Jun17 0:09 /usr/sbin/nmbd -D root 389 0.0 0.7 1912 944 ? S Jun17 0:00 /usr/sbin/nmbd -D root 395 0.0 0.5 1600 676 ? S Jun17 0:25 /usr/sbin/sshd root 401 0.0 0.8 2520 1160 ? S Jun17 0:00 /usr/sbin/smbd -D root 413 0.0 0.4 1164 536 tty5 S Jun17 0:00 /sbin/mingetty tty5 root 414 0.0 0.4 1164 536 tty6 S Jun17 0:00 /sbin/mingetty tty6 root 2736 0.0 1.5 3972 2028 ? S Jun18 0:04 /usr/sbin/smbd -D root 3552 0.0 0.4 1164 536 tty3 S Jun18 0:00 /sbin/mingetty tty3 root 3553 0.0 0.4 1164 536 tty4 S Jun18 0:00 /sbin/mingetty tty4 root 3554 0.0 0.4 1164 536 tty2 S Jun18 0:00 /sbin/mingetty tty2 root 4667 0.0 0.4 1100 560 ? S Jun19 0:00 /usr/sbin/syslogd root 4671 0.0 0.6 1484 884 ? S Jun19 0:00 /usr/sbin/klogd -c 1 root 7970 0.0 0.4 1212 616 ? S Jun19 0:00 /usr/sbin/cron root 9097 0.0 1.9 4716 2568 ? S Jun19 0:18 /usr/sbin/smbd -D root 9178 0.0 0.4 1164 536 tty1 S Jun19 0:00 /sbin/mingetty --noclear tty1 root 9463 0.0 0.4 1212 612 ? S Jun19 0:00 /USR/SBIN/CRON root 9464 0.0 0.7 1948 960 ? S Jun19 0:00 sh /usr/local/bin/backup root 9480 1.8 1.1 2076 1448 ? D Jun19 1:01 /bin/tar -cvf /dev/nst0 /etc /usr/mnt/internals/bank /usr/mnt/internals/hvw /usr/mnt/elbvill root 9597 0.0 0.4 1212 612 ? S 00:27 0:00 /USR/SBIN/CRON root 9598 0.0 0.7 1948 948 ? S 00:27 0:00 sh /root/zeitstempel root 9600 0.0 0.7 2600 992 ? R 00:27 0:00 ps auxw
man beachte den tar-Prozess - status D
##################### Wed Jun 20 00:19:01 CEST 2001 USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND .... root 9463 0.0 0.4 1212 612 ? S Jun19 0:00 /USR/SBIN/CRON root 9464 0.0 0.7 1948 960 ? S Jun19 0:00 sh /usr/local/bin/backup root 9480 1.8 1.0 1996 1368 ? R Jun19 0:53 /bin/tar -cvf /dev/nst0 /etc /usr/mnt/internals/bank /usr/mnt/internals/hvw /usr/mnt/elbvill ....
Hier ist hat er einen normalen Status. Ist es normal, das tar beim schreiben aufs Band zwischendurch in den Status D geht, und ab und Zu wieder nach R wechselt (sehr schön mit top zu sehen) Das habe ich schon lange beobachtet.
Sind vieleicht irgdenwelche Hardwareschäden zu befürchten? Speicher? Board?
Ein imer noch ratloser
Jens
Lug-dd maillist - Lug-dd@schlittermann.de http://mailman.schlittermann.de/mailman/listinfo/lug-dd