Hallo,
jetzt bin ich noch etwas weiter aber zugleich ratloser: tar verursacht den segfault. Ein anderes tar binary, das auf anderen Rechnern funktioniert, verursacht auf dem Router auch einen segfault.
Das macht mich etwas unruhig...
-- Orm
Hallo Orm!
Neuer Thread, neues Glück? ;-)
Orm Finnendahl finnendahl@folkwang-hochschule.de:
jetzt bin ich noch etwas weiter aber zugleich ratloser: tar verursacht den segfault. Ein anderes tar binary, das auf anderen Rechnern funktioniert, verursacht auf dem Router auch einen segfault.
Was sagt: $ debsums tar
Freundlich grüßend,
Erik
Hallo Erik, hallo Heiko,
Am 02. April 2005, 22:53 Uhr (+0200) schrieb Erik Schanze:
Was sagt: $ debsums tar
ormserv:~# debsums tar -bash: debsums: command not found ormserv:~#
Am 03. April 2005, 00:35 Uhr (+0200) schrieb Heiko Schlittermann:
Ist es sicher, dass während Du das Tar benutzt, sich *keine* der "getarrten" Dateien veränder?
@sr1: wenn ich mich recht entsinne - so war's doch, oder?
Ich weiß nicht genau, was Du meinst. tar geht folgendermaßen schon nicht:
ormserv:~# echo "Hallo Welt" > hallowelt.text ormserv:~# tar czvf hallowelt.tgz hallowelt.text Speicherzugriffsfehler ormserv:~#
Ich fürchte, irgendeine lib ist abgeschmiert und ich werde mit irgendeinem trace Befehl herausfinden müssen, welche lib das ist. Kann mir da jemand evtl. einen Tip geben? War das "strace"?
-- Orm
Hallo,
ich habe das ungute Gefühl, an meiner Hardware stimmt etwas nicht. Auch ls funktioniert nicht mit der -l Option.
Ich habe mich jetzt einmal direkt eingeloggt und bekomme folgenden Fehler, den ich über remote login nicht gesehen habe:
Apr 3 15:37:49 ormserv kernel: <1>Unable to handle kernel paging request at virtual address 08e8c358 Apr 3 15:37:49 ormserv kernel: printing eip: Apr 3 15:37:49 ormserv kernel: 08e8c358 Apr 3 15:37:49 ormserv kernel: Oops: 0000 Apr 3 15:37:49 ormserv kernel: CPU: 0 Apr 3 15:37:49 ormserv kernel: EIP: 0010:[<08e8c358>] Not tainted Apr 3 15:37:49 ormserv kernel: EFLAGS: 00010293 Apr 3 15:37:49 ormserv kernel: eax: 00000109 ebx: caf0e000 ecx: bfffdb10 edx: 00000018 Apr 3 15:37:49 ormserv kernel: esi: 00000016 edi: ffffffff ebp: bfffdaf8 esp: caf0ffc0 Apr 3 15:37:49 ormserv kernel: ds: 0018 es: 0018 ss: 0018 Apr 3 15:37:49 ormserv kernel: Process ls (pid: 498, stackpage=caf0f000) Apr 3 15:37:49 ormserv kernel: Stack: c01090bf 00000000 bfffdb10 40028214 00000016 ffffffff bfffdaf8 00000109 Apr 3 15:37:49 ormserv kernel: 0000002b 0000002b 00000109 40025e46 00000023 00000246 bfffdadc 0000002b Apr 3 15:37:49 ormserv kernel: Call Trace: [system_call+51/56] Apr 3 15:37:49 ormserv kernel: Apr 3 15:37:49 ormserv kernel: Code: Bad EIP value.
Kann mir evtl. jemand sagen, worauf sich dieser Fehler bezieht?
Merkwürdigerweise fährt der Rechner trotzdem hoch und ich sende auch gerade meine mails darüber ab.
-- Orm
On Sunday 03 April 2005 15:42, Orm Finnendahl wrote:
ich habe das ungute Gefühl, an meiner Hardware stimmt etwas nicht. Auch ls funktioniert nicht mit der -l Option.
Ich habe mich jetzt einmal direkt eingeloggt und bekomme folgenden Fehler, den ich über remote login nicht gesehen habe:
Apr 3 15:37:49 ormserv kernel: <1>Unable to handle kernel paging request at virtual address 08e8c358 Apr 3 15:37:49 ormserv kernel: printing eip:
[cut]
Kann mir evtl. jemand sagen, worauf sich dieser Fehler bezieht?
Ohne System.map ist das schwer zu sagen. Ich habe zwei Vermutungen:
*RAM im Eimer *Festplatte im Eimer
Merkwürdigerweise fährt der Rechner trotzdem hoch und ich sende auch gerade meine mails darüber ab.
Die meisten Rechner sterben langsam.
Konrad
Am 03. April 2005, 20:08 Uhr (+0200) schrieb Konrad Rosenbaum:
Kann mir evtl. jemand sagen, worauf sich dieser Fehler bezieht?
Ohne System.map ist das schwer zu sagen. Ich habe zwei Vermutungen:
hilft Dir, wenn ich die System.map (ich vermute, Du meinst die aus dem boot Verzeichnis) mal poste? Übrigens hat sich Knoppix beim Hochfahren meines Wissens nicht beschwert.
Die meisten Rechner sterben langsam.
naja, Ram oder Festplatte lassen sich zumindest austauschen...
-- Orm
On Monday 04 April 2005 00:04, Orm Finnendahl wrote:
Am 03. April 2005, 20:08 Uhr (+0200) schrieb Konrad Rosenbaum:
Kann mir evtl. jemand sagen, worauf sich dieser Fehler bezieht?
Ohne System.map ist das schwer zu sagen. Ich habe zwei Vermutungen:
hilft Dir, wenn ich die System.map (ich vermute, Du meinst die aus dem boot Verzeichnis) mal poste?
Du kannst auch selbst mal reinschauen, welches Symbol betroffen war.
Übrigens hat sich Knoppix beim Hochfahren meines Wissens nicht beschwert.
Warum auch? Es ist doch noch nix schiefgegangen. Beim Hochfahren wird kein HW-Test gemacht.
Konrad
Am 04. April 2005, 07:07 Uhr (+0200) schrieb Konrad Rosenbaum:
hilft Dir, wenn ich die System.map (ich vermute, Du meinst die aus dem boot Verzeichnis) mal poste?
Du kannst auch selbst mal reinschauen, welches Symbol betroffen war.
Ich habe Folgendes getan:
Fehler:
Apr 4 09:16:31 ormserv kernel: <1>Unable to handle kernel paging request at virtual address 08e8c358
In der System.map nachgeschaut:
ormserv:/boot# grep 08e8c358 System.map-2.4.22-1-686 ormserv:/boot#
Die besagte Adresse findet sich dort nicht.Mache ich irgend etwas falsch? Ich weiß wirklich nicht, was ich tue, sorry...
Gruß, Orm
On Sun, Apr 03, 2005 at 03:42:45PM +0200, Orm Finnendahl wrote:
Hallo,
ich habe das ungute Gefühl, an meiner Hardware stimmt etwas nicht. Auch ls funktioniert nicht mit der -l Option.
Ich habe mich jetzt einmal direkt eingeloggt und bekomme folgenden Fehler, den ich über remote login nicht gesehen habe:
Apr 3 15:37:49 ormserv kernel: <1>Unable to handle kernel paging request at virtual address 08e8c358 Apr 3 15:37:49 ormserv kernel: printing eip: Apr 3 15:37:49 ormserv kernel: 08e8c358 Apr 3 15:37:49 ormserv kernel: Oops: 0000 Apr 3 15:37:49 ormserv kernel: CPU: 0 Apr 3 15:37:49 ormserv kernel: EIP: 0010:[<08e8c358>] Not tainted Apr 3 15:37:49 ormserv kernel: EFLAGS: 00010293 Apr 3 15:37:49 ormserv kernel: eax: 00000109 ebx: caf0e000 ecx: bfffdb10 edx: 00000018 Apr 3 15:37:49 ormserv kernel: esi: 00000016 edi: ffffffff ebp: bfffdaf8 esp: caf0ffc0 Apr 3 15:37:49 ormserv kernel: ds: 0018 es: 0018 ss: 0018 Apr 3 15:37:49 ormserv kernel: Process ls (pid: 498, stackpage=caf0f000) Apr 3 15:37:49 ormserv kernel: Stack: c01090bf 00000000 bfffdb10 40028214 00000016 ffffffff bfffdaf8 00000109 Apr 3 15:37:49 ormserv kernel: 0000002b 0000002b 00000109 40025e46 00000023 00000246 bfffdadc 0000002b Apr 3 15:37:49 ormserv kernel: Call Trace: [system_call+51/56] Apr 3 15:37:49 ormserv kernel: Apr 3 15:37:49 ormserv kernel: Code: Bad EIP value.
Kann mir evtl. jemand sagen, worauf sich dieser Fehler bezieht?
der Calltrace ist verdächtig kurz. Kannst du den oops mal durch ksymoops pipen?
Merkwürdigerweise fährt der Rechner trotzdem hoch und ich sende auch gerade meine mails darüber ab.
Rettungssystem booten, fsck. Ich vermute, dein (bisher IIRC nicht erwähntes) Filesystem hat einen Hau.
Am 04. April 2005, 09:04 Uhr (+0200) schrieb Stefan Seyfried:
der Calltrace ist verdächtig kurz. Kannst du den oops mal durch ksymoops pipen?
error trace ist angehängt.
Rettungssystem booten, fsck. Ich vermute, dein (bisher IIRC nicht erwähntes) Filesystem hat einen Hau.
das Filesystem ist ReiserFS
Ich werde jetzt mal das Filesystem checken...
vielen Dank, Orm
Hallo,
Einen Speichertest (memtest86+) habe ich jetzt auch ohne Ergebnis durchgeführt.
d.h.:
- fsck sagt, das Dateisystem ist ohne Korruption - memtest findet keinen Fehler
Ich bin mit meinem Latein am Ende. Hat jemand noch eine Idee, bevor ich die Platte putze und alles neu installiere? Ohne tar und ls -l kann man den Rechner nicht wirklich in Ordnung halten.
Gruß, Orm
Orm Finnendahl finnendahl@folkwang-hochschule.de:
Einen Speichertest (memtest86+) habe ich jetzt auch ohne Ergebnis durchgeführt.
d.h.:
- fsck sagt, das Dateisystem ist ohne Korruption
- memtest findet keinen Fehler
Ich bin mit meinem Latein am Ende. Hat jemand noch eine Idee,
Hast du mittlerweile mit md5sum mal gerpüft, ob diese Binaries kaputt sind oder nicht richtig ausgeführt werden? Auch mal nach einem rootkit gesucht?
bevor ich die Platte putze und alles neu installiere? Ohne tar und ls -l kann man den Rechner nicht wirklich in Ordnung halten.
Was soll das bringen, solange du die Ursache nicht kennst?
Freundlich grüßend,
Erik
HalloErik,
danke für die Tips.
Am 04. April 2005, 19:11 Uhr (+0200) schrieb Erik Schanze:
Hast du mittlerweile mit md5sum mal gerpüft, ob diese Binaries kaputt sind oder nicht richtig ausgeführt werden?
Ich habe die (fuktionierenden) binaries von ls und tar von meinem Laptop probehalber auf den Server kopiert. die md5summen stimmen mit dem Laptop überein. trotzdem bekomme ich auch auch bei diesen Binaries einen segfault.
Auch mal nach einem rootkit gesucht?
Nein. Ich weiß auch nicht, wie man das tut. Werde mich da mal durcharbeiten...
bevor ich die Platte putze und alles neu installiere? Ohne tar und ls -l kann man den Rechner nicht wirklich in Ordnung halten.
Was soll das bringen, solange du die Ursache nicht kennst?
1. Wenn das System korrumpiert ist (Einbruch von außen...) würde es danach wieder funktionieren.
2. Ich könnte mir vorstellen, daß das reiserfs auf eine Weise korrumpiert sein kann, die fsck nicht feststellen kann.
3. Wenn auf der Festplatte sonst etwas physikalisch nicht stimmt, verspreche ich mir von einer Neuformatierung, daß die betreffenden Sektoren ausgeblendet werden.
Wie gesagt, vermeiden würde ich eine Neuinstallation schon gerne und ich bin auch nicht sicher, ob das, was ich mir verspreche, wirklich zutrifft. Aber ich weiß schlicht nicht weiter ;-(
-- Orm
Hi Orm!
Orm Finnendahl finnendahl@folkwang-hochschule.de:
Am 04. April 2005, 19:11 Uhr (+0200) schrieb Erik Schanze:
Hast du mittlerweile mit md5sum mal gerpüft, ob diese Binaries kaputt sind oder nicht richtig ausgeführt werden?
Ich habe die (fuktionierenden) binaries von ls und tar von meinem Laptop probehalber auf den Server kopiert. die md5summen stimmen mit dem Laptop überein. trotzdem bekomme ich auch auch bei diesen Binaries einen segfault.
Dann kannst du noch alle beteiligten Bibliotheken ebenso prüfen.
Freundlich grüßend,
Erik
Am Mon den 04 Apr 2005 um 07:45:25PM +0200 schrieb Orm Finnendahl:
<schnipp>
- Wenn auf der Festplatte sonst etwas physikalisch nicht stimmt, verspreche ich mir von einer Neuformatierung, daß die betreffenden Sektoren ausgeblendet werden.
...hab den Thread nicht aufmerksam verfolgt: hast du schon smartmontools ausprobiert?
Wenn ein physischer Schaden die Ursache wäre kann ich dir nur raten, eine neue Platte zu kaufen sofern das deine finanziellen Mittel erlauben. Nach meiner Erfahrung tendieren Platten mit solchen Symptomen dazu, daß es immer schlimmer wird, d.h. nach zwei Wochen oder so fangen die Probleme wieder an. Du würdest dich über den unnützen Aufwand nur ärgern.
Tschau,
andre
Orm Finnendahl [2005-04-04, 19:45 +0200]:
Hi,
Hast du mittlerweile mit md5sum mal gerpüft, ob diese Binaries kaputt sind oder nicht richtig ausgeführt werden?
Ich habe die (fuktionierenden) binaries von ls und tar von meinem Laptop probehalber auf den Server kopiert. die md5summen stimmen mit dem Laptop überein. trotzdem bekomme ich auch auch bei diesen Binaries einen segfault.
Auch mal nach einem rootkit gesucht?
Nein. Ich weiß auch nicht, wie man das tut. Werde mich da mal durcharbeiten...
:-) Sry apt-get install chkrootkit
was passiert eigentlich anders herum. Also wenn Du das ls|tar binary auf einem Rechner verwendest, das gegen die selben libs ( ldd $(which ls) ) gelinkt ist?
Wie Erik gesagt hat, auch mal die libs prüfen.
Künftig einen FilesystemIntegretyChecker ala Tripwire, AIDE, Samhain ... installieren.
ich die Platte putze und alles neu installiere? Ohne tar und ls -l kann man den Rechner nicht wirklich in Ordnung halten.
Was soll das bringen, solange du die Ursache nicht kennst?
Er bekommt das System auf einen besser definierten Zustand.
- Wenn das System korrumpiert ist (Einbruch von außen...) würde es danach wieder funktionieren.
Wenn das System steinalt war evtl. nicht. Ist aber ein wichtiger Punkt.
- Ich könnte mir vorstellen, daß das reiserfs auf eine Weise korrumpiert sein kann, die fsck nicht feststellen kann.
Hmmm.
Gruß,
Frank
Hallo,
Orm Finnendahl finnendahl@folkwang-hochschule.de (Sa 02 Apr 2005 22:17:25 GMT):
jetzt bin ich noch etwas weiter aber zugleich ratloser: tar verursacht den segfault. Ein anderes tar binary, das auf anderen Rechnern funktioniert, verursacht auf dem Router auch einen segfault.
Ist es sicher, dass während Du das Tar benutzt, sich *keine* der "getarrten" Dateien veränder?
@sr1: wenn ich mich recht entsinne - so war's doch, oder?
Best regards from Dresden Viele Gruesse aus Dresden Heiko Schlittermann
Heiko Schlittermann hs@schlittermann.de writes:
Orm Finnendahl finnendahl@folkwang-hochschule.de (Sa 02 Apr 2005 22:17:25 GMT):
jetzt bin ich noch etwas weiter aber zugleich ratloser: tar verursacht den segfault. Ein anderes tar binary, das auf anderen Rechnern funktioniert, verursacht auf dem Router auch einen segfault.
Ist es sicher, dass während Du das Tar benutzt, sich *keine* der "getarrten" Dateien veränder?
@sr1: wenn ich mich recht entsinne - so war's doch, oder?
(Das Problem, das du meinst, ist ein voellig anderes.)
Obiges klingt nach einer voellig zerschossenen libc oder einem ELF-Loader, der nicht zur libc passt. Hatte ich schon mal beim rumspielen auf exotischeren Architekturen, insbesondere beim Upgrade von woody auf ein recht neues sarge.
Geht wenigstens noch ein statisch gelinktes tar?
(Ich hatte dann versucht, die Dateien aus den Debian-Paketen zu extrahieren und passend hinzulegen. (Ich glaube ich habe es im Endeffekt neu installiert, da es nur Spielsysteme waren. In der Praxis muesste man halt die Datensicherung einspielen ;-) )
Sven
Am 03. April 2005, 10:58 Uhr (+0200) schrieb Sven Rudolph:
In der Praxis muesste man halt die Datensicherung einspielen ;-) )
;-)
In Ermangelung einer Datensicherung werde ich zur Not ein neues System aufspielen. Es ist wie gesagt lediglich ein Router und es liegt nichts Wesentliches darauf rum. Jetzt versuche ich aber erst einmal, ein statisch gelinktes tar zu verwenden und dann alle libs, die tar so benötigt, auszutauschen. Wisst Ihr, wo ich ein statisch gelinktes tar bei Debian herbekomme, oder muß ich das selbst kompilieren?
-- Orm
On Sat, Apr 02, 2005 at 10:17:25PM +0200, Orm Finnendahl wrote:
Hallo,
jetzt bin ich noch etwas weiter aber zugleich ratloser: tar verursacht den segfault. Ein anderes tar binary, das auf anderen Rechnern funktioniert, verursacht auf dem Router auch einen segfault.
Segfaulted tar immer, oder nur bei der Installation dieses Pakets? oopsed evtl. dein kernel beim tar-aufruf (dmesg)? Dateisystem im Arsch?
Das macht mich etwas unruhig...
Kann ich nachvollziehen ;-)
lug-dd@mailman.schlittermann.de