Moin Liste,
wenn ich eine ascii Datei von Windows nach Unix/Linux übertrage, werden alle Umlaute falsch dargestellt.
Gibt es ein Tool, mit dem ich reinen ASCII Text sauber nach Linux übertragen kann, so daß die Umlaute nachher wieder korrekt dargestellt werden?
Danke im Voraus
CU TOM
On Tue, Dec 07, 1999 at 06:22:43PM +0100, Thomas Dubiel wrote: : Moin Liste,
... hat im ersten Anlauf nicht die Liste erreicht:
lug-dd@... und nicht lug_dd@...
: wenn ich eine ascii Datei von Windows nach Unix/Linux : übertrage, werden alle Umlaute falsch dargestellt. : : Gibt es ein Tool, mit dem ich reinen ASCII Text sauber : nach Linux übertragen kann, so daß die Umlaute nachher : wieder korrekt dargestellt werden?
ascii ist nicht das, was windows tun. win und auch unix/linux haben iso8859-1 oder so aehnlich. wenn es also windows-umlaute sind, sollte es kein problem darstellen. ein problem haben halt nur manchmal die darstellungsprogramme :)
export LESSCHARSET=latin1
hilft z.B. dem less bei der darstellung. vim kann's wohl von haus aus ordentlich ... bei anderen weiss ich's nicht.
solltest du dennoch convertieren wollen, koennte dir ``recode'' weiterhelfen.
heiko
... hat im ersten Anlauf nicht die Liste erreicht: lug-dd@... und nicht lug_dd@...
Sorry war 'n Screibfehler :-)
ascii ist nicht das, was windows tun. win und auch unix/linux
hab ich mich warscheinlich falsch ausgedrückt. Ich meine schon ASCII, das was früher mal unter DOS verwendet wurde (Windows ist ANSI).
haben iso8859-1 oder so aehnlich. wenn es also windows-umlaute sind, sollte es kein problem darstellen. ein problem haben halt nur manchmal die darstellungsprogramme :)
Ich muß das ganze wieder in eine Informix-Datenbank laden. Da muß ich ganz hart die Umlaute umbauen, da sonst im Text drinsteht "Hermann M"ller" oder was vergleichbares.
Gibts beim übertragen mit FTP oder Samba einen Parameter oder ein Tool, das ich einsetzen kann um die Umlaute von Ascii bach iso zu übertragen???
Danke TOM
Hi Tom,
On Wed, Dec 08, 1999 at 09:31:49AM +0100, Thomas Dubiel wrote:
Ich meine schon ASCII, das was frueher mal unter DOS verwendet wurde
recode ibmpc:latin1 dosfile.txt
und umgekehrt:
recode latin1:ibmpc unixfile
Achtung: solche Konvertierungen koennen u. U. irreversibel sein.
Torsten
On Wed, Dec 08, 1999 at 09:31:49AM +0100, Thomas Dubiel wrote:
hab ich mich warscheinlich falsch ausgedrückt. Ich meine schon ASCII, das was früher mal unter DOS verwendet wurde (Windows ist ANSI).
haben iso8859-1 oder so aehnlich. wenn es also windows-umlaute sind, sollte es kein problem darstellen. ein problem haben halt nur manchmal die darstellungsprogramme :)
Ich muß das ganze wieder in eine Informix-Datenbank laden. Da muß ich ganz hart die Umlaute umbauen, da sonst im Text drinsteht "Hermann M"ller" oder was vergleichbares.
Per Hand kann man die Files wahrscheinlich mit GNU-Recode umwandeln. Gibts als ftp://ftp.tu-dresden.de/gnu/recode/recode-3.5.tar.gz
Reinhard
Hallo, Thomas,
der Vorschlag mit dos2unix (gibt es auch mit unix2dos) funktioniert nicht für Umlaute. Diese Scripts wandeln Zeilenende- und Dateiende-Zeichen um. Für die Umlaute habe ich auf einer IRIX-Maschine je ein Script mit dem Befehl "tr". Sowas muß es auch unter Linux geben. Das Script hat folgenden Inhalt (Umwandlung von IRIX nach DOS): # ä ö ü Ä Ö Ü ß { } \ ä ö ü Ä Ö Ü ß { } \ tr "\344\366\374\304\326\334\337\173\175\134" "\204\224\201\216\231\232\341\173\175\134" < $1 > $2 # Achtung: In IRIX werden die Zeichen oktal behandelt!! In der anderen Richtung sind einfach die beiden Kolonnen in den Anführungszeichen zu tauschen.
Andreas
Am Thu, 09.Dec 1999 um 06:45 schrieb Andreas Kretzschmar:
Hallo, Thomas,
der Vorschlag mit dos2unix (gibt es auch mit unix2dos) funktioniert nicht für Umlaute. Diese Scripts wandeln Zeilenende- und Dateiende-Zeichen um. Für die Umlaute habe ich auf einer IRIX-Maschine je ein Script mit dem Befehl "tr". Sowas muß es auch unter Linux geben. Das Script hat folgenden Inhalt (Umwandlung von IRIX nach DOS): # ä ö ü Ä Ö Ü ß { } \ ä ö ü Ä Ö Ü ß { } \ tr "\344\366\374\304\326\334\337\173\175\134" "\204\224\201\216\231\232\341\173\175\134" < $1 > $2 # Achtung: In IRIX werden die Zeichen oktal behandelt!! In der anderen Richtung sind einfach die beiden Kolonnen in den Anführungszeichen zu tauschen.
Andreas
Gibt es:
GNU `recode' ************
`recode' converts files between character sets and usages. When exact transliterations are not possible, it may get rid of the offending characters or fall back on approximations. This program recognizes or produces nearly 150 different character sets and is able to transliterate files between almost any pair. Most RFC 1345 character sets are supported.
Konrad Riedel
lug-dd@mailman.schlittermann.de