Tach,
El Miércoles, 23. Noviembre 2005 13:47, Stefan Lagotzki escribió:
ich will diese E-Mail noch mal als Anknüpfungspunkt für eine andere Frage verwenden. Im Subject und auch im Text kommen die Umlaute nicht rüber. Liegt das jetzt an dem eingestellten Content-Type oder an meinem Mail-Programm? An "mutt" (Thomas' Programm) kann es ja kaum liegen.
So wie ich das sehe, war die Originalmail in UTF-8 verfasst. Die Antwort darauf ist aber in ISO-8859-* verfasst worden, während Mutt vermutlich ebenfalls einen UTF-8-Text erwartet hat. Thomas verwendet IIRC den Emacs als Editor, im Vi würde man das folgende verwenden, um die Standardkodierung festzulegen: set fileencoding=utf-8 encoding=utf8 termencoding=utf8 (bzw. termencoding=latin1, falls $LANG kein .UTF-8 enthält).
Naja, und wenn zwei Zeichensätze in einem MIME-Abschnitt verwendet werden, dann kommt wohl selbst das beste Mailprogramm damit durcheinander. Egal ob Mail oder IRC oder Dateisysteme, die beste Regel ist immer die korrekte Angabe der Kodierung, die zweitbeste ist das Festlegen auf einen Standard, und der heißt Unicode, und ist momentan am besten durch UTF-8 nutzbar.
Ein richtig tolles HOWTO scheint es dazu nicht zu geben. Aber für ein paar Hintergrund- und Praxisinformationen wird immer dieses Dokument empfohlen: http://www.cl.cam.ac.uk/~mgk25/unicode.html Wichtig für Entwickler ist vor allem die bis heute oft nicht verstandene Trennung zwischen "Character" und "Byte", was u.a. durch Programmiersprachen wie C ("char foo") noch verschlimmert wird, weil ein Character eben nicht nur ein Byte groß sein muss (= im ASCII-Zeichensatz vorkommen muss), selbst in der englischen Sprache ("naïve" etc.).
[Debian ist da leider etwas langsamer als die anderen Distros bezüglich der ordentlichen Standardeinstellung auf UTF-8. Aber ab der nächsten Version soll das abgeändert werden - ob auch für Aktualisierungen, ist noch nicht klar.]
Tipp: 'LANG=C less' zeigt schön an, ob an der Stelle eines Umlautes ein oder zwei Zeichen^WBytes in der Datei stehen.
Josef