Ulf Lorenz wrote:
Ich glaub, dir fehlt ein bischen Grundwissen zum Thema Unicode und ISO-8859
Du hast ja sowas von recht!
(dein eigentliches Problem kommt weiter unten noch mal, also nicht gleich die Mail löschen :))
If you don't read it and you delete it, it's STUPID
Der Standard-ASCII-Zeichensatz belegte 127 bit und konnte keine Umlaute, diverse Sonderzeichen etc. darstellen.
[...schnipp iso-8859 ... unicode]
UTF-8 ist kompatibel zu ASCII, d.h. die ersten 127 Bits stimmen mit dem ASCII-Zeichensatz überein, darüber hinaus wird es teilweise richtig kompliziert.
hmmm, hab ich gemerkt. Ich hab mal in die UTF-8 RFC reingeschnuppert...
In irgendeiner iX stand mal ein Artikel dazu drin (wenn du willst, such ich ihn mal bis Mi), ansonsten "man unicode" und "man utf-8".
man - no manual entry :( Das lässt sich ja aber ändern. Den Art. würde ich dennoch gern lesen. Ich gebe dir noch mal off-List bescheid, ob ich am Mi kommen kann.
Folgendes Problem (jetzt hab ich mich mal mein Unicode-Wissen aufgefrischt :)): Der Standard sagt, daß ein Zertifikat die UTF-8 - Codierung besitzen muß.
Naja, z.Zt. noch nicht. Ratsam ist's trotzdem. (lt. Standard ;o) Nur die Verwendung von 8859-1 ist in keiner Norm erwähnt!!!11
Sowohl Netscape als auch MSIE wollen aber, daß die Zertifikate ISO-8859-1 - codiert sind. Und weil das die gebräuchlichsten Browser so wollen (waren wahrscheinlich zu faul, eine ordentliche Unicode-Unterstützung einzubauen), haben sich die meisten Zertifikate angepaßt und werden nach ISO-8859-1 ausgeliefert. Und weil das so ist, macht das auch OpenSSL so (soviel zum Thema Standards) :(.
Und Thema Standards macht bei Public-Key Infrastrukturen richtig Spass! Ich nehme an, dass das bei anderen Sachen genauso ist. Es fällt mir nur gerade bei PKI richtig auf. Wenn Ihr Bock drauf habt, könnte ich ja mal nach meiner DA einen kleinen Vortrag über X.509 (PGP/GPG) PKI halten?!
Das größte Problem ist, daß ISO-8859-1 und UTF-8 nur für die ersten 127 Zeichen kompatibel sind,
|-> und US-ASCII ...und das war mein Knackpunkt. DANKE ULF!
danach kommt ohne Konvertierung nur Müll am anderen Ende an, weil die Codierung unterschiedlich ist.
richtiger M=E6ll. sowas?
Mein Tip: Bau UTF-8-Unterstützung ein, aber laß das mit den Umlauten erst einmal raus, bis sich die Leute an die Standards halten.
Jup. so wird's gemacht. Muss ich nur noch herausfinden, wie ich OSSL die Normeinhaltung bebringe. Den Rest macht die Zertifizierungsrichtlinie.
Ich hoffe mal, damit ist dein Problem geklärt.
Hab' tausend Dank.
cu, Ulf
Christian