Salut,
könnt ihr mir eventuell mal fix den Unterschied zwischen PrintableString, BMPString, und UTF8String näherbringen?
[Is eigentlich nit ganz Linux-spezifisch, Sorry]
Merci, Christian
On Wed, May 16, 2001 at 09:15:10PM +0200, Christian Wippermann wrote:
Salut,
könnt ihr mir eventuell mal fix den Unterschied zwischen PrintableString, BMPString, und UTF8String näherbringen?
In welchem Zusammenhang treten diese Strings auf? (Programmiersprache?)
UTF8 steht fuer Unicode Transfer Format. Welches ASCII-Kompatibel ist Zeichen die sich nicht in 7Bit pressen lassen benoetigen ein vorangestelltes Escape-Zeichen.
PrintableString klingt wie ein String ohne Steuerzeichen, also alles was man auf einem Drucker ausdrucken kann.
BMPString: BMP steht oft fuer Bit-Map, was aber nur in Zusammenhang mit Schriften einen Sinn machen wuerde.
Danke Thomas,
noch bin ich aber nicht 100prozentig sicher, ob ich auf der sicheren Seite bin.
Thomas Guettler wrote:
On Wed, May 16, 2001 at 09:15:10PM +0200, Christian Wippermann wrote:
PrintableString, BMPString, und UTF8String näherbringen?
In welchem Zusammenhang treten diese Strings auf? (Programmiersprache?)
RFC 2459 (X.509 PKI). Aufbau von X.500 Namen in X.509 Zertifikaten.
- all certificates issued after December 31, 2003 MUST use the UTF8String encoding.
Mein primäres Ziel ist herauszufinden, ob ich Umlaute in X.509v3 Zertifikaten unterbringen darf, oder nicht. OpenSSL kann Zertifikate mit Umlauten erzeugen. Netscape und IE erkennen das auch. Aber bin ich damit Normkonform? Ich weiss es nicht...
OpenSSL_doc: The conversion to UTF8 format used with the name options assumes that T61Strings use the ISO8859-1 character set. This is wrong but Netscape and MSIE do this as do many certificates. So although this is incorrect it is more likely to display the majority of certificates correctly.
Häh??? Was will mir der Autor damit sagen?
UTF8 steht fuer Unicode Transfer Format. Welches ASCII-Kompatibel ist Zeichen die sich nicht in 7Bit pressen lassen benoetigen ein vorangestelltes Escape-Zeichen.
(c) failing (a) and (b) MUST be UTF8String - US-ASCII und ISO-8859-1 ?? - dann sollten Umlaute funzen
PrintableString klingt wie ein String ohne Steuerzeichen, also alles was man auf einem Drucker ausdrucken kann.
(a) MAY be printableString - Groß- und Kleinbuchstaben des Lateinischen Alphabetes - '"()+.-/:? und Leerzeichen - KEINE Umlaute
BMPString: BMP steht oft fuer Bit-Map, was aber nur in Zusammenhang mit Schriften einen Sinn machen wuerde.
(b) failing (a) MAY be BMPString - keine Ahnung - wenn es sowieso früher oder später UTF8 sein soll, kümmert mich das gerade auch nicht weiter
Hat jemand Ahnung von Verzeichnissen, UTF8 und Umlauten? Ümläute nützen, oder nicht. Das ist die Frage...
Christian
On Thu, May 17, 2001 at 10:32:22AM +0200, Christian Wippermann wrote:
RFC 2459 (X.509 PKI). Aufbau von X.500 Namen in X.509 Zertifikaten.
- all certificates issued after December 31, 2003 MUST use the
UTF8String encoding.
Mein primäres Ziel ist herauszufinden, ob ich Umlaute in X.509v3 Zertifikaten unterbringen darf, oder nicht. OpenSSL kann Zertifikate mit Umlauten erzeugen. Netscape und IE erkennen das auch. Aber bin ich damit Normkonform? Ich weiss es nicht...
Ich glaub, dir fehlt ein bischen Grundwissen zum Thema Unicode und ISO-8859 (dein eigentliches Problem kommt weiter unten noch mal, also nicht gleich die Mail löschen :)) Der Standard-ASCII-Zeichensatz belegte 127 bit und konnte keine Umlaute, diverse Sonderzeichen etc. darstellen. Um das zu ändern, wurden die ISO-8859 Standards eingeführt, die für die ersten 127 Zeichen identisch mit ASCII sind. Davon gibt es verschiedene (ISO-8859-1 bis ISO 8859-12 oder so). ISO-8859-1 ist der gebräuchlichste, beinhaltet deutsche, französische Sonderzeichen etc. pp. Es gibt noch andere (ich glaube -5 beinhaltet z.B. kyrillische Zeichen). Nachteil: Wenn man z.B. dt. Sonderzeichen und kyrillische Schrift in einem Text mischen will, wird's kompliziert, weil das zwei unterschiedliche Zeichensätze sind. Dafür wurde Unicode (ISO 10646) eingeführt (die Standardisierung ist soweit ich weiß noch nicht abgeschlossen). Es soll ein ("mehrbittiger") Zeichensatz werden, der _alle_ Zeichen beinhaltet, auch mathematische Symbole etc. Davon gibt es jetzt verschiedene Ansätze, z.B. UTF8 (meines Wissens _der_ Standard wegen einigen Kompatibilitätssachen) oder UTF16 (der Microsoft-Standard). UTF-8 ist kompatibel zu ASCII, d.h. die ersten 127 Bits stimmen mit dem ASCII-Zeichensatz überein, darüber hinaus wird es teilweise richtig kompliziert. In irgendeiner iX stand mal ein Artikel dazu drin (wenn du willst, such ich ihn mal bis Mi), ansonsten "man unicode" und "man utf-8".
OpenSSL_doc: The conversion to UTF8 format used with the name options assumes that T61Strings use the ISO8859-1 character set. This is wrong but Netscape and MSIE do this as do many certificates. So although this is incorrect it is more likely to display the majority of certificates correctly.
Häh??? Was will mir der Autor damit sagen?
Folgendes Problem (jetzt hab ich mich mal mein Unicode-Wissen aufgefrischt :)): Der Standard sagt, daß ein Zertifikat die UTF-8 - Codierung besitzen muß. Sowohl Netscape als auch MSIE wollen aber, daß die Zertifikate ISO-8859-1 - codiert sind. Und weil das die gebräuchlichsten Browser so wollen (waren wahrscheinlich zu faul, eine ordentliche Unicode-Unterstützung einzubauen), haben sich die meisten Zertifikate angepaßt und werden nach ISO-8859-1 ausgeliefert. Und weil das so ist, macht das auch OpenSSL so (soviel zum Thema Standards) :(. Das größte Problem ist, daß ISO-8859-1 und UTF-8 nur für die ersten 127 Zeichen kompatibel sind, danach kommt ohne Konvertierung nur Müll am anderen Ende an, weil die Codierung unterschiedlich ist.
Mein Tip: Bau UTF-8-Unterstützung ein, aber laß das mit den Umlauten erst einmal raus, bis sich die Leute an die Standards halten.
Hat jemand Ahnung von Verzeichnissen, UTF8 und Umlauten? Ümläute nützen, oder nicht. Das ist die Frage...
Christian
Ich hoffe mal, damit ist dein Problem geklärt.
cu, Ulf
Ulf Lorenz wrote:
Ich glaub, dir fehlt ein bischen Grundwissen zum Thema Unicode und ISO-8859
Du hast ja sowas von recht!
(dein eigentliches Problem kommt weiter unten noch mal, also nicht gleich die Mail löschen :))
If you don't read it and you delete it, it's STUPID
Der Standard-ASCII-Zeichensatz belegte 127 bit und konnte keine Umlaute, diverse Sonderzeichen etc. darstellen.
[...schnipp iso-8859 ... unicode]
UTF-8 ist kompatibel zu ASCII, d.h. die ersten 127 Bits stimmen mit dem ASCII-Zeichensatz überein, darüber hinaus wird es teilweise richtig kompliziert.
hmmm, hab ich gemerkt. Ich hab mal in die UTF-8 RFC reingeschnuppert...
In irgendeiner iX stand mal ein Artikel dazu drin (wenn du willst, such ich ihn mal bis Mi), ansonsten "man unicode" und "man utf-8".
man - no manual entry :( Das lässt sich ja aber ändern. Den Art. würde ich dennoch gern lesen. Ich gebe dir noch mal off-List bescheid, ob ich am Mi kommen kann.
Folgendes Problem (jetzt hab ich mich mal mein Unicode-Wissen aufgefrischt :)): Der Standard sagt, daß ein Zertifikat die UTF-8 - Codierung besitzen muß.
Naja, z.Zt. noch nicht. Ratsam ist's trotzdem. (lt. Standard ;o) Nur die Verwendung von 8859-1 ist in keiner Norm erwähnt!!!11
Sowohl Netscape als auch MSIE wollen aber, daß die Zertifikate ISO-8859-1 - codiert sind. Und weil das die gebräuchlichsten Browser so wollen (waren wahrscheinlich zu faul, eine ordentliche Unicode-Unterstützung einzubauen), haben sich die meisten Zertifikate angepaßt und werden nach ISO-8859-1 ausgeliefert. Und weil das so ist, macht das auch OpenSSL so (soviel zum Thema Standards) :(.
Und Thema Standards macht bei Public-Key Infrastrukturen richtig Spass! Ich nehme an, dass das bei anderen Sachen genauso ist. Es fällt mir nur gerade bei PKI richtig auf. Wenn Ihr Bock drauf habt, könnte ich ja mal nach meiner DA einen kleinen Vortrag über X.509 (PGP/GPG) PKI halten?!
Das größte Problem ist, daß ISO-8859-1 und UTF-8 nur für die ersten 127 Zeichen kompatibel sind,
|-> und US-ASCII ...und das war mein Knackpunkt. DANKE ULF!
danach kommt ohne Konvertierung nur Müll am anderen Ende an, weil die Codierung unterschiedlich ist.
richtiger M=E6ll. sowas?
Mein Tip: Bau UTF-8-Unterstützung ein, aber laß das mit den Umlauten erst einmal raus, bis sich die Leute an die Standards halten.
Jup. so wird's gemacht. Muss ich nur noch herausfinden, wie ich OSSL die Normeinhaltung bebringe. Den Rest macht die Zertifizierungsrichtlinie.
Ich hoffe mal, damit ist dein Problem geklärt.
Hab' tausend Dank.
cu, Ulf
Christian
On Fri, May 18, 2001 at 09:59:59AM +0200, Christian Wippermann wrote:
Ulf Lorenz wrote:
UTF-8 ist kompatibel zu ASCII, d.h. die ersten 127 Bits stimmen mit dem ASCII-Zeichensatz überein, darüber hinaus wird es teilweise richtig kompliziert.
hmmm, hab ich gemerkt. Ich hab mal in die UTF-8 RFC reingeschnuppert...
Richtig lustig wird Unicode-Unterstützung erst, wenn ein Programm mit z.B. lateinischen (von links nach rechts) und arabischen (von rechts nach links gelesen) zugleich umgehen muß.
In irgendeiner iX stand mal ein Artikel dazu drin (wenn du willst, such ich ihn mal bis Mi), ansonsten "man unicode" und "man utf-8".
man - no manual entry :( Das lässt sich ja aber ändern. Den Art. würde ich dennoch gern lesen. Ich gebe dir noch mal off-List bescheid, ob ich am Mi kommen kann.
Tu das, ich hab für die Jahrgänge 97-99 sogar die iX-Cds (gleich mal schauen).
Folgendes Problem (jetzt hab ich mich mal mein Unicode-Wissen aufgefrischt :)): Der Standard sagt, daß ein Zertifikat die UTF-8 - Codierung besitzen muß.
Naja, z.Zt. noch nicht. Ratsam ist's trotzdem. (lt. Standard ;o) Nur die Verwendung von 8859-1 ist in keiner Norm erwähnt!!!11
Logo, weil die Leutre alle Unicode wollen. Das mit dem 8859-1 Standard in der Zertifizierung ist so wie bei Microsoft-Standards, sie gibt es einfach :).
Und Thema Standards macht bei Public-Key Infrastrukturen richtig Spass! Ich nehme an, dass das bei anderen Sachen genauso ist. Es fällt mir nur gerade bei PKI richtig auf. Wenn Ihr Bock drauf habt, könnte ich ja mal nach meiner DA einen kleinen Vortrag über X.509 (PGP/GPG) PKI halten?!
Frag Konrad, wann mal ein Vortragsplatz frei ist (ich glaub sogar noch dieses Jahr :o)).
Ich hoffe mal, damit ist dein Problem geklärt.
Hab' tausend Dank.
*geschmeichelt fühl*
Christian
Ulf
lug-dd@mailman.schlittermann.de