lug-dd@schlittermann.de writes:
Ich hoffe, das Schema ist auch in UTF-16, wie du es oben schreibst ???
Das Schema wurde mit XML-Spy erzeugt, dieses weisst das Schema selbständig als UFT-16 aus. Ich gehe mal davon aus, dass es so seine Richtigkeit hat. Wenn ich per Hand das encoding auf utf-8 setze ändert sich aber nix.
Sowas geht uebrigens gut mit jEdit, der zeigt das Encoding des Textes an und du kannst das auch umstellen, und so einen Text umwandeln.
Schaue ich mir mal an.
Gleiche Frage wie oben: Ist die Datei auch UTF-16, wie angegeben ?
Ich erzeuge das XML via Xerces durch hinzufügen von Nodes, wie in http://xml.apache.org/xerces-p/domcreate.html beschrieben. Die Daten selber kommen aus einer mysql-DB. Ich gebe kein Encoding an. Versuche mit Encoding fest auf UTF-8 gesetzt, ergaben zwar, dass der Parser auch brav sagte, das File ist utf-8, aber beim writeToString des Files steht dann ein utf-16 drinne :-( Beim Einlesen meint der Parser aber, utf-16 isses nicht und stolpert dann über den Geschx!?__&&&!tskunden... ;-)
Nicht das du fleissig UTF-16 reinschreibst, aber deine Zeichen ISO-8859-1 sind.
Die Zeichen werden automatisch in irgendwass konvertiert. Der vi erkennt das Encoding und stellt die Zeichen dann wieder richtig dar .. Da kann ich nicht viel sehen.
in XMLSPY: <Kundenklasse>Gesch?skunde</Kundenklasse>
Da stimmt schon was nicht.
Naja, das ist kein Fragezeichen, sondern irgendwas anderes, was durch C&P in den Mailclient verstümmel wird.
Wenn du einen normalen Text-Editor nimmst, ja. Der kann ja nur ISO-8859-1, da musst du also aus deinen Umlauten erst die ISO-8859-1 Zeichen machen, die als UTF-16 interpretiert das Zeichen ergeben, das du haben willst. Das geht aber nicht immer und macht dir unnoetig Arbeit. Da alles XML-Werkzeuge mindestens ISO-8859-1, UTF-8 und UTF-16 unterstuetzten sollten, kannst du auch einfach in ISO-8859-1 schreiben. Alternativ suchst du dir einen Editor, der im Encoding deiner Wahl speichern kann. Ich habe mit jEdit und XML gute Erfahrungen gemacht.
wie gesagt, das XML wird via Xerces generiert, nix Editor.
Deine restlichen Versuche deuten auch alle darauf hin, dass du ganz kraeftig mit Encoding-Problemen kaempfst ... Da hilft nur eines: Jedes einzelne Stueck Text anschauen und feststellen, ob das was als Zeichen drin stehen soll, auch mit dem richtigen Encoding (sprich Bitmuster) drinsteht.
Au weia - riecht nach Arbeit ... naja.
Mit freundlichen Grüßen
Jens Puruckherr