binärfähiges tr gesucht - Lug-dd

8 Jun 2007


      Hallo,
ich möchte das mit einer älteren Mediawikiversion erstellte Wiki weiter
mit der aktuellen Version nutzen. Das Update lief soweit auch ohne
größere Probleme. Nur ein Bereitet macht mir Kopfzerbrechen: Die
Zeichensatzkonvertierung. Das beim Mediawiki dafür mitgelieferte Skript
verweigert sich aus unerfindlichen Gründen.
Daher versuche ich folgendes Vorgehen: SQL-Dump erstellen, rausfinden,
was die Entsprechungen im alten und neuen Mediawiki für gewisse Umlaute
stehen und dann diese ersetzen. Um alle kleinen ö richtig zu bekommen
müsste man folgendes tun (zur besseren Lesbarkeit als hex-Zahlen):
9fc3 0ac2 => 83c3 b6c2 000a
Allerdings beherrscht tr sowas offenbar nicht (er scheint ein Problem
damit zu haben, dass ein "Buchstabe" aus mehreren "Buchstaben" besteht.
(einen Editor (Kate, NEdit) und dort Replace habe ich bereits probiert,
die beiden konvertieren automatisch beim Speichern in "ihre"
Zeichensäte)
Kennt jemand ein Tool, was das macht? (Gern auch erstmal ein paar gute
Suchbegriffe für Google, ich find mit den meinigen nix passendes) Oder
eine alternative Vorgehensweise?
Viele Grüße
  Fabian