===> find -name '*.gthumpy' guettli@r51:~/tmp/old/erzgebirgstraverse --> keine Dateien gefunden
===> LANG=C find -name '*.gthumpy' ./3) Start/die ersten L?ufer.gthumpy ./3) Start/?bergabe Staffestab am Start.gthumpy ./2) vor dem Start/Erw?rmung der Talfreunde.gthumpy ./2) vor dem Start/Zelt oder Blockh?tte.gthumpy ./2) vor dem Start/Erw?rmung der Talfreunde 1.gthumpy guettli@r51:~/tmp/old/erzgebirgstraverse --> Warum werden die Dateien bei LANG!=C nicht gefunden?
===> find --version GNU find Version 4.2.31 Built using GNU gnulib version 2007-02-24 Aktivierte Funktionen: D_TYPE O_NOFOLLOW(enabled) LEAF_OPTIMISATION
===> echo $LANG de_DE.UTF-8
Der Dateiname ist nicht utf8, aber trotzdem sollte die Datei gefunden werden, oder?
Gruß, Thomas
Thomas Guettler guettli@thomas-guettler.de (Di 22 Apr 2008 22:07:12 CEST):
===> find -name '*.gthumpy' guettli@r51:~/tmp/old/erzgebirgstraverse --> keine Dateien gefunden
===> LANG=C find -name '*.gthumpy' ./3) Start/die ersten L?ufer.gthumpy ./3) Start/?bergabe Staffestab am Start.gthumpy ./2) vor dem Start/Erw?rmung der Talfreunde.gthumpy ./2) vor dem Start/Zelt oder Blockh?tte.gthumpy ./2) vor dem Start/Erw?rmung der Talfreunde 1.gthumpy guettli@r51:~/tmp/old/erzgebirgstraverse --> Warum werden die Dateien bei LANG!=C nicht gefunden?
find(1) nutzt fnmatch(3), aber dort steht nicht viel zu I18N. Etwas mehr steht bei glob(7), aber auch nichts, was das von Dir beobactete Verhalten erklärt.
"echo *" verhält sich ebenso.
Vielleicht kennt UTF8 nur 0-127 und dann die Unicode-Sequenzen? Und alles andere wird als "Schrott" betrachtet?
(Sourcecode für fnmatch()?)
[PS: bist Du auch dort, bei der Traverse?]
On Tue, Apr 22, 2008 at 10:56:28PM +0200, Heiko Schlittermann wrote:
Thomas Guettler guettli@thomas-guettler.de (Di 22 Apr 2008 22:07:12 CEST):
[cut]
Vielleicht kennt UTF8 nur 0-127 und dann die Unicode-Sequenzen? Und alles andere wird als "Schrott" betrachtet?
Der Latin1 Umlaut ist im UTF8 Kontext sicherlich Schrott. Aber das ist doch kein Grund den Schrott gleich zu ignorieren. Gerade bei den aktuellen hohen Wertstoffpreisen. Das * sollte einfach alles mitnehmen...
[PS: bist Du auch dort, bei der Traverse?]
Ja, auch wenn ich derzeit noch nicht gut vorbereitet bin. Wenn du willst, kannst du bei BSG Talfreunde mitlaufen. Es werden noch welche gesucht, damit eine zweite Mannschaft voll wird.
Näheres hier: http://www.erzgebirgstraverse.de/moin/Startseite
Gruß, Thomas
On Wed, Apr 23, 2008 at 10:48 PM, Thomas Guettler guettli@thomas-guettler.de wrote:
Das * sollte einfach alles mitnehmen...
* passt halt auf beliebige Zeichen, aber eben nicht auf Schrott.
Viele Grüße, Torsten
Hallo Thomas,
On Tue, Apr 22, 2008 at 10:07 PM, Thomas Guettler guettli@thomas-guettler.de wrote:
Der Dateiname ist nicht utf8, aber trotzdem sollte die Datei gefunden werden, oder?
nein, latin1-Umlaute entsprechen keinen gültigen Zeichen in UTF-8. Das Parsen des Strings bricht dann konsequenterweise genau an dieser Stelle ab oder der gesamte String wird als ungültig betrachtet. Du willst wahrscheinlich, dass solche Probleme einfach ignoriert werden, aber das ist vermutlich nicht in find implementiert.
Viele Grüße, Torsten
lug-dd@mailman.schlittermann.de