RegEx, Umlaute und andere Sonderzeichen

German support forum

Moderators: Hacker, Stefan2, white

Post Reply
PicNic
Junior Member
Junior Member
Posts: 2
Joined: 2006-10-23, 11:28 UTC

RegEx, Umlaute und andere Sonderzeichen

Post by *PicNic »

Hallo zusammen,

ich schlage mich jetzt schon geraume Zeit mit den regulären Ausdrücken herum, aber komme irgendwie auf keinen grünen Zweig. Werde das Suchen im Netz, noch die Suche in diesem oder andern Foren konnte mir weiterhelfen. Folgendes Problem:
Ich habe ein Verzeichnis mit vielen Unterverzeichnissen und darin verteilt ca. 40000 Dateien. die Dateinamen haben verschiedene Enmdungen und - da sie Teilweise aus Wiederherstellungen einer defekten Festplatte stammen - auch Zeichen im Dateinamen die nicht zum regulären Zeichensatz gehören.
Ich suche nun eine Möglichkeit erst einmal nach allen Dateien zu suchen die andere Zeichen enthalten als [a-zA-Z0-9], also eigentlich [^a-zA-Z0-9].
Ein weiteres Problem ist, dass auf meinem Rechner (Win, DE) in dieser Suche aber auch deutsche Umlaute und der Unterstrich enthalten sind. Diese will ich aber auch aufgelistet haben.
Ich suche also Dateien, die folgendes NICHT enthalten dürfen:
- Umlaute und ß
- Sonderzeichen jeglicher Art
- Unterstrich
Folgende Zeichn dürfen enthalten sein ():
- abcdefghijklmnopqrstuvwxyz (groß und klein)
- Zahlen
- Leerzeichen
- natürlich der Punkt für die Dateiendung, aber kein Muss, da es auch um Verzeichnisse geht

Besten Dank schonmal im voraus
PicNic
Folgendes
icfu
Power Member
Power Member
Posts: 6052
Joined: 2003-09-10, 18:33 UTC

Post by *icfu »

This account is for sale
PicNic
Junior Member
Junior Member
Posts: 2
Joined: 2006-10-23, 11:28 UTC

... nicht ganz ...

Post by *PicNic »

Danke für die Antwort. Ich habe das Plugin installiert und ausprobiert, aber es bringt mir nicht die gewünschten Ergebnisse. Wenn ich nach Dateien such und angebe "Unicode-Test !=Teilweise Unicode" oder "Unicode-Test !=Reines Unicode", dann gibt er mit z.B. trotzdem das Verzeichnis "User Files" aus. Benenne ich dieses um in "UserFiles", wird es trotzdem weiterhin ausgegeben.
Mache ich etwas falsch oder liegt der Schlüssel doch in einer komplexen RegEx-Anweisung?

Danke
PicNic
icfu
Power Member
Power Member
Posts: 6052
Joined: 2003-09-10, 18:33 UTC

Post by *icfu »

Das Plugin ist ein wenig mißverständlich, bitte in Readme schauen. ;)

Das Schlüssel liegt darin, daß Du die Suche mit dem Plugin eingrenzen kannst.

Du suchst zuerst nach Unicode Test = ANSI, dann hast Du schon mal alle Dateien rausgeworfen, die Müllzeichen enthalten.

Anschließend durchsuchst Du dann das Ergebnis (nach Feed To List) mit einem RegEx-String Deiner Wahl. Wenn Du Dateien finden willst, die irgendwas NICHT enthalten, mußt Du dieses irgendwas anstelle von blabla in [^blabla] komplett auflisten, wie Du oben bereits erwähnt hast, da bleibt Dir nichts anderes übrig.

Unter http://regexlib.com/ findest Du vielleicht einen Ausdruck, der Deinen Wunsch bereits enthält.

Icfu
This account is for sale
Post Reply