Wörter mit Umlauten werden nicht gefunden

German support forum

Moderators: Hacker, Stefan2, white

Post Reply
gourmand
Junior Member
Junior Member
Posts: 16
Joined: 2006-07-31, 11:00 UTC
Location: Saarland

Wörter mit Umlauten werden nicht gefunden

Post by *gourmand »

Betrifft TC 8.01 x64 unter Windows 7 Professional

Auch nach langer Suche in der TC-Hilfe, dem Forum und bei Google habe ich keine Lösung für mein Problem gefunden:

In einem Verzeichnis befinden sich viele Unterverzeichnisse mit Textdateien (RTF). Wenn ich das oberste Verzeichnis rechtsklicke > Suchen... > Text suchen usw. klappt alles eigentlich immer wunderbar - es sei denn das Wort enthält einen Umlaut. In diesem Fall wird keine einzige Fundstelle angezeigt.

Kann jemand helfen?

Vielen Dank für jede hilfreiche Antwort!
User avatar
Peter
Power Member
Power Member
Posts: 2068
Joined: 2003-11-13, 13:40 UTC
Location: Schweiz

Post by *Peter »

Das ist simpel - Umlaute werden ganz anders gespeichert: aus "Müller" wird "M\'fc\loch\f0 ller"

Lösung: Plugin textsearch (Achtung: Kleingedrucktes lesen ...)

Peter
TC 10.xx / #266191
Win 10 x64
User avatar
Horst.Epp
Power Member
Power Member
Posts: 6987
Joined: 2003-02-06, 17:36 UTC
Location: Germany

Post by *Horst.Epp »

Das liegt an der Kodierung von Umlauten in RTF Dateien
und ist kein Fehler im TC.
gourmand
Junior Member
Junior Member
Posts: 16
Joined: 2006-07-31, 11:00 UTC
Location: Saarland

Post by *gourmand »

Vielen Dank an Peter für seine schnelle Antwort. Ich habe das Plugin TextSearch dort runtergeladen
www.totalcmd.net/plugring/textsearch.html
und installiert, komme aber damit auch nach Lesen der Readme.html (damit ist wohl das Kleingedruckte gemeint) nicht klar. Die Suche nach Begriffen mit Umlauten bleibt nach wie vor ergebnislos.

Mithilfe eines Hexeditors (sehr gut: HxD) konnte ich die Umlautcodes aufspüren und die Suche erfolgreich durchführen:

ä = \u228
ö = \u246
ü = \u252
Ä = \u196
Ö = \u214
Ü = \u220
ß = \u223

Am Ende jedes Codes steht übrigens ein Leerzeichen!

Nach "Müller" suche ich also mit "M\u252 ller".

Bei richtiger Handhabung klappt es bestimmt auch mit TextSearch. Hat jemand einen heißen Tipp?
User avatar
HolgerK
Power Member
Power Member
Posts: 5411
Joined: 2006-01-26, 22:15 UTC
Location: Europe, Aachen

Post by *HolgerK »

Inhalts plugins werden über den Tab "Plugins"
- "Plugin" auswählen
- "Eigenschaft" "Text" auswählen
- OP "enthält" auswählen
- Wert Müller eingeben
- Suche starten

PS: auf der Downloadseite gibt es ein Bild dazu...

Meistens ist es sinnvoll die Dateisuche per Dateimaske (z.B. "*.rtf") einzuschränken.

Gruß
Holger
gourmand
Junior Member
Junior Member
Posts: 16
Joined: 2006-07-31, 11:00 UTC
Location: Saarland

Post by *gourmand »

Hallo Holger,

genau so habe ich es gemacht. Komisch.

Kann es sein, dass 'meine' RTFs vielleicht von irgendeiner Norm abweichen, dass es also solche und solche gibt? Im Müller-Beipiel von Peter ist das ü nämlich anders codiert.

Gruß
gourmand
User avatar
HolgerK
Power Member
Power Member
Posts: 5411
Joined: 2006-01-26, 22:15 UTC
Location: Europe, Aachen

Post by *HolgerK »

Wordpad:test.rtf wrote:{\rtf1\ansi\deff0{\fonttbl{\f0\fnil\fcharset0 Courier New;}}
{\*\generator Msftedit 5.41.21.2510;}\viewkind4\uc1\pard\lang1031\f0\fs22 M\'fcller\par
}
Wird hier gefunden.
Wie lautet denn die Schreibweise in deinem Fall, und mit welchem Programm wurde das RTF-File erstellt?

Gruß
Holger

Nachtrag:
Versuch mal in der TextSearch.ini den internen RFT Konverter auszukommentieren
;RTF={CP:RTF}
und den externen Konverter zu aktivieren:
IFILTER=Conv\IFilter\GetTextIFilter.exe -s "{In}" -d "{Out}" -l
RTF=IFILTER
gourmand
Junior Member
Junior Member
Posts: 16
Joined: 2006-07-31, 11:00 UTC
Location: Saarland

Post by *gourmand »

Wie das gemeint ist, verstehe ich leider nicht:

{\rtf1\ansi\deff0{\fonttbl{\f0\fnil\fcharset0 Courier New;}}
{\*\generator Msftedit 5.41.21.2510;}\viewkind4\uc1\pard\lang1031\f0\fs22 M\'fcller\par
}

Deine Vorschläge bezüglich der TextSearch.ini habe ich umgesetzt mit dem Ergebnis, dass die Suche wesentlich länger dauert (>700 RTFs!), aber immer noch nichts gefunden wird.

Hintergrundinformationen:
Zum Sammeln von Notizen jeglicher Art verwende ich seit Jahren das Programm AM-Notebook. Die älteren Versionen legten die Notizen noch im RTF-Format ab, die neueren als RichView (.rvf).
Das Ansehen von RVFs ist nicht so einfach möglich wie das von RTFs oder gar TXT-Dateien und das TC-Plugin RVLister läuft leider nur mit dem TC x32.

Und jetzt wird's interessant. Die von den älteren AM-Notebook-Versionen direkt erzeugten RTFs (als Backup noch vorhanden) lassen sich mit TextSearch problemlos durchsuchen, die neuen (erst durch Exportieren enstandenen) nicht. Word und WordPad können auch die 'Export-RTFs' problemlos laden. Auch von Word und WordPad direkt erzeugte RTFs lassen sich mit TextSearch nach Begriffen mit Umlauten durchsuchen.

Damit ist eigentlich klar, dass meine Problem-RTFs nicht dieselben Spezifikationen haben können wie die früheren. Deshalb halte ich es nicht für sinnvoll bzw. zumutbar, Euch weiterhin mit einem so speziellen Thema zu beschäftigen.

Vielen Dank für die freundliche Hilfe!

Gruß
gourmand
User avatar
Peter
Power Member
Power Member
Posts: 2068
Joined: 2003-11-13, 13:40 UTC
Location: Schweiz

Post by *Peter »

gourmand wrote:Wie das gemeint ist, verstehe ich leider nicht:

{\rtf1\ansi\deff0{\fonttbl{\f0\fnil\fcharset0 Courier New;}}
{\*\generator Msftedit 5.41.21.2510;}\viewkind4\uc1\pard\lang1031\f0\fs22 M\'fcller\par
}....
Das ist einfach auch ein Auszug aus der RTF-Datei mit "Müller", aber etwas mehr Code (mit Formatierungen usw.)
-----------------------------
gourmand wrote:...Deine Vorschläge bezüglich der TextSearch.ini habe ich umgesetzt mit dem Ergebnis, dass die Suche wesentlich länger dauert (>700 RTFs!), aber immer noch nichts gefunden wird....
Ja, das ist korrekt. Textsearch verwendet die "IFilter" http://de.wikipedia.org/wiki/IFilter, um die Dateien zuerst in lesbaren Text zu konvertieren und dann erst den Text zu durchsuchen. Daher klappt das auch mit so seltsamen Binär-Misch-Formaten wie DWG und PDF, wenn !!!! der richtige IFilter auf der Maschine ist und auch gefunden wird.

-----------------------------
gourmand wrote:...Zum Sammeln von Notizen jeglicher Art verwende ich seit Jahren das Programm AM-Notebook. ...
Vielleicht mal hier testen:
http://www.codeproject.com/Articles/5371/ToDoList-6-6-b2-Beta-Release-An-effective-and-flex
http://zhornsoftware.co.uk/stickies/

-----------------------------
gourmand wrote:...Auch von Word und WordPad direkt erzeugte RTFs lassen sich mit TextSearch nach Begriffen mit Umlauten durchsuchen....
Also klappt Textsearch prinzipiell?

-----------------------------
gourmand wrote:...Damit ist eigentlich klar, dass meine Problem-RTFs nicht dieselben Spezifikationen haben können wie die früheren. ...
Das kann durchaus sein - siehe die verschiedenen Beispiel von "Müller".

-----------------------------
gourmand wrote:...Deshalb halte ich es nicht für sinnvoll bzw. zumutbar, Euch weiterhin mit einem so speziellen Thema zu beschäftigen.....
Nun ja - man lernt ja selbst immer wieder was dazu. Also weiterfragen - wenn du keien Antworten mehr bekommst wirst du das schon merken.


Peter
TC 10.xx / #266191
Win 10 x64
gourmand
Junior Member
Junior Member
Posts: 16
Joined: 2006-07-31, 11:00 UTC
Location: Saarland

Post by *gourmand »

Also klappt Textsearch prinzipiell?
Ja, es klappt, falls eine RTF nicht irgendwie aus dem Rahmen fällt.
Danke für die Links, ich gucke sie gerne mal an. Aber es gibt zwei Programme, ohne die ich noch älter aussehen würde als ohnehin schon: Total Commander und AM-Notebook. Beide sind für mich konkurrenzlos.
Post Reply