Suchen in RTF-Dateien

German support forum

Moderators: white, Hacker, Stefan2

Post Reply
User avatar
tamaleus
Junior Member
Junior Member
Posts: 47
Joined: 2007-03-09, 22:00 UTC
Location: Dübendorf, Schweiz
Contact:

Suchen in RTF-Dateien

Post by *tamaleus »

Hallo
Habe - soweit gefunden - alles zum Thema gelesen, sehe aber meine Aufgabe mit dem Ansatz der Codierung der Umlaute nicht gelöst. Ich suche beispielsweise die Textsequenz " – " (Leerzeichen, Gedankenstrich, Leerzeichen) wobei - bedingt durch die Typografie - verschiedene "Gedankenstriche" möglich sind. Wenn ich allerdings diese Sequenz mittels Word (365) in der geöffneten *.rtf-Datei suche, wird sie gefunden. Praktisch wäre aber, alle *.rtf-Dateien mit TC durchsuchen zu können, wobei das jedes Mal eine andere Textsequenz sein kann. Leicht überfordert fühle ich mich durch die diversen Optionen (unterhalb von "Text suchen"; muss jetzt beispielsweise bei diesem Suchstring die Option "nur ganze Wörter" geflagt sein oder nicht? Oder spielt das keine Rolle?) und insbesondere deren Kombinationsmöglichkeiten.
Gibt es eine "einfache" Suchmöglichkeit, die die gewünschten Treffer erziehlt und zwar ohne, einzelne Zeichen umcodieren zu müssen, da es beim nächsten Mal vielleicht nicht der Gedanken-, sondern der Streckenstrich oder das "sz" ist?
Das Leben wird vorwärts gelebt, aber rückwärts verstanden
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 48079
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Re: Suchen in RTF-Dateien

Post by *ghisler(Author) »

Total Commander alleine enthält keine spezielle Suchfunktion für RTF-Dateien, sie werden wie Textdateien durchsucht. Möglicherweise geht es mit einem Plugin, z.B. PCREsearch:
https://www.ghisler.ch/board/viewtopic.php?t=38098
Dieser kann die Inhaltsfilter von Oracle Outside In verwenden. Ich habe allerdings nicht untersucht, ob es da einen Filter für RTF gibt.
Author of Total Commander
https://www.ghisler.com
User avatar
tamaleus
Junior Member
Junior Member
Posts: 47
Joined: 2007-03-09, 22:00 UTC
Location: Dübendorf, Schweiz
Contact:

Re: Suchen in RTF-Dateien

Post by *tamaleus »

Danke. Leider kann ich damit nichts anfangen. Die Exe aufgerufen scheint kurz ein Fenster zu öffnen/laden, verschwindet aber sofort. Wie ich das brauchen soll, verstehe ich leider nicht. Die Anleitung (pcre2grep.txt, Ver 10.22) ist schier endlos. Nur, wie das Ding zu benutzen ist, konnte ich nicht finden. Bin weiter auf der Suche nach einer "etwas leichter" anzuwendenden Lösung. Oder Hilfe.
JOUBE
Power Member
Power Member
Posts: 1474
Joined: 2004-07-08, 08:58 UTC

Re: Suchen in RTF-Dateien

Post by *JOUBE »

Vielleicht hilft diese Variante weiter?

Haken bei "Text suchen", Inhalt: (-|–|ß)
Haken bei "Reg.Ausdruck (RegEx 2)
Kein Haken bei "nur ganze Wörter"

mit - = Gedankenstrich
mit – = Streckenstrich
mit ß = das "sz"

In der entstehenden Liste der gefundenen Dateien kann man dann einzelne Dateien mit F3 (integrierter Dateibetrachter) aufrufen und dort dann durch nochmaliges Drücken von F3 die gesuchten Zeichen in der Datei finden. Oder man verarbeitet die gefundenen Dateien durch Drücken des Buttons "anwenden" in einem Fenster weiter.

JOUBE
User avatar
milo1012
Power Member
Power Member
Posts: 1158
Joined: 2012-02-02, 19:23 UTC

Re: Suchen in RTF-Dateien

Post by *milo1012 »

tamaleus wrote: 2018-07-30, 08:44 UTCIch suche beispielsweise die Textsequenz " – " (Leerzeichen, Gedankenstrich, Leerzeichen) wobei - bedingt durch die Typografie - verschiedene "Gedankenstriche" möglich sind. Wenn ich allerdings diese Sequenz mittels Word (365) in der geöffneten *.rtf-Datei suche, wird sie gefunden. Praktisch wäre aber, alle *.rtf-Dateien mit TC durchsuchen zu können, wobei das jedes Mal eine andere Textsequenz sein kann.
Word und andere Programme nutzen eine Ersetzungstabelle, die versucht, gleichwertige Zeichen zu "normalisieren", sprich in diesem Fall Bindestrich-Minus und Halbgeviertstrich als gleichwertig zu behandeln. Andere Beispiele wären Umlaute oder Akzentzeichen. Das geht aber auch nur so lange gut, bis man eben Treffer hat, die man nicht wollte, z.B. man eben genau Bindestrich-Minus suchen wollte, Word aber eine andere Variante findet.

Zum eigentlichen Problem: letztlich läuft das wieder mal auf RegEx hinaus, heißt also:
[x] Reg. Ausdruck (RegEx 2)
ankreuzen
und dann als Suchtext z.B. eingeben:

Code: Select all

\s[\-‐–]\s
Sieht kompliziert aus, ist es auch, wenn man "mal eben" solche Dinge eingeben will.
Hätte TC eine bessere RegEx-Engine (PCRE, Python) könnte man das Ganze verkürzen mit z.B.

Code: Select all

\s\p{Pd}\s
Das würde auch mit meinem besagten Plugin PCREsearch funktionieren, nur müsstest du vor jedem Suchvorgang das Plugin umkonfigurieren, was auch müßig ist. Die Volltextsuche des Plugins nützt dafür auch wenig, weil sie nur Text zurückgibt, den TC dann wieder mit seiner eigenen Textsuche durchsucht.

Des weiteren: RTF-Dateien können prinzipiell erstmal wie Textdateien durchsucht werden. Problematisch sind aber Formatierungen. Wären in diesem Beispiel die Bindestriche jeweils Fett geschrieben und der umliegende Text normal, kommt man mit o.g. Suchstring nicht weiter. In dem Fall würde die Volltextsuche des Plugins helfen, weil sie die Formatierungen quasi entfernt und nur sauber durchsuchbaren Text bereitstellt, was TC von Haus aus bei RTF nicht kann.

tamaleus wrote: 2018-07-31, 21:06 UTCLeider kann ich damit nichts anfangen. Die Exe aufgerufen scheint kurz ein Fenster zu öffnen/laden, verschwindet aber sofort. Wie ich das brauchen soll, verstehe ich leider nicht. Die Anleitung (pcre2grep.txt, Ver 10.22) ist schier endlos. Nur, wie das Ding zu benutzen ist, konnte ich nicht finden. Bin weiter auf der Suche nach einer "etwas leichter" anzuwendenden Lösung. Oder Hilfe.
Du hast da was völlig anderes heruntergeladen. Christian hat doch extra auf die Plugin-Diskussionsseite verlinkt, bei der der Download-Link auf
http://www.totalcmd.net/plugring/PCREsearch.html
verweist.
TC plugins: PCREsearch and RegXtract
User avatar
tamaleus
Junior Member
Junior Member
Posts: 47
Joined: 2007-03-09, 22:00 UTC
Location: Dübendorf, Schweiz
Contact:

Re: Suchen in RTF-Dateien

Post by *tamaleus »

Fürs Erste reicht das, danke! Sonst melde ich mich wieder.
NB: Beim Link http://www.totalcmd.net/plugring/PCREsearch.html erhalte ich eine Warnung bez. schädliche Programme usw. (von "Google Safe Browsing!)
User avatar
Horst.Epp
Power Member
Power Member
Posts: 6482
Joined: 2003-02-06, 17:36 UTC
Location: Germany

Re: Suchen in RTF-Dateien

Post by *Horst.Epp »

tamaleus wrote: 2018-08-04, 10:45 UTC Fürs Erste reicht das, danke! Sonst melde ich mich wieder.
NB: Beim Link http://www.totalcmd.net/plugring/PCREsearch.html erhalte ich eine Warnung bez. schädliche Programme usw. (von "Google Safe Browsing!)
Lösung: ignorieren und trotzdem laden.
Das sind keine Schadprogramme drin.
Windows 11 Home x64 Version 23H2 (OS Build 22631.3447)
TC 11.03 x64 / x86
Everything 1.5.0.1372a (x64), Everything Toolbar 1.3.3, Listary Pro 6.3.0.73
QAP 11.6.3.2 x64
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 48079
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Re: Suchen in RTF-Dateien

Post by *ghisler(Author) »

Laut dem Seitenbetreiber "Flint" werden die folgenden 4 Plugins/Tools vom Safe-Browsing-Filter fälschlicherweise als schädlich eingestuft:
TC_FavMenu2
BootScreenView
TCPlayer
SVI_Eliminator
Siehe: https://www.ghisler.ch/board/viewtopic.php?p=345414#p345414

Der Betreiber sucht derzeit nach einer Lösung, möglichst unter Einbeziehung der Entwickler.
Author of Total Commander
https://www.ghisler.com
Post Reply