In OpenOffice-Dateien enthaltenen Text suchen ?
Moderators: Hacker, Stefan2, white
In OpenOffice-Dateien enthaltenen Text suchen ?
Ich liebe OpenOffice, auch wegen seiner kompakten Zip-komprimierten XML-Dokumente: Ein *.odt oder *.sxw ist ein ZIP, das enthält u.a. eine Datei content.xml, die enthält den eigentlichen interessierenden Text.
Aber um nach solchen Dokumenten mit bestimmtem enthaltenem Text suchen zu können, braucht man nun dringend ein Tool.
Ein schönes kleines Standalone-Tool ist o3find http://web.tiscali.it/fanelia/sw/o3find/ . Dort gibt's auch eine Kommandozeilenversion, die sich vielleicht als Filter eignet.
TC kann mit Strg-BildAb in diese ODTs einsteigen, kein Problem.
Mit SearchFiles=*.sxw *.odt unter der Ueberschrift [Configuration] in der wincmd.ini und "Archive durchsuchen" und "Text suchen" kann TC nun auch nach darin enthaltem Text suchen... meint man:
Als Beispiel ein OpenOffice Test.odt, das enthält nur das eine Wort 'Hallo'.
Suche ich nach enthaltenem Text 'content', dann wird die Test.odt gefunden, gut.
Suche ich nach enthaltenem Text 'hallo', dann aber nicht.
Suche ich nach enthaltenem Text '[mein Nachname]', dann aber schon... ?? (mein Name ist als Autor in meta.xml enthalten)
Gehe ich mit Strg-BildAb ins Test.odt rein und suche nach enthaltenem Text 'hallo', dann findet TC richtig die content.xml; der Lister kann sie anzeigen und darin 'hallo' finden.
Versteht das jemand? Oder kann mir gar helfen?
Aber um nach solchen Dokumenten mit bestimmtem enthaltenem Text suchen zu können, braucht man nun dringend ein Tool.
Ein schönes kleines Standalone-Tool ist o3find http://web.tiscali.it/fanelia/sw/o3find/ . Dort gibt's auch eine Kommandozeilenversion, die sich vielleicht als Filter eignet.
TC kann mit Strg-BildAb in diese ODTs einsteigen, kein Problem.
Mit SearchFiles=*.sxw *.odt unter der Ueberschrift [Configuration] in der wincmd.ini und "Archive durchsuchen" und "Text suchen" kann TC nun auch nach darin enthaltem Text suchen... meint man:
Als Beispiel ein OpenOffice Test.odt, das enthält nur das eine Wort 'Hallo'.
Suche ich nach enthaltenem Text 'content', dann wird die Test.odt gefunden, gut.
Suche ich nach enthaltenem Text 'hallo', dann aber nicht.
Suche ich nach enthaltenem Text '[mein Nachname]', dann aber schon... ?? (mein Name ist als Autor in meta.xml enthalten)
Gehe ich mit Strg-BildAb ins Test.odt rein und suche nach enthaltenem Text 'hallo', dann findet TC richtig die content.xml; der Lister kann sie anzeigen und darin 'hallo' finden.
Versteht das jemand? Oder kann mir gar helfen?
2Lefteous
Ja, klar. Das Komische ist ja, daß TC einen Text 'Hans' in der Datei meta.xml im Archiv Test.odt findet, aber einen Text 'Hallo' in der Datei contents.xml im Archiv Test.odt NICHT findet.
Die Test.odt für Versuche: http://rapidshare.de/files/12979286/Test.odt.html
Verwirrte Grüße, Hans
Ja, klar. Das Komische ist ja, daß TC einen Text 'Hans' in der Datei meta.xml im Archiv Test.odt findet, aber einen Text 'Hallo' in der Datei contents.xml im Archiv Test.odt NICHT findet.
Die Test.odt für Versuche: http://rapidshare.de/files/12979286/Test.odt.html
Verwirrte Grüße, Hans
2Lefteous
Nu bin ich platt. Das heißt, wie ganz oben gesagt: wenn ich das Archiv in TC offen hab', dann geht das schon.
Aber wenn ich ein Verzeichnis höher bin, dann finde ich nur noch 'Hans'. Zur Verdeutlichung:
Aufgabe: "Wo hab' ich neulich nochmal die FDG6204 bestellt?"
Lösungsansatz: Im Verzeichnis Bestellungen alle Dateien nach dem enthaltenen Text 'FDG6204' durchsuchen.
Wären die Bestellungen ungepackte Word-DOCs, dann kann das auch der MS Explorer. Aber OOo-ODTs sind Archive, also muß jedes ODT entpackt und die enthaltenen Dateien (eigentlich nur die content.xml) müssen durchsucht werden.
Nu bin ich platt. Das heißt, wie ganz oben gesagt: wenn ich das Archiv in TC offen hab', dann geht das schon.
Aber wenn ich ein Verzeichnis höher bin, dann finde ich nur noch 'Hans'. Zur Verdeutlichung:
Aufgabe: "Wo hab' ich neulich nochmal die FDG6204 bestellt?"
Lösungsansatz: Im Verzeichnis Bestellungen alle Dateien nach dem enthaltenen Text 'FDG6204' durchsuchen.
Wären die Bestellungen ungepackte Word-DOCs, dann kann das auch der MS Explorer. Aber OOo-ODTs sind Archive, also muß jedes ODT entpackt und die enthaltenen Dateien (eigentlich nur die content.xml) müssen durchsucht werden.
Re: In OpenOffice-Dateien enthaltenen Text suchen ?
Das muss doch SearchInFiles heißen....Hansl wrote:Mit SearchFiles=*.sxw *.odt
2shammat
AAAHH! Ich werd wahnsinnig! Das wars! Man muß einfach das Kleingedruckte lesen... DANKE! Jedoch:
Das SearchFiles... hatte ich aus einer Mail von Meister Ghisler persönlich. In der TC-Hilfe steht aber SearchInFiles.
Ganz ohne Search... findet TC gar nix in meinem ODT.
Mit SearchFiles findet TC nur das 'Hans' und meldet als Fundstelle Test.odt.
Mit SearchInFiles findet TC das 'Hans' und meldet als Fundstelle Test.odt/meta.xml; und TC findet auch das 'Hallo' und meldet als Fundstelle Test.odt/content.xml ...
Noch verwirrter, aber jetzt zufrieden: Danke an alle & gute Nacht! Hans
AAAHH! Ich werd wahnsinnig! Das wars! Man muß einfach das Kleingedruckte lesen... DANKE! Jedoch:
Das SearchFiles... hatte ich aus einer Mail von Meister Ghisler persönlich. In der TC-Hilfe steht aber SearchInFiles.
Ganz ohne Search... findet TC gar nix in meinem ODT.
Mit SearchFiles findet TC nur das 'Hans' und meldet als Fundstelle Test.odt.
Mit SearchInFiles findet TC das 'Hans' und meldet als Fundstelle Test.odt/meta.xml; und TC findet auch das 'Hallo' und meldet als Fundstelle Test.odt/content.xml ...
Noch verwirrter, aber jetzt zufrieden: Danke an alle & gute Nacht! Hans
2shammat
... welches Plugin meinst du? oooinfo? Ich hatte beim Suchen beim Tab Plugin nichts aktiviert, nur beim Tab Allgemeines Archive und Text. oooinfo zeigt auch nur Metadaten, nicht den eigentlichen Inhalt, oder?
2shammat
Einige Versuche mit meinen realen ODTs klappen jetzt alle prima.
Meine vorige Behauptung war wohl falsch, SearchFiles wirkt wie gar kein Search.
Dafür hab' ich's jetzt halbwegs verstanden: Wenn man die ODT mit dem Lister anguckt (unentpackt, 'nur Text'), dann sieht man, daß die XMLs darin verschieden gepackt sind: das 'Hans' in der meta.xml kann man direkt lesen; das 'Hallo' in der content.xml aber nicht.
Jetzt aber wirklich gute Nacht! Hans
... welches Plugin meinst du? oooinfo? Ich hatte beim Suchen beim Tab Plugin nichts aktiviert, nur beim Tab Allgemeines Archive und Text. oooinfo zeigt auch nur Metadaten, nicht den eigentlichen Inhalt, oder?
2shammat
Einige Versuche mit meinen realen ODTs klappen jetzt alle prima.
Meine vorige Behauptung war wohl falsch, SearchFiles wirkt wie gar kein Search.
Dafür hab' ich's jetzt halbwegs verstanden: Wenn man die ODT mit dem Lister anguckt (unentpackt, 'nur Text'), dann sieht man, daß die XMLs darin verschieden gepackt sind: das 'Hans' in der meta.xml kann man direkt lesen; das 'Hallo' in der content.xml aber nicht.
Jetzt aber wirklich gute Nacht! Hans
2Hansl
Ich versteh deine erneute Nachfrage deswegen jetzt nicht wirklich, aber bitte: ooinfo kann nach Metadaten und auch nach Volltext suchen.
Also ich für meinen Teil meinte ooinfo. Ich hatte ja extra nochmal nachgefragt, ob Du... welches Plugin meinst du? oooinfo? Ich hatte beim Suchen beim Tab Plugin nichts aktiviert, nur beim Tab Allgemeines Archive und Text. oooinfo zeigt auch nur Metadaten, nicht den eigentlichen Inhalt, oder?
eingegeben hast. Das hast Du mit "ja klar" beantwortet.unter Plugins im Suchendialog ooinfo.Text enthält Hallo
Ich versteh deine erneute Nachfrage deswegen jetzt nicht wirklich, aber bitte: ooinfo kann nach Metadaten und auch nach Volltext suchen.