EPUB-Suche fehlerhaft...
Moderators: Hacker, Stefan2, white
EPUB-Suche fehlerhaft...
Viele Wörter und Sätze werden im EPUB nicht gefunden. Einstellung ist aktiviert.
Es ist reproduzierbar.
Man nehme das Ebook:
http://www.mobileread.com/forums/showthread.php?t=229754
Und suche z.B. nach "Dieses weit größere Gemach"
Der Text kommt im EPUB vor wird aber nicht gefunden. Siehe auch hier:
http://www.lesen.net/forum/e-book-formate-software/sonstige-software/14372-totalcommander-8-50/index2.html#post208292
und
http://www.lesen.net/forum/e-book-formate-software/sonstige-software/14372-totalcommander-8-50/#post208066
Es ist reproduzierbar.
Man nehme das Ebook:
http://www.mobileread.com/forums/showthread.php?t=229754
Und suche z.B. nach "Dieses weit größere Gemach"
Der Text kommt im EPUB vor wird aber nicht gefunden. Siehe auch hier:
http://www.lesen.net/forum/e-book-formate-software/sonstige-software/14372-totalcommander-8-50/index2.html#post208292
und
http://www.lesen.net/forum/e-book-formate-software/sonstige-software/14372-totalcommander-8-50/#post208066
<Hinweis>
Hm, ist die Antwort nicht eine ganz andere? Nämlich Denkfehler? - Der am Anfang auch mir unterlaufen ist.
Einmalige Vorarbeit:
In der Datei wincmd.ini im Abschnitt [Configuration] den Parameter SearchInFiles= um *.epub ergänzen. Fehlt der Parameter noch, dann eintragen SearchInFiles=*.epub.
Danach Total Commander 8.50 neu starten.
Suchen Dialog:
Wir müssen den T.C. anweisen, nicht nach einer *.epub Datei zu suchen, sondern nach einer noch unbekannten Datei im Archiv *.epub, die den Suchtext beinhaltet.
Sowohl die verschiedenen Zeichensätze zu aktivieren, als auch das Office XML Format ist notwendig, weil das zwei verschiedene Paar Stiefel sind: Zeichensätze einerseits und Dateiformat Office XML andererseits.
Bei mir hat es geklappt und folgendes Ergebnis zurückgegeben:
Grüße
Karl
</Hinweis>Die Anleitung in diesem Post ist in Wirklichkeit ein Workarund um das Problem im T.C. 8.50 herum. Dieser Workaround funktionierte auch schon mit T.C. 8.01.
Der Denkfehler (siehe unten) lag daher eher bei mir.![]()
Hm, ist die Antwort nicht eine ganz andere? Nämlich Denkfehler? - Der am Anfang auch mir unterlaufen ist.
Einmalige Vorarbeit:
In der Datei wincmd.ini im Abschnitt [Configuration] den Parameter SearchInFiles= um *.epub ergänzen. Fehlt der Parameter noch, dann eintragen SearchInFiles=*.epub.
Danach Total Commander 8.50 neu starten.
Suchen Dialog:
- Suchen nach: *.*
(eben nicht nach *.epub. Die sind nur die Container, beinhalten selbst aber nicht den Suchstring.) - [X] Archive durchsuchen
(in diesem Sinne sind auch *.epub Archive) - [X] Text suchen: Von Süden nach Norden und von Norden nach Osten und von Osten hierher
(Der Suchstring ist nur der, den ich hier gesucht habe.) - [X] Windows Zeichnsatz
[X] DOS Zeichensatz
[X] Unicode UTF-16
[X] UTF8
[X] Office XML (docx, xlsx, odt usw, e-pub)
Wir müssen den T.C. anweisen, nicht nach einer *.epub Datei zu suchen, sondern nach einer noch unbekannten Datei im Archiv *.epub, die den Suchtext beinhaltet.
Sowohl die verschiedenen Zeichensätze zu aktivieren, als auch das Office XML Format ist notwendig, weil das zwei verschiedene Paar Stiefel sind: Zeichensätze einerseits und Dateiformat Office XML andererseits.
Bei mir hat es geklappt und folgendes Ergebnis zurückgegeben:
Code: Select all
Z:\home\karl\Downloads\Kraft-Nobody10.epub\OEBPS\Text\K8.xhtml
Karl
Last edited by karlchen on 2014-02-21, 17:01 UTC, edited 2 times in total.
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
Karlchen hat es schon schoen erklärt.Lefteous wrote:2Horst.Epp
Warum sollte man UTF-8 anhaken, wenn schon EPUB angehakt ist?
Ehrlich gesagt verstehe ich nicht, warum die ganze Textsuche so kompliziert ist. Und ich bin offenbar nicht der Einzige.
Und ich verstahe nicht was daran kompilziert sein soll ?
Mach einfach die Haken und die Suche funktioniert.
Ich sehe auch nicht, dass hier in den TC Foren so viele damit Probleme haben. Eigentlich nur in andren Foren, Leute die keine Ahnung davon haben, was ein EBook Format eigentlich ist.
Wenn du das HTMLview plugin installiert hat
kannst du im Suchergebnis uebrigens auch auf View gehen und den Text im EPUB ordentlich lesen.
Last edited by Horst.Epp on 2014-02-21, 13:46 UTC, edited 1 time in total.
Du hast Deine Datei in .zip umbenannt? (edit: nachträglich zwar geändert, aber dann auch nochmal probiert?) Das sind doch andere Voraussetzungen. Ohne .zip geht's nämlich nicht.karlchen wrote:Wir müssen den T.C. anweisen, nicht nach einer *.epub Datei zu suchen, sondern nach einer noch unbekannten Datei im Archiv *.epub, die den Suchtext beinhaltet.
Auch geht es an der Realität vorbei, dass man "Archive durchsuchen" soll, wenn schon epub ausgewählt ist. Wer weiß schon, dass epub eigentlich ein zip ist.
Außerdem dauert ja Suche nach *.* in "Archive" auch recht lang.
Eigentlich nichts, im Beispiel funktioniert's nur nicht.Horst.Epp wrote:Und ich verstahe nicht was daran kompilziert sein soll ?
Unsinn, warum sollte man sein Epub File in ein Zip umbenennen.JFierce7 wrote:Du hast Deine Datei in .zip umbenannt? (edit: nachträglich zwar geändert, aber dann auch nochmal probiert?) Das sind doch andere Voraussetzungen. Ohne .zip geht's nämlich nicht.karlchen wrote:Wir müssen den T.C. anweisen, nicht nach einer *.epub Datei zu suchen, sondern nach einer noch unbekannten Datei im Archiv *.epub, die den Suchtext beinhaltet.
Auch geht es an der Realität vorbei, dass man "Archive durchsuchen" soll, wenn schon epub ausgewählt ist. Wer weiß schon, dass epub eigentlich ein zip ist.
Außerdem dauert ja Suche nach *.* in "Archive" auch recht lang.
Und die Suche in Archiven macht man ja wohl nicht über eine ganze Platte.
Hallo, JFierce7.
Mir fehlte der Eintrag "SearchInFiles=*.epub" in der wincmd.ini.
Ohne den sieht der T.C. *.epub nicht als Archive an, die zu durchsuchen sind.
Im ersten Anlauf hatte ich die Epub Datei darum tatsächlich zur zip-Datei umbenannt (.zip angehängt)
Dann jedoch fiel es mir wie Schuppen aus den Haaren: SearchInFiles=*.epub.
Also Epub Datei wieder zurückbenannt und nochmal probiert. Und siehe da, es klappte.
Habe meine erste Antwort darum um den Hinweis auf die einmalig Vorarbeit, SearchInFiles=*.epub, ergänzt.
Kann ja nicht ahnen, dass ihr schneller mitlest, als ich hier tippen kann.
Karl
Mir fehlte der Eintrag "SearchInFiles=*.epub" in der wincmd.ini.
Ohne den sieht der T.C. *.epub nicht als Archive an, die zu durchsuchen sind.
Im ersten Anlauf hatte ich die Epub Datei darum tatsächlich zur zip-Datei umbenannt (.zip angehängt)
Dann jedoch fiel es mir wie Schuppen aus den Haaren: SearchInFiles=*.epub.
Also Epub Datei wieder zurückbenannt und nochmal probiert. Und siehe da, es klappte.
Habe meine erste Antwort darum um den Hinweis auf die einmalig Vorarbeit, SearchInFiles=*.epub, ergänzt.
Kann ja nicht ahnen, dass ihr schneller mitlest, als ich hier tippen kann.
Karl
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
Das durchsucht aber alle Archive und das will ich gar nicht. Ich will nur EPUB durchsuchen. Außerdem ist es Widersinnig das unten EPUB steht und man trotzdem noch oben Archive eingeben soll.karlchen wrote:Hm, ist die Antwort nicht eine ganz andere? Nämlich Denkfehler? - Der am Anfang auch mir unterlaufen ist.
Einmalige Vorarbeit:
In der Datei wincmd.ini im Abschnitt [Configuration] den Parameter SearchInFiles= um *.epub ergänzen. Fehlt der Parameter noch, dann eintragen SearchInFiles=*.epub.
Danach Total Commander 8.50 neu starten.
Suchen Dialog:Und [Suche starten] anklicken.
- Suchen nach: *.*
(eben nicht nach *.epub. Die sind nur die Container, beinhalten selbst aber nicht den Suchstring.)- [X] Archive durchsuchen
(in diesem Sinne sind auch *.epub Archive)- [X] Text suchen: Von Süden nach Norden und von Norden nach Osten und von Osten hierher
(Der Suchstring ist nur der, den ich hier gesucht habe.)- [X] Windows Zeichnsatz
[X] DOS Zeichensatz
[X] Unicode UTF-16
[X] UTF8
[X] Office XML (docx, xlsx, odt usw, e-pub)
Im Übrigen hab ich das auch schon ausprobiert es hilft nicht. Zumindest wenn ich es auf *.epub beschränke und nein ich will nicht gleich auch noch ZIPs und RARs durchsuchen
Und wenn EPUB zu den Archiven zählt dann bräuchte man die Option
erst gar nicht.[X] Office XML (docx, xlsx, odt usw, e-pub)
Das von dir vorgeschlagene Verfahren ging wohl schon vor 8.5, denn EPUB=ZIP.
Hi, samy.
Ich hatte nichts von einfach, eingängig, selbsterklärend, bequem und so weiter geschrieben.
Das beschriebene Verfahren liefert das gesuchte Ergebnis.
Zutreffend ist, dass viel mehr Archive durchsucht werden, als notwendig, wenn sich unterhalb des angegebenen Startpfades viele Archive tummeln, die dann auch noch gar keine epub Dateien sind.
Zutreffend ist auch, dass die Option [X] Office XML (docx, xlsx, odt usw, e-pub) nahelegt, dass genau dieser Dateityp auf jeden Fall durchsucht werden wird, ohne dass man "Archive durchsuchen" anticken muß.
Vielleicht tue ich das, was wir gerne raten: Ich lese mal ein bißchen in der Hilfedatei nach ....
<Leseergebnis>
[quote="totalcmd.chm - Abschnitt "Dateien suchen: Allgemeines""]Office-xml (docx, xlsx, odt usw.)+EPUB
Sucht in Microsoft-Office-, OpenOffice-, LibreOffice- und EPUB-Dateien. Diese sind nur umbenannte ZIP-Dateien mit Text im XML- oder HTML-Format. Es ist nicht notwendig, die Option "Archive durchsuchen" zu verwenden.[/quote]
</Leseergebnis>
<Schlußfolgerung>
(1) Ich hätte die Hilfedatei nochmal lesen sollen vor meinem ersten Post hier im Thread.
(2) Samy hat einfach Recht: das funktioniert im Total Command 8.50 nicht wie beschrieben.
</Schlußfolgerung>
Grüße
Karl
Ich hatte nichts von einfach, eingängig, selbsterklärend, bequem und so weiter geschrieben.

Das beschriebene Verfahren liefert das gesuchte Ergebnis.
Zutreffend ist, dass viel mehr Archive durchsucht werden, als notwendig, wenn sich unterhalb des angegebenen Startpfades viele Archive tummeln, die dann auch noch gar keine epub Dateien sind.
Zutreffend ist auch, dass die Option [X] Office XML (docx, xlsx, odt usw, e-pub) nahelegt, dass genau dieser Dateityp auf jeden Fall durchsucht werden wird, ohne dass man "Archive durchsuchen" anticken muß.
Vielleicht tue ich das, was wir gerne raten: Ich lese mal ein bißchen in der Hilfedatei nach ....
<Leseergebnis>
[quote="totalcmd.chm - Abschnitt "Dateien suchen: Allgemeines""]Office-xml (docx, xlsx, odt usw.)+EPUB
Sucht in Microsoft-Office-, OpenOffice-, LibreOffice- und EPUB-Dateien. Diese sind nur umbenannte ZIP-Dateien mit Text im XML- oder HTML-Format. Es ist nicht notwendig, die Option "Archive durchsuchen" zu verwenden.[/quote]
</Leseergebnis>
<Schlußfolgerung>
(1) Ich hätte die Hilfedatei nochmal lesen sollen vor meinem ersten Post hier im Thread.

(2) Samy hat einfach Recht: das funktioniert im Total Command 8.50 nicht wie beschrieben.
</Schlußfolgerung>
Grüße
Karl
Last edited by karlchen on 2014-02-21, 17:02 UTC, edited 4 times in total.
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
Hallo,
Ich bin zur Zeit mit den ganzen neuen Optionen noch nicht vertraut. Ich hatte sogar im Menü nach etwas mit der Bedeutung von "SearchInFiles" gesucht. Es ist einfach ungünstig, dass so etwas direkt in der .ini editiert werden muss. Das betrifft auch eine Reihe anderer Optionen.

Nun ja - wenn das nicht "kompliziert" ist. Es gibt eine Suchoption im Dialog nach epub. Die funktioniert aber nicht. Wenn man dann aber über einen Texteditor die Optionen ändert (und tatsächlich andere Voraussetzungen schafft), dann klappt's. Letzteres hat dann aber nichts mehr mit epub zu tun, sondern würde auf alle ähnlichen Dateien zutreffen.karlchen wrote:Mir fehlte der Eintrag "SearchInFiles=*.epub" in der wincmd.ini.
Ohne den sieht der T.C. *.epub nicht als Archive an, die zu durchsuchen sind.
Ich bin zur Zeit mit den ganzen neuen Optionen noch nicht vertraut. Ich hatte sogar im Menü nach etwas mit der Bedeutung von "SearchInFiles" gesucht. Es ist einfach ungünstig, dass so etwas direkt in der .ini editiert werden muss. Das betrifft auch eine Reihe anderer Optionen.
Ist ja kein Problem. Ich wollte nur erklären, warum ich schrieb, was ich schriebkarlchen wrote:Kann ja nicht ahnen, dass ihr schneller mitlest, als ich hier tippen kann.

@ karlchen,
danke für den work around.
Aber vielleicht trotzdem eine Anmerkung: In der Tat macht es wenig Sinn, eine Auswahl EPUB zu haben, wenn diese nur mit bestimmten Ausnahmen funktioniert.
Die EPUB-Suche mit dem Häkchen bei EPUB funktioniert. ABER nur bei HTML-Dateien innerhalb der EPUB-Datei. Der Fehler liegt jedoch nicht in der EPUB-Datei, sondern in der Interpretation von TC, welche Dateien zur Suche innerhalb des EPUB herangezogen werden. XHTML-Dateien werden z. Zt. von TC ignoriert. Darin liegt das Problem. Es sollte jedoch kein Problem darstellen dies zu korrigieren. Eine Beschreibung des Formats und der zulässigen formate innerhalb einer EPUB-Datei kann man bei der IDPF , welche für die EPUB-Definition zuständig ist, nachlesen.
danke für den work around.
Aber vielleicht trotzdem eine Anmerkung: In der Tat macht es wenig Sinn, eine Auswahl EPUB zu haben, wenn diese nur mit bestimmten Ausnahmen funktioniert.
Die EPUB-Suche mit dem Häkchen bei EPUB funktioniert. ABER nur bei HTML-Dateien innerhalb der EPUB-Datei. Der Fehler liegt jedoch nicht in der EPUB-Datei, sondern in der Interpretation von TC, welche Dateien zur Suche innerhalb des EPUB herangezogen werden. XHTML-Dateien werden z. Zt. von TC ignoriert. Darin liegt das Problem. Es sollte jedoch kein Problem darstellen dies zu korrigieren. Eine Beschreibung des Formats und der zulässigen formate innerhalb einer EPUB-Datei kann man bei der IDPF , welche für die EPUB-Definition zuständig ist, nachlesen.
Also bei mir werden xhtml Dateien nicht ignoriert.duck42 wrote:@ karlchen,
danke für den work around.
Aber vielleicht trotzdem eine Anmerkung: In der Tat macht es wenig Sinn, eine Auswahl EPUB zu haben, wenn diese nur mit bestimmten Ausnahmen funktioniert.
Die EPUB-Suche mit dem Häkchen bei EPUB funktioniert. ABER nur bei HTML-Dateien innerhalb der EPUB-Datei. Der Fehler liegt jedoch nicht in der EPUB-Datei, sondern in der Interpretation von TC, welche Dateien zur Suche innerhalb des EPUB herangezogen werden. XHTML-Dateien werden z. Zt. von TC ignoriert. Darin liegt das Problem. Es sollte jedoch kein Problem darstellen dies zu korrigieren. Eine Beschreibung des Formats und der zulässigen formate innerhalb einer EPUB-Datei kann man bei der IDPF , welche für die EPUB-Definition zuständig ist, nachlesen.
Wie man am Testfile aus diesem Thread gut sehen kann.
Die Stelle "Dieses weit größere Gemach" wird in k4.xhtml gefunden !
Hallo, duck42. Hallo, Horst.Epp.
Vorbemerkung:
Samy hat Recht, der von mir eingangs beschriebene, recht umständliche Weg, ging auch schon mit T.C. 8.01.
Samy ging es um die Neuerung im T.C. 8.50, dass Office XML (docx, xlsx, odt usw)+EPUB durchsucht, ohne dass man Klimmzüge machen muß.
Das sollte also so funktionieren, wie der normale Benutzer es erwartet:
+ Suchmaske: *.epub
+ Suchen in Archiven aus
+ Suchtext: "irgend ein Text"
+ Optionen: [X] Office XML (docx, xlsx, odt usw)+EPUB und die Zeichensätze ein
Fertig.
Total Commander 8.50 Verfahren: Office Dokumente ja, Epub nein
Habe es nun mal so wie in der T.C. 8.50 Hilfe beschrieben, probiert. Also SearchInFiles=*.epub wieder raus aus der wincmd.ini.
Die Suche in OfficeXML+EPUB funktioniert nur mit Microsoft Office Dateien, also *.docx, *.xlsx, und Libre Office Dateien, also *.ods und *.odt, aber keineswegs mit *.epub.
Gibt es irgendjemand, bei dem das Auffinden von *.epub mit gesetztem Suchtext in Total Commander 8.50 funktioniert, wie es sollte?
Wenn ja, dann bitte aufklären, was wir falsch machen.
Wenn nein, dann haben wir im Beta und RC Test nicht gut genug getestet.
Grüße
Karl
Vorbemerkung:
Samy hat Recht, der von mir eingangs beschriebene, recht umständliche Weg, ging auch schon mit T.C. 8.01.
Samy ging es um die Neuerung im T.C. 8.50, dass Office XML (docx, xlsx, odt usw)+EPUB durchsucht, ohne dass man Klimmzüge machen muß.
Das sollte also so funktionieren, wie der normale Benutzer es erwartet:
+ Suchmaske: *.epub
+ Suchen in Archiven aus
+ Suchtext: "irgend ein Text"
+ Optionen: [X] Office XML (docx, xlsx, odt usw)+EPUB und die Zeichensätze ein
Fertig.
Total Commander 8.50 Verfahren: Office Dokumente ja, Epub nein
Habe es nun mal so wie in der T.C. 8.50 Hilfe beschrieben, probiert. Also SearchInFiles=*.epub wieder raus aus der wincmd.ini.
Die Suche in OfficeXML+EPUB funktioniert nur mit Microsoft Office Dateien, also *.docx, *.xlsx, und Libre Office Dateien, also *.ods und *.odt, aber keineswegs mit *.epub.
Gibt es irgendjemand, bei dem das Auffinden von *.epub mit gesetztem Suchtext in Total Commander 8.50 funktioniert, wie es sollte?
Wenn ja, dann bitte aufklären, was wir falsch machen.
Wenn nein, dann haben wir im Beta und RC Test nicht gut genug getestet.
Grüße
Karl
Last edited by karlchen on 2014-02-21, 15:13 UTC, edited 1 time in total.
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song