EPUB-Suche fehlerhaft...

German support forum

Moderators: Hacker, Stefan2, white

samy
Junior Member
Junior Member
Posts: 10
Joined: 2010-12-22, 17:27 UTC

Post by *samy »

Horst.Epp wrote:
duck42 wrote:@ karlchen,
danke für den work around.

Aber vielleicht trotzdem eine Anmerkung: In der Tat macht es wenig Sinn, eine Auswahl EPUB zu haben, wenn diese nur mit bestimmten Ausnahmen funktioniert.

Die EPUB-Suche mit dem Häkchen bei EPUB funktioniert. ABER nur bei HTML-Dateien innerhalb der EPUB-Datei. Der Fehler liegt jedoch nicht in der EPUB-Datei, sondern in der Interpretation von TC, welche Dateien zur Suche innerhalb des EPUB herangezogen werden. XHTML-Dateien werden z. Zt. von TC ignoriert. Darin liegt das Problem. Es sollte jedoch kein Problem darstellen dies zu korrigieren. Eine Beschreibung des Formats und der zulässigen formate innerhalb einer EPUB-Datei kann man bei der IDPF , welche für die EPUB-Definition zuständig ist, nachlesen.
Also bei mir werden xhtml Dateien nicht ignoriert.
Wie man am Testfile aus diesem Thread gut sehen kann.
Die Stelle "Dieses weit größere Gemach" wird in k4.xhtml gefunden !
Nein. Bei mir wird es nicht gefunden. Selbst mit "Archive durchsuchen nicht.
Ich hab die wincmd.ini nicht editiert. Das kann auch nicht der Sinn der Sache sein. Da ist und bleibt ein BUG.
duck42
Junior Member
Junior Member
Posts: 21
Joined: 2013-03-23, 12:48 UTC
Location: Germany

Post by *duck42 »

Hallo karlchen,
Ja, wenn du, wie ich in dem Vorpost beschrieben habe, ein epub mit html-Dateien statt xhtml-Dateien benutzt.

Ich schau mal nach ob ich bei mir eine finde, die ich zur Verfügung stellen kann.

Edit:
Datei
http://manual.calibre-ebook.com/calibre.epub

Suchtext:
python imports
Last edited by duck42 on 2014-02-21, 15:29 UTC, edited 1 time in total.
User avatar
karlchen
Power Member
Power Member
Posts: 4605
Joined: 2003-02-06, 22:23 UTC
Location: Germany

Post by *karlchen »

Hallo, duck42.

Stimmt, die zum Testen benutzte epub Datei verwendet intern xhtml Dateien. Ich könnte das ja mal probeweise ändern, nur um zu sehen, ob das Suchen in der epub Datei dann klappt. .... Ja, tut es. .... Kann natürlich wieder nicht Sinn und Zweck der Übung sein. Also doch unzureichend getestet und einen Fehler übersehen.

Karl
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
samy
Junior Member
Junior Member
Posts: 10
Joined: 2010-12-22, 17:27 UTC

Post by *samy »

karlchen wrote:Hallo, duck42.

Stimmt, die zum Testen benutzte epub Datei verwendet intern xhtml Dateien. Ich könnte das ja mal probeweise ändern, nur um zu sehen, ob das Suchen in der epub Datei dann klappt.

Karl
Also ich hab bei der Beispieldatei "k4.xthml" in "k4.html" umbenannt. In dieser Datei kommt der Text vor. TC findet trotzdem nichts.
User avatar
Horst.Epp
Power Member
Power Member
Posts: 6985
Joined: 2003-02-06, 17:36 UTC
Location: Germany

Post by *Horst.Epp »

samy wrote:
Horst.Epp wrote:
duck42 wrote:@ karlchen,
danke für den work around.

Aber vielleicht trotzdem eine Anmerkung: In der Tat macht es wenig Sinn, eine Auswahl EPUB zu haben, wenn diese nur mit bestimmten Ausnahmen funktioniert.

Die EPUB-Suche mit dem Häkchen bei EPUB funktioniert. ABER nur bei HTML-Dateien innerhalb der EPUB-Datei. Der Fehler liegt jedoch nicht in der EPUB-Datei, sondern in der Interpretation von TC, welche Dateien zur Suche innerhalb des EPUB herangezogen werden. XHTML-Dateien werden z. Zt. von TC ignoriert. Darin liegt das Problem. Es sollte jedoch kein Problem darstellen dies zu korrigieren. Eine Beschreibung des Formats und der zulässigen formate innerhalb einer EPUB-Datei kann man bei der IDPF , welche für die EPUB-Definition zuständig ist, nachlesen.
Also bei mir werden xhtml Dateien nicht ignoriert.
Wie man am Testfile aus diesem Thread gut sehen kann.
Die Stelle "Dieses weit größere Gemach" wird in k4.xhtml gefunden !
Nein. Bei mir wird es nicht gefunden. Selbst mit "Archive durchsuchen nicht.
Ich hab die wincmd.ini nicht editiert. Das kann auch nicht der Sinn der Sache sein. Da ist und bleibt ein BUG.
Sorry, wo ist da der Bug ?
Ich habe ausser dem Eintrag fuer SearchInFiles nichts geaendert und die gesuchten Stellen werden im xhtml gefunden.
Natürlich muss Suchen in Archiven angehakt sein, da es sich num mal um solche handelt.
Wenn dir das Editieren einer Ini-File zu viel ist, dann musst du halt beim Explorer bleiben.
Da findest du aber in EPUBs gar nichts, da es keine IFilter für epub gibt.
duck42
Junior Member
Junior Member
Posts: 21
Joined: 2013-03-23, 12:48 UTC
Location: Germany

Post by *duck42 »

Samy,
das sollte richtig sein, da der DOCTYPE der Datei trotzdem immer noch laut interner Beschreibung xhtml ist.
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 50581
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Post by *ghisler(Author) »

Das Problem tritt auf, wenn der Text durch Tags (z.B. Fettschrift), Umbrüche o.ä. unterbrochen wird. Leider habe ich da noch keine Lösung gefunden. Die Suche nach einzelnen Wörtern sollte aber funktionieren - die Formatierung ändert sich in der Regel nicht innerhalb eines Wortes.
Author of Total Commander
https://www.ghisler.com
duck42
Junior Member
Junior Member
Posts: 21
Joined: 2013-03-23, 12:48 UTC
Location: Germany

Post by *duck42 »

Hallo Herr Ghisler,
dies kann ich leider nicht bestätigen. Ich habe es zur Sicherheit nochmals ausprobiert. Wenn Sie die Datei einmal als epub und einmal umbenannt in *.zip in ein Verzeichnis speichern und dann die Suche machen, werden nur Ergebnisse in der Zip-Datei gezeigt. Vorausgesetzt, sie haben den work around nicht vorgenommen.[/img]
Last edited by duck42 on 2014-02-21, 15:46 UTC, edited 1 time in total.
samy
Junior Member
Junior Member
Posts: 10
Joined: 2010-12-22, 17:27 UTC

Post by *samy »

ghisler(Author) wrote:Das Problem tritt auf, wenn der Text durch Tags (z.B. Fettschrift), Umbrüche o.ä. unterbrochen wird. Leider habe ich da noch keine Lösung gefunden. Die Suche nach einzelnen Wörtern sollte aber funktionieren - die Formatierung ändert sich in der Regel nicht innerhalb eines Wortes.

Nö. XHTML alleine reicht:

Code: Select all

  <p>Dieses weit größere Gemach war reichlich mit Bastmatten ausgestattet, auch die nackten Steinwände mit solchen verkleidet. Einen Luxus wie Teppiche und Kissen kannten diese Nonnen, welche es mit der Weltentsagung noch ernst nahmen, nicht, und außer niedrigen Tischchen besitzt der Abessinier überhaupt keine Möbel.</p>
User avatar
karlchen
Power Member
Power Member
Posts: 4605
Joined: 2003-02-06, 22:23 UTC
Location: Germany

Post by *karlchen »

Hallo, Samy.

Habe die ganze Zeit zum Testen diese Datei verwendet.

Habe alle xhtml Dateien im Ordner "Text" in html umbenannt. Danach die Such-Vorgänge im Total Commander 8.50 erneut durchgeführt, ohne den anfangs geposteten krummen Workaround.

Ergebnis:
Alle vorhandenen Suchstrings, die ich mir vorher mal manuell rausgesucht hatte, hat T.C. 8.50 gefunden und mir stets den korrekten Dateinamen mit Pfad zurückgeliefert.

Gegenprobe:
Um sicherzustellen, dass er jetzt nicht einfach alles findet, auch nicht vorhandene Suchstrings, habe ich mal Suchtexte verwendet, die es in dem Epub Dokument nicht gibt. Da kam dann die Suche korrekt leer zurück.

Den Namen der nicht manipulierten Originaldatei hat T.C. 8.50 mir nie geliefert. Der Fehler scheint daher wirklich zu sein, wie duck42 schrieb, dass T.C. 8.50 in epub Dateien xhtml Dateien ignoriert.

Ob es noch weitere Fehlerkonstellationen gibt, wage ich nicht zu beurteilen.

Grüße
Karl
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
User avatar
karlchen
Power Member
Power Member
Posts: 4605
Joined: 2003-02-06, 22:23 UTC
Location: Germany

Post by *karlchen »

Hallo, Christian.

Einer meiner Suchbegriffe ist "Erlebnisse". Der wird nur in der von mir manipulierten Kopie der epub Datei gefunden, in der die xhtml Dateien nun html Dateien sind.
Die Mehrwort-Suchtexte werden in der manipulierten epub Datei gefunden.
Wahrscheinlich weil ich die vorher mittels Viewer rausgefischt hatte und dabei keine Zeilenumbrüche und Formatierungszeichen mit einbezogen.

Grüße,
Karl
Last edited by karlchen on 2014-02-21, 17:04 UTC, edited 1 time in total.
MX Linux 21.3 64-bit xfce, Total Commander 11.50 64-bit
The people of Alderaan keep on bravely fighting back the clone warriors sent out by the unscrupulous Sith Lord Palpatine.
The Prophet's Song
duck42
Junior Member
Junior Member
Posts: 21
Joined: 2013-03-23, 12:48 UTC
Location: Germany

Post by *duck42 »

Ob es noch weitere Kombinationen gibt, wird davon abhängen, wie die Suche implementiert wurde. Wie Herr Ghisler bemerkte, wird dieses Problem auch bei Formatierungen, Trennungen und den verschiedenen Tags usw. auftreten, falls man nach mehr als einem Wort sucht. Bei Umlauten sollte es nicht auftreten, falls man im richtigen Zeichencode sucht (UTF-8 )
User avatar
ghisler(Author)
Site Admin
Site Admin
Posts: 50581
Joined: 2003-02-04, 09:46 UTC
Location: Switzerland
Contact:

Post by *ghisler(Author) »

Stimmt, TC sucht z.Zt. nur in html-Dateien, nicht in solchen mit Endung xhtml - mir sind schlicht noch keine EPUB-Dateien begegnet mit dieser Dateiendung. Ich nehme es auf meine Wunschliste.
Author of Total Commander
https://www.ghisler.com
User avatar
Horst.Epp
Power Member
Power Member
Posts: 6985
Joined: 2003-02-06, 17:36 UTC
Location: Germany

Post by *Horst.Epp »

karlchen wrote:Hallo, Samy.

Habe die ganze Zeit zum Testen diese Datei verwendet.
...
Den Namen der nicht manipulierten Originaldatei hat T.C. 8.50 mir nie geliefert. Der Fehler scheint daher wirklich zu sein, wie duck42 schrieb, dass T.C. 8.50 in epub Dateien xhtml Dateien ignoriert.

Ob es noch weitere Fehlerkonstellationen gibt, wage ich nicht zu beurteilen.

Grüße
Karl
Und warum findet er bei mir die Stellen in den Original XHTML Dateien ?
TC 8.50 x64.
In der Suche keine Dateimasken angegeben
UTF8 und Suchen in Archiven angehakt.
Das reicht um den gewünschten Satz zu finden.
User avatar
Dalai
Power Member
Power Member
Posts: 9976
Joined: 2005-01-28, 22:17 UTC
Location: Meiningen (Südthüringen)

Post by *Dalai »

@Horst.Epp: Du benutzt SearchInFiles (und suchst nach *.* statt *.epub), das ist etwas völlig anderes als die Suche in Epub-Dateien.

---

Ich kann das Problem bzgl. html/xhtml-Dateien bestätigen. Nur html wird gefunden, xhtml nicht.

MfG Dalai
#101164 Personal licence
Ryzen 5 2600, 16 GiB RAM, ASUS Prime X370-A, Win7 x64

Plugins: Services2, Startups, CertificateInfo, SignatureInfo, LineBreakInfo - Download-Mirror
Post Reply