Ist das mit xPDFSearch oder generell möglich ...

German support forum

Moderators: Hacker, Stefan2, white

Post Reply
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Ist das mit xPDFSearch oder generell möglich ...

Post by *truecolor »

Hallo,

ich habe hier eine Menge PDF-Dokumente, die aus reinen Bilddaten bestehen (eben als JPG eingescannte Dokumente).
Diese sind leider mit solchen PDF´s, die Text enthalten, zusammen in die gleichen Ordner abgelegt worden.

Jetzt hab ich die leidliche Aufgabe, diese wieder voneinander getrennt zu sortieren, damit die "Text-PDF´s" mittels dtSearch indexiert werden können.

Bei 50.000 PDF´s eine 100%ige Sisyphusarbeit.

Wie kann ich TC dazu bewegen, zumindest die Bild-PDF´s zu markieren oder zumindest umzubenennen, damit ich die "hochwertigeren" Text-PDF´s weiter nutzen kann.

Gruß ... truecolor
User avatar
Lefteous
Power Member
Power Member
Posts: 9537
Joined: 2003-02-09, 01:18 UTC
Location: Germany
Contact:

Post by *Lefteous »

Es ist halt die Frage wie man die Regel fur die Unterscheidung definiert. Ein "Enthält Text"-Feld gibt es derzeit nicht. Es einzubauen aber kein Problem. Wäre die Aufgabe aus deiner Sicht damit lösbar?
User avatar
norfie²
Power Member
Power Member
Posts: 1038
Joined: 2006-02-10, 07:27 UTC

Post by *norfie² »

Es ist wie so oft: man braucht fuer Sortieraufgaben ein ordentliches Kriterium. Mehrere Moeglichkeiten bieten mit xPdfsearch sich an: Suche nach Text mit einem Leerzeichen. Meist lassen sich PDF-Dateien auch nach "Ersteller" gut sortieren - es kommt dann darauf an, wie die gescannten PDFs erstellt worden sind.
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

@Lefteous:
... Ein "Enthält Text"-Feld gibt es derzeit nicht. Es einzubauen aber kein Problem. Wäre die Aufgabe aus deiner Sicht damit lösbar?
Dazu müßte ich ja trotzdem jedes PDF öffnen (um zu schauen, ob Text oder Grafik).
Sollte ich es geschafft haben beide voneinander zu trennen, würde ich über den Dateinamen eindeutige Bezeichnungen vergeben.


@norfie²
Es ist wie so oft: man braucht fuer Sortieraufgaben ein ordentliches Kriterium. Mehrere Moeglichkeiten bieten mit xPdfsearch sich an: Suche nach Text mit einem Leerzeichen. Meist lassen sich PDF-Dateien auch nach "Ersteller" gut sortieren - es kommt dann darauf an, wie die gescannten PDFs erstellt worden sind.
Der Ansatz scheint mir brauchbar ... (natürlich mit der Voraussetzung, das fälschliche Leerzeichen in den Bilder-PDF´s ignoriert werden).

Dann werde ich mir mal xPDFSearch näher anschauen.

Ich gebe bei Ergebnis Rückmeldung ... ist ja für andere evtl. auch interessant ...
Last edited by truecolor on 2011-02-21, 11:42 UTC, edited 1 time in total.
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

Hier die Rückmeldung:

Hab in den Testordner PDF/IN 100 gemischte PDF´s rein kopiert.

xPDFSearch installiert und im TC-Suchfenster nach Text " " suchen lassen ... und habe exakt die Text-PDF´s angezeigt bekommen.

norfie²´s Methode scheint somit super zu funktionieren.


@Lefteous: mit Deinem Plugin xPDFSearch kann ich mir zwar mit norfie² Filteridee alle PDF´s anzeigen lassen, die ein Leerzeichen enthalten ... wie kann ich aber diese Dateiauswahl weiter bearbeiten (z.B. pipen zum MUT)?

Gruß ... truecolor
User avatar
norfie²
Power Member
Power Member
Posts: 1038
Joined: 2006-02-10, 07:27 UTC

Post by *norfie² »

Im Suchen-Dialog nach Finden der Dateien den Button "Anwenden" benutzen, mit STRG+A alles markieren, mit STRG+M MUT starten.

BTW: Bitte fuer Apostroph auch das Apostroph statt Akzent Akut verwenden. Zudem sind all Deine Apostrophe mehr als ueberfluessig und werden gern auch als Deppenapostroph tituliert.
Last edited by norfie² on 2011-02-21, 10:09 UTC, edited 1 time in total.
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

Ich Blindfisch :oops: ... steht bestimmt irgendwo erklärt ... hab mich schon ewig geärgert, dass ich im TC nach einer Dateisuche nix mit den Ergebnissen anfangen konnte (ausser auf eines draufklicken).

So macht es ja richtig Spass :D :D :D

Klasse, klasse, klasse !!!

Erfolgsmeldungen kommen weiter ... :wink:
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

So,

Operation "Bad-PDF" :wink: ist so gut wie abgeschlossen.
  • * Mit xPDFSearch alle PDF´s gesucht, die kein Leerzeichen enthalten.

    * Mit dem Menüpunkt Anwenden zum MUT gepiped.

    * Dort alle Dateienendungen in pdfx umbenannt.

    * Mit Robocopy (YARG-GUI .. sorry, damit geht´s einfach besser) in einem seperaten Ordner eine gespiegelte Verzeichnisstruktur erstellt die die pdfx-Dateien dort einsortieren lassen.

    * In MUT alle pdfx-Endungen wieder in pdf umbenannt.
Somit wurden alle PDF´s schön getrennt in PDF/Text- und PDF/Grafik-Verzeichnisse einsortiert.
User avatar
Dalai
Power Member
Power Member
Posts: 9990
Joined: 2005-01-28, 22:17 UTC
Location: Meiningen (Südthüringen)

Post by *Dalai »

truecolor wrote:* Mit Robocopy (YARG-GUI .. sorry, damit geht´s einfach besser) in einem seperaten Ordner eine gespiegelte Verzeichnisstruktur erstellt die die pdfx-Dateien dort einsortieren lassen.
Das hättest du auch mit dem TC hinbekommen: F5 und "*.pdfx" in das Eingabefeld "Nur Dateien dieses Typs" eingeben. Alternativ kann man TreeCopyPlus verwenden.

MfG Dalai
#101164 Personal licence
Ryzen 5 2600, 16 GiB RAM, ASUS Prime X370-A, Win7 x64

Plugins: Services2, Startups, CertificateInfo, SignatureInfo, LineBreakInfo - Download-Mirror
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

Kann TreeCopyPlus aus einem Verzeichnis mit beliebigen Verz.-Tiefen die Verz.-Struktur ohne Inhalte auf einem anderen Laufwerk erzeugen?

Quasi die Verz.-Struktur spiegeln.


Hab die Funktion im TC nicht gefunden.
User avatar
norfie²
Power Member
Power Member
Posts: 1038
Joined: 2006-02-10, 07:27 UTC

Post by *norfie² »

Quasi die Verz.-Struktur spiegeln. Hab die Funktion im TC nicht gefunden.
Die Funktion kann man nicht finden. Einfach F5 druecken, in den sich oeffnenden Dialog in "Nur Dateien dieses Typs" "irgendwelchen_groben_Unsinn" eingeben, Button "OK". Somit wird eine Verzeichnisstruktur mit dem TCmd gespiegelt.
"War is evil, in so far as it makes more bad people than it takes away."
Immanuel Kant in "Perpetual Peace"
User avatar
truecolor
Junior Member
Junior Member
Posts: 76
Joined: 2010-02-18, 14:30 UTC
Location: Raum HD (BaWü)

Post by *truecolor »

norfie² wrote:...Einfach F5 druecken, in den sich oeffnenden Dialog in "Nur Dateien dieses Typs" "irgendwelchen_groben_Unsinn" eingeben, Button "OK". Somit wird eine Verzeichnisstruktur mit dem TCmd gespiegelt.
Bin grad ein bissel beeindruckt, was man mit TC alles anstellen kann :o :D

Gruß ... truecolor
Post Reply