OCR Umwandlung per batch


#1

Mahlzeit!

Ich möchte alle PDFs in einem Verzeichniss per OCR in durchsuchbare PDFs umwandeln.
Wenn möglich über einen Batchaufruf. Es gibt ja einen haufen an Commando Zeilen Parameter,
aber irgenwie funktioniert das nicht. Ich schaffe es eine PDF mit dem Architekt.exe zu öffnen, es startet dann auch die OCR Erkennung, aber das Biest speichert das Dokument dann nicht ab. Was mache ich falsch? Der Support sagt Command Parameter sind in der Version nicht unterstürtzt.

Ich hatte mir das irgendwie so vorgestellt:

architect.exe" --recognize-text c:\temp\scan.pdf --destination-dir c:\fertig

Vielleicht hat einer von euch das ja schon mal irgendwie hinbekommen.

Gruß

Michael


#2

Hallo Michael,

ich habe es einmal ausprobiert, folgender Aufruf hat funktioniert:
architect.exe --pdf-tools --recognize --source-dir “Quelle” --use-ocr --destination-dir “Ziel”.
Wobei es hier Probleme mit Anführungszeichen gab, diese bitte nur verwenden wenn der Pfad ein Leerzeichen enthält.

Beste Grüße

Robin


#3

Ja, geiler Scheiß. Das ist genau so wie ich es brauche.
Mit dem Support habe ich bestimmt 3 oder 4 mal hin und her geschrieben.
Die haben dann gesagt, das geht in der Verion nicht. Und dabei ist da ein mega-geiles Feature.
Ich möchte das nun in einer Schleife laufen lassen, und somit ein Verzeichnis auf dem Server “überwachen”
Alle neuen Dateien werden automatisch umgewandelt.
Dann erkennt unser Such-Server das neue Dokument und indiziert es.
Andere PDF-Tools können das auch, aber da muß man dann eine teure “Server-Version” kaufen, wenn man so was machen will.

You are the man!

Vielen Dank!

Gruß und Hut ab

Michael