Wie mache ich aus einer PDF-Bilddatei eine durchsuchbare PDF?


#1

Hallo Zusammen,

Ich habe mehrere PDFs, die durch unseren Scanner als reine Bilddatei abgelegt wurden. Ich möchte diese nun durchsuchbar machen. Leider gibt die Hilfe zu diesem Wunsch/Stichwort nichts her.
Versuche dies über das OCR zu machen brachten grausige Ergebnisse in der Erkennung und Bildverstümmelung.

Gibt es hier einen Weg, den ich nicht entdeckt habe? Versteckt es sich irgendwo hinter den ganzen Konvertierungen zu PDF/A? Dort werden 8 Typen angeboten zu denen keinerlei Erklärung vorhanden ist. Auch in der Hilfe findet sich leider keine Erklärung.
Sorry, ich bin normaler Nutzer, kein “Teckie”.

VG
sollistico GmbH


#2

Hallo,

OCR ist tatsächlich die einzige Möglichkeit, aus Bildern durchsuchbaren Text zu extrahieren.
Hierbei ist die Qualität des Ergebnisses extrem abhängig vom Ausgangsmaterial und den verwendeten Einstellungen. Oftmals hilft es, die zu erkennenden Textblöcke manuell zu markieren bzw. diejenigen Bildblöcke zu markieren, welche als Bild übernommen werden sollen(siehe Handbuck->OCR-Modul->manuell).

Beste Grüße

Robin