OCR Format mit PDFCreator

Hallo zusammen,

gibt es die Möglichkeit OCR per PDFCreator zu erstellen?

Wir haben ein PDF-A Dokument welches bereits die OCR Fähigkeit besitzt, wenn ich hier nun z.b. eine Seite entfernen und das ganze nochmals über den PDFCreator drucken ist das OCR leider weg.

Hast jemand eine Idee wo hier etwas umgestellt werden muss?

OS: WinXP Sp2

PDF Ver. 0.9.8

 

Mit freundlichen Grüßen

Peter

Jetzt stehe ich auf dem Schlauch.

>Wir haben ein PDF-A Dokument welches bereits die OCR Fähigkeit besitzt, ...

Was meinst du damit? Steht hier OCR für Optical Character Recognition?

Mit der OCR Fähigkeit meine ich das, dass Dokument durchsuchbar ist.

Sprich wir scannen einen Rechnung ein, diese ist anschließend im PDF-A Format und durchsuchbar.

Nun ist hier ausversehen eine Seite dazwischen welche nicht rein sollte, also nehmen wir den PDFCreator und "scheiden" die Seite aus.

Danach ist das Dokumente aber nicht mehr durchsuchbar.

 Sende bitte Beispieldateien an support@pdfforge.org.

Mail ist mit zwei Beispieldokumenten raus!

Konnte das Problem bereits nachgestellt werden?

Antwort ist raus zu Dir.

Hallo, ich habe genau das selbe Problem beim zusammenstellen mehrerer PDF Dateien. Gibt es eine Lösung zu diesem Fall?

Grüße aus Bonn

 

EDIT:

Vielleicht liegt es nicht an PDFCreator. Habe es mit einer anderen Software getestet. Selber Effekt.

Ich muß diesen Thread nochmal auffrischen.

Ich bin vor einiger Zeit zu PDFCreator  gewechselt und habe schon einiges gedruckt. Nun stellte ich (auch) fest, das die mit PDFCreator erstellten Dokumente nicht durchsuchbar sind. Bei mir handelt es sich um pdf die nochmal mit veränderten Einstellungen "gedruckt" werden, um Dateigröße zu minimieren.

Hängt das damit zusammen? Dir ursprünglichen pdf sind durchsuchbar, die neu erstellten hingegen nicht.

ich nutze Vers. 1.02, mit Ghostscript 8.70, Win 7 pro)

Gibt es bis heute eine Lösung für das Problem?

In Dokumenten, welche PDFCreator generiert wurden kann man weder etwas suchen, noch kann man dessen Inhalt kopieren.

Wer es nachvollziehen möchte, öffnet ein Word-Dokument und druckt es mit dem PDFCreator aus. Dann kopiert er den Inhalt zurück in ein Word-Dokument.

Eigentlich möchte ich mit dem PDFCreator mehrere PDF-Dokumente (welche korrekt sind) verbinden. Doch nach dem Verbinden habe ich keine Texterkennung mehr drin. SCHADE

Hallo,

ich habe das Problem auch, was sehr nervig ist, da ich mehrere PDFs eigentlich zusammenführe, um die Informationen danach gebündelt zu haben. Stattdessen steht funktioniert die Suchfunktion danach nicht mehr (Version 1.0.2).

Ist dieses Verhalten denn gewünscht? Ich habe gerade gemerkt, dass es mit der Version 0.9.7 noch funktioniert hat. In der aktuellen Version ist der PDFCreator für mich so gut wie nicht mehr einsetzbar, da bei dessen Benutzung der einfache Zugriff auf die Informationen verloren geht. Und das ist für mich einer der Hauptvorteile von PDFs.

Ist hier ein Bugfix geplant?

Werde ich dann mal testen.

Um es etwas genauer auszuführen:

die pdf, die ich verkleinern möchte, wurden eingescannt und per OCR-Software in durchsuchbare pdf umgewandelt. (ich glaube, mit Abby fine reader o.ä.)

Allerdings war für ordentliche ERgebnisse wohl eine Auflösung von 600dpi nötig. Es sind so Dateien von  > 30 MB entstanden. Die wollte ich halt etwas verleinern - aber danach waren sie eben nicht mehr durchsuchbar. Also warte ich mal auf Vers. 1.1   ;-)

Das hat was mit der eingebetteten Schriftarten zu tun. Ich würde da unbedingt den PDFCreator 1.1.0 testen, der in den nächsten Tagen veröffentlicht wird.

Ich habe gerade versucht, mit der Version 1.2.0 zusammengeführte Dokumente zu durchsuchen.

Ergebnis:

Funktioniert immer noch nicht!