1047868

PDF-Werkzeuge: günstig und effektiv

14.04.2011 | 10:00 Uhr |

Acrobat Pro bietet in Sachen PDF zwar eine Rundumversorgung, ist jedoch teuer. Viele Dinge rund um PDF-Dokumente lassen sich preiswerter oder kostenlos mit Bordmitteln erledigen. Unser Ratgeber zeigt, was alternative PDF-Werkzeuge leisten.

PDF Clerk
Vergrößern PDF Clerk

PDF-Dateien haben den Vorteil, dass sie sich unverändert unter jedem Betriebssystem darstellen lassen, entweder mithilfe eines kostenlosen Programms wie Adobe Reader oder wie bei Mac-OS X mit Vorschau . Mac-OS X bietet zudem einen weiteren Vorteil: Ohne jegliche Zusatzsoftware kann man aus jedem beliebigen Dokument ein PDF erzeugen. Dazu muss man nur den Druckbefehl aufrufen und links unten im Dialogfenster den Punkt "Als PDF sichern" auswählen. Manche Programme bieten außerdem direkt im Menü "Ablage" einen Befehl zum Speichern als PDF, zum Beispiel Textedit oder Nisus Writer. Oder man kann ein PDF über den Befehl "Sichern unter" (Word) oder "Exportieren" (Pages) erstellen. Bei dieser Konvertierung arbeiten im Hintergrund ebenfalls die Funktionen von Mac-OS X .

Scannen und Texterkennung

Um aus einem gedruckten Dokument ein PDF zu erzeugen, scannt man es ein. Das lässt sich über den Befehl "Ablage > Aus Scanner importieren" in Vorschau erledigen, wenn man als Dateiformat "PDF" angibt. Diese PDF-Dateien haben jedoch den Nachteil: Der Inhalt ist ein Bild. Man kann also nicht auf den Text zugreifen oder ihn durchsuchen, wie das der Fall ist, wenn man ein PDF "druckt" oder aus einer Textverarbeitung exportiert. Um den Text les- und durchsuchbar zu machen, benötigt man eine Funktion zur Texterkennung (" OCR "). Wichtig ist, dass man die Dokumente mit mindestens 300 dpi einscannt, denn je höher die Auflösung ist, desto besser ist die Erkennung. Mehr als 600 dpi sind aber nicht notwendig.

PDF Pen verfügt über eine eingebaute OCR-Funktion. Zum Scannen verwendet das Programm dieselbe Scanfunktion, wie sie auch in Vorschau verfügbar ist. Der erkannte Text wird dem PDF hinterlegt, zu sehen ist weiterhin das eingescannte Bild der Datei. Auch wenn die Erkennungsqualität nicht an diejenige von Acrobat Pro heranreicht, ist sie in vielen Fällen ausreichend, um das Dokument zu durchsuchen. Exportiert man den Text in eine Textverarbeitung, sind Nacharbeiten erforderlich. Auch PDF Studio verfügt über einen Scanbefehl, der aber nur Scanner mit Twain-Unterstützung erkennt. Eine OCR-Funktion gibt es nicht.

Hat man nur bescheidene Ansprüche an den erkannten Text, kann man das kostenlose Programm PDF OCR verwenden. Es verarbeitet nur einseitige PDF-Dateien mit mäßiger Erkennungsqualität, zum Durchsuchen des PDF ist es aber häufig ausreichend. Um andere Sprachen als Englisch zu verarbeiten, müssen (kostenlose) Sprachpakete installiert werden. Eine kostenpflichtige Variante des Programms verarbeitet auch mehrseitige Dateien. Auch OCR Kit ist nur für das Hinterlegen des Textes zu gebrauchen, da die Erkennungsqualität nicht sehr gut ist. Zudem kommt das Programm nicht mit Textspalten zurecht, so dass der Text zeilenweise und nicht spaltenweise gelesen wird. Um gute Ergebnisse bei der Texterkennung zu erzielen, verwendet man ein Programm wie Abbyy Finereader Express. Es bietet eine gute Texterkennung und kann den Text dem PDF hinterlegen oder das PDF in ein RTF-Dokument (inklusive Bilder) umwandeln.

0 Kommentare zu diesem Artikel
1047868