1035722

Texte aus mehreren PDFs extrahieren

26.01.2011 | 09:50 Uhr |

Mit einem in Automator erstellten Dienst Text aus PDFs kopieren.

Automator - Abstract Logo Icon
Vergrößern Automator - Abstract Logo Icon

In PDF-Dateien, die durchsuchbaren Text enthalten, kann man in Vorschau den Text markieren, kopieren und dann in ein Textdokument einfügen. Muss man diese Arbeit aber häufig und mit mehreren PDFs durchführen, ist das etwas umständlich.

Mit einem in Automator erstellten Dienst lassen sich Texte aus PDF-Dokumenten extrahieren und in ein Textdokument einsetzen.
Vergrößern Mit einem in Automator erstellten Dienst lassen sich Texte aus PDF-Dokumenten extrahieren und in ein Textdokument einsetzen.

Man kann in Automator einen Dienst erstellen, der sich im Finder über das Kontextmenü aufrufen lässt und dann den Text aus einem markierten PDF in eine Textdatei kopiert, ohne dass man das PDF dazu öffnen muss. Man startet den Automator und wählt „Dienst" als Arbeitsablauf aus. Nun stellt man zuerst rechts oben im Fenster die beiden Aufklappmenüs auf „ PDF-Dateien " und „ Finder " ein. Dann wählt man „PDFs" in der Bibliotheksliste aus und klickt doppelt auf „PDF-Text extrahieren". Dadurch wird diese Aktion im rechten Teil des Fensters eingefügt. Dort legt man nun fest, ob der Text als reiner oder als formatierter Text gesichert werden soll. Um einen bestimmten Ordner als Ziel für die Texte festzulegen, wählt man „Neue Variable" im Aufklappmenü für das Zielverzeichnis aus, wählt über „Andere" den gewünschten Ordner aus und benennt die Variable. Wählt man nur einen Ordner aus, ignoriert dies der Dienst und speichert die Texte einfach auf dem Schreibtisch. Abschließend sichert man den Dienst, benennt ihn und kann ihn dann im Finder aus dem Kontextmenü oder aus dem Kontextmenü aufrufen, wenn ein PDF markiert ist. Das Extrahieren des Textes funktioniert aber nur, wenn das PDF einen durchsuchbaren Text enthält.

0 Kommentare zu diesem Artikel
1035722