Immer öfter erhält man eine Rechnung nur noch als PDF-Datei, auch Post und Finanzamt verschicken ihre Formulare meist in diesem Format. Gleichzeitig nutzen immer mehr Anwender ihr iPhone oder iPad als Scanner: Ein wichtiger Brief wird einfach abfotografiert und landet im Foto-Archiv, danach kann die Papier-Version entsorgt werden. Aber auch Webseiten und Notizen archiviert man immer öfter als Foto auf dem iPhone.
Will man aber Daten wie Adressen oder Tabellen extrahieren, gibt es schnell Probleme. Manchmal funktioniert das Kopieren in die Zwischenablage, vor allem bei abfotografierten Dokumenten ist dies aber keine Lösung. Hilfe verspricht eine Umwandlung der PDF-Datei in ein Format wie RTF oder DOCX.
Textinhalte zugänglich machen
War ein PDF ursprünglich ein Textdokument und wurde etwa aus Word als PDF exportiert, kann man Textinhalte oft per Copy-und-Paste extrahieren. Bei abfotografierten Texten muss allerdings eine Technologie namens OCR (Optical Character Recognition – Texterkennung) eingesetzt werden. Diese von Scannern bekannte Software versucht, die Buchstaben eines Scans oder abfotografierten Dokuments zu erkennen und wandelt sie in Text um. Einige PDF-Programme betten diesen Text in das PDF-Dokument ein, viele Tools bieten den Export als Word-Dokument an.
Vor einigen Jahren war dazu noch teure Desktop-Software nötig, mittlerweile gibt es gute Open-Source-Lösungen (u. a. von Google) und unter iOS ist eine OCR-Funktion sogar ins System integriert. Diese nutzt etwa das Tool Notizen und macht so Texte in abfotografierten Dokumenten durchsuchbar. Mit iOS 14 wurde diese Funktion weiter verbessert.
Im App Store gibt es zwei Kategorien von Apps mit OCR-Funktion, Notizenverwalter und sogenannte Scanner-Apps.

Apple Notizen – Automatik-OCR
Apples unscheinbarer Notizenverwalter kann Dokumente abfotografieren und verwalten. Ab iOS 13 wird dabei sogar der Inhalt von Dokumenten erfasst, eine OCR-Funktion ist nämlich integriert. Das ist vor allem für die Erschließung per Suchfunktion wichtig: Sucht man nach einem abfotografierten Dokument, bei dem im Text „Einkommensteuer“ vorkam, kann die Suche dieses nämlich nun aufspüren. Dabei geht es aber darum, die Inhalte für Spotlight verfügbar zu machen, nicht um den Export von Inhalten oder Texten.
Ein Export des Textes in einem Textformat ist nicht möglich, nur der Export als PDF-Datei.

Evernote – OCR für die Archivierung
Die Notizen-App Evernote ist für die Verwaltung von Notizen, Fotos, Audiodateien bekannt. Auch eine Dokumentenscanner-Funktion ist integriert, die den Inhalt der Bilddateien ausliest. Diese Funktion ist aber wie bei Notizen für die Erschließung der Dokumente gedacht, man kann die abfotografierten Dokumente etwa nicht als Textdatei oder PDF exportieren. Gut eignet sich die Funktion, um Visitenkarten einzulesen, auch handschriftliche Notizen kann man erfassen. Funktionen wie Visitenkarten-Scan sind allerdings nur mit einem Premium-Abo möglich, das ab 7 Euro pro Monat kostet.

Adobe PDF-Scan – teuer aber hochwertig
Die App von Adobe ist auf das Abfotografieren von Dokumenten spezialisiert, das beherrscht sie auch hervorragend. Über eine integrierte Kamera-Funktion kann man ein Dokument abfotografieren, automatisch beschneiden und aufbessern. Die Besonderheit ist die Unterstützung der sogenannten Adobe Document Cloud. Kostenlos kann man ein GB an Onlinespeicher nutzen und so Hunderte an Dokumenten und Briefen dort verwalten. Diese werden auf dem Adobe-Server ins PDF-Format umgewandelt und automatisch per OCR-Funktion analysiert. Man kann dann den Text per Zwischenablage exportieren – auch von Fotos – und die Dokumente durchsuchen.
Nur zahlende Kunden dürfen allerdings die Dokumente als Word-Datei exportieren. Dafür ist ein optionales Abo, das sogenannte PDF Pack notwendig, das stolze 11,89 Euro pro Monat kostet.

Microsoft Office Lens – gute Ergänzung zu Office 365
Der PDF-Scanner von Microsoft soll offensichtlich die anderen Apps wie Word und One Note ergänzen, die Freeware bietet eine gute Scan-Funktion per Kamera. Das Prinzip ähnelt den Konkurrenten, man kann damit auch gut Visitenkarten, Notizen von Whiteboards und Tafeln digitalisieren. Besonderheit ist die optionale Konvertierung der Fotos in Word, Powerpoint oder PDF-Dateien. Per Cloud-Service kann die Aufnahme nämlich in eine Office-Datei umgewandelt werden. Hat man die iOS-Version von Word auf seinem Gerät, kann man die Datei direkt nach dem Scan in Word oder Power Point öffnen – nach einer kurzen Wartezeit.
Die Qualität der OCR-Funktion ist in der Praxis nicht ganz perfekt, mit einem echten Dokumentenscanner mit OCR-Software sind bessere Ergebnisse möglich.

Prizmo 5 – Export als Doc
Prizmo ist nicht ganz unbekannt, vor elf Jahren erschien sie erstmals als Mac-App. Gleich zwischen zwei OCR-Engines kann man bei der App Prizmo auswählen. Die Aufnahmen der Scan-App werden wahlweise über Apple systemeigene OCR-Engine oder einen Cloud-Dienst analysiert. Für die uneingeschränkte Nutzung zahlt man einmalig 20 Euro, die Nutzung der Cloud-Engine setzt allerdings ein Abo voraus. Letztere soll auch handschriftliche Notizen unterstützen. Hier zahlt man pro Jahr 15 bzw. 50 Euro für jeweils 50 bzw. 500 Anfragen pro Monat.
Auf Wunsch kann ein gescanntes Dokument als Word-Dokument exportiert werden. In einem Kurztest mit Wahl der Apple-Engine waren die Ergebnisse aber eher mäßig.

Abby Dokumenten Scanner – interessante Buch-Optionen
Einen guten Ruf hat der Hersteller Abby für seine Desktop-Software, auch für das iPhone gibt es mehrere Apps. Export von Dokumenten als Word-Dokument bietet die App Dokumenten Scanner, die dank dem „Abby Neurales Netzwerk“ besonders hochwertige Ergebnisse liefern soll. Auch hier scannt man Dokumente per Kamera-App, der Scan von Büchern wird unterstützt. Die beiden Buchseiten organisiert die App dann separat, bis zu hundert Seiten pro Dokument werden unterstützt.
Will man mehr als fünf Seiten scannen, wird allerdings ein Abo mit 23 Euro Jahresgebühr fällig. Etwas verwirrend ist allerdings, dass der Hersteller eine ganze Serie ähnlicher Apps im App Store anbietet.

DocOCR – solide und günstig
Eine günstige aber solide Lösung ist DocOCR von iFunplay. Die App bietet die üblichen Aufnahmefunktionen per Kamera-App, nach der Aufnahme gibt es einige Optionen für Beschnitt und Bildbearbeitung. Ein Export als Word-Dokument oder PDF ist wahlweise möglich, zahlreiche Webspeicher werden unterstützt.
Die App kann kostenlos getestet werden, die Pro-Version kostet 5,49 Euro. Ungewöhnlich ist auch eine integrierte Fax-Funktion für den Versand per Internet-Fax, diese bezahlt man per In-App-Kauf. Ähnlich wie bei Abby gibt es vom Hersteller insgesamt fünf Scanner-Apps mit ähnlichem Funktionsumfang wie DocScan, FasterScan usw.