Golem pur

Golem.de ohne Werbung nutzen
Mehrseitige Artikel auf einer Seite lesen
RSS-Volltext-Feed für Artikel
Ab 3,00 € pro Monat

OCR

Textexport aus PDFs auf dem Mac

Weblite hat mit PDF OCR eine Mac-Software im Programm, die Texte aus PDFs in Textdateien exportieren kann. Das Programm verwendet eine optische Zeichenerkennung und kann dadurch auch aus eingescannten Vorlagen Texte extrahieren.

Artikel veröffentlicht am 7. Juni 2010, 8:40 Uhr, Andreas Donath

Der Anwender nutzt PDF OCR per Drag and Drop. Die gewünschte PDF-Datei wird auf die spartanische Programmoberfläche gezogen. Daraufhin fragt ein Einstellungsdialog nur noch ab, in welcher Sprache der Text gehalten ist und ob er ein- oder mehrspaltig angelegt ist. Die Ausgabemöglichkeiten erschöpfen sich in weiche und harte Umbrüche.

Die Erkennungsgenauigkeit schwankt stark und hängt von der Qualität der Vorlage ab, wie bei allen optischen Zeichenerkennungen. Geschützte PDFs kann auch PDF OCR nicht bearbeiten. Die Texterkennung der Software basiert auf Tesseract von Google.

PDF OCR

Neben der vorinstallierten englischsprachigen Textkorrekturdatei lassen sich noch weitere Sprachen herunterladen und installieren, darunter Deutsch. Die neue Version 1.8 von PDF OCR beansprucht im Betrieb weniger Festplattenspeicherplatz, selbst wenn die PDFs sehr umfangreich sind.

PDF OCR von Weblite kann in der kostenlosen Communityfunktion pro Durchlauf nur die erste Seite aus dem PDF extrahieren. Mit Programmen wie PDF Split and Merge lassen sich PDF-Seiten zwar problemlos in einzelne Dateien aufteilen, aber mühsam ist das Prozedere dennoch.

Die kostenpflichtige Variante kostet rund 30 US-Dollar und besitzt keine Beschränkungen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de

ohne Werbung
mit ausgeschaltetem Javascript
mit RSS-Volltext-Feed

Themenseiten:

Kommentarübersicht

Re: *narf* ...

hmmmmmmmm 07. Jun 2010

nur echt mit 32 zähnen :-)

Re: Und Microsoft?

Himmerlarschund... 07. Jun 2010

Ist auch nicht für Optik-Onanisten gedacht, sondern für Leute, die Word-Dateien aus PDFs...

Artikel

Stiftung Warentest

Viele Balkonkraftwerke haben Mängel

Die Stiftung Warentest hat acht Balkonkraftwerke genauer untersucht und kommt zu einem ernüchternden Ergebnis: Nur eine einzige Anlage schneidet im Test gut ab.
Zeichentrickfilm Mars Express

Durchdrehende Roboter und eine hartgesottene Detektivstory

Mars Express verbindet Sci-Fi und Film Noir auf faszinierende Weise. Er zeigt die Zukunft des 23. Jahrhunderts mit Robotern, mit denen sogar der Tod überwunden werden kann.
Eine Rezension von Peter Osteried
Unter Windows

Schwachstelle in Virtualbox verleiht Angreifern Systemrechte

Zwei Forscher haben unabhängig voneinander eine Schwachstelle in Oracles Virtualbox entdeckt. Angreifer können damit auf Windows-Hosts ihre Rechte ausweiten.

Schnäppchen, Rabatte und Top-Angebote

Die besten Deals des Tages

Daily Deals • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]

Themen
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
#