OCR

Textexport aus PDFs auf dem Mac

Weblite hat mit PDF OCR eine Mac-Software im Programm, die Texte aus PDFs in Textdateien exportieren kann. Das Programm verwendet eine optische Zeichenerkennung und kann dadurch auch aus eingescannten Vorlagen Texte extrahieren.

Artikel veröffentlicht am ,
OCR: Textexport aus PDFs auf dem Mac

Der Anwender nutzt PDF OCR per Drag and Drop. Die gewünschte PDF-Datei wird auf die spartanische Programmoberfläche gezogen. Daraufhin fragt ein Einstellungsdialog nur noch ab, in welcher Sprache der Text gehalten ist und ob er ein- oder mehrspaltig angelegt ist. Die Ausgabemöglichkeiten erschöpfen sich in weiche und harte Umbrüche.

Die Erkennungsgenauigkeit schwankt stark und hängt von der Qualität der Vorlage ab, wie bei allen optischen Zeichenerkennungen. Geschützte PDFs kann auch PDF OCR nicht bearbeiten. Die Texterkennung der Software basiert auf Tesseract von Google.

  • PDF OCR
PDF OCR

Neben der vorinstallierten englischsprachigen Textkorrekturdatei lassen sich noch weitere Sprachen herunterladen und installieren, darunter Deutsch. Die neue Version 1.8 von PDF OCR beansprucht im Betrieb weniger Festplattenspeicherplatz, selbst wenn die PDFs sehr umfangreich sind.

PDF OCR von Weblite kann in der kostenlosen Communityfunktion pro Durchlauf nur die erste Seite aus dem PDF extrahieren. Mit Programmen wie PDF Split and Merge lassen sich PDF-Seiten zwar problemlos in einzelne Dateien aufteilen, aber mühsam ist das Prozedere dennoch.

Die kostenpflichtige Variante kostet rund 30 US-Dollar und besitzt keine Beschränkungen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Headspace XR ausprobiert
Headset auf und Kopf aus

Die Entwickler der Meditations-App gehen gen VR. Wir haben getestet, ob die App wirklich für Entspannung vom Homeoffice- oder Büro-Stress sorgt.
Ein Test von Daniel Ziegener

Headspace XR ausprobiert: Headset auf und Kopf aus
Artikel
  1. Stiftung Warentest: Viele Balkonkraftwerke haben Mängel
    Stiftung Warentest
    Viele Balkonkraftwerke haben Mängel

    Die Stiftung Warentest hat acht Balkonkraftwerke genauer untersucht und kommt zu einem ernüchternden Ergebnis: Nur eine einzige Anlage schneidet im Test gut ab.

  2. Zeichentrickfilm Mars Express: Durchdrehende Roboter und eine hartgesottene Detektivstory
    Zeichentrickfilm Mars Express
    Durchdrehende Roboter und eine hartgesottene Detektivstory

    Mars Express verbindet Sci-Fi und Film Noir auf faszinierende Weise. Er zeigt die Zukunft des 23. Jahrhunderts mit Robotern, mit denen sogar der Tod überwunden werden kann.
    Eine Rezension von Peter Osteried

  3. Unter Windows: Schwachstelle in Virtualbox verleiht Angreifern Systemrechte
    Unter Windows
    Schwachstelle in Virtualbox verleiht Angreifern Systemrechte

    Zwei Forscher haben unabhängig voneinander eine Schwachstelle in Oracles Virtualbox entdeckt. Angreifer können damit auf Windows-Hosts ihre Rechte ausweiten.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gigabyte GeForce RTX 4070 Ti zum Tiefstpreis • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Anker USB-Ladegeräte -45% • OLED-TV von LG 54% günstiger • Gamesplanet Spring Sale [Werbung]
    •  /