Major Release »pdfaPilot 10« mit neuer OCR-Engine

Version 10 von pdfaPilot enthält kostenfreie Tools (Bild: callas software)

25078-callas-pdfaPilot-10

Version 10 von pdfaPilot enthält kostenfreie Tools (Bild: callas software)

Das Major-Release »pdfaPilot 10« von callas software unterstützt die kürzlich von der ISO veröffentlichten Standards PDF/A-4, PDF/X-6 und PDF/VT-3. »PDF-Standards sind ein wichtiger Baustein der Digitalisierung und Gestaltung unternehmensübergreifender Prozesse, da sie die Interoperabilität zwischen beliebigen Erzeugungs- und Verarbeitungssystemen ermöglichen«, sagt Dietrich von Seggern, Geschäftsführer von Callas Software. »Eines unserer Ziele ist daher, neue Standards frühzeitig in unseren Produkten zur Verfügung zu stellen, damit Anwender und OEM-Kunden, die neuen Möglichkeiten sofort einschätzen und bei Bedarf in ihre Abläufe integrieren können.«

Darüber hinaus beinhaltet das neue Release die OCR-Engine »Tesseract«, die mehr als 100 Sprachen erkennt. Anwender können somit vollständig Unicode-konforme und damit durchsuchbare PDF-Dateien erzeugen. Standardmäßig unterstützt die in Pdfapilot integrierte OCR-Engine Deutsch und Englisch. Anwender können bei Bedarf weitere Sprachen herunterladen und integrieren.

Konvertierungshürden wurden beseitigt

Eine weitere Neuheit ist der regelbasierte, vordefinierte Prozess für eine verbesserte Konvertierung in das Langzeitformat PDF/A-2u (Unicode). Hintergrund ist, dass PDFs oftmals wenige, nicht Unicode-konforme Zeichen wie etwa Aufzählungspunkte beinhalten. Bereits ein einziges solches Zeichen verhindert aber die Konvertierung nach PDF/A-2u. Wenn ein vom Anwender definierter prozentualer Wert nicht überschritten wird, wandelt Pdfapilot 10 solche Zeichen in nicht relevante Vektorobjekte um, die aber weiter sicht- und lesbar bleiben.

Seit Anfang dieses Jahres beinhaltet Pdfapilot einen grafischen Editor zum Erstellen und Modifizieren von Prozessplänen. Mit diesem können Anwender selbst komplexe Workflows einfach gestalten und PDF-basierte Abläufe weiter automatisieren. Pdfapilot lässt sich damit als eine RPA-Anwendung verwenden, deren Nutzungsmöglichkeiten mit der Version 10 weiter gewachsen sind. So findet eine neue Engine sämtliche Bar-, Matrix- oder QR-Codes auf einer Seite und liest die darin enthaltenen Inhalte aus. Diese Werte lassen sich dann für die weitere Prozesssteuerung nutzen.

Pdfapilot 10 bietet kostenlos Tools

Mit Veröffentlichung der Version 10 ist eine Sammlung kostenloser Tools in Pdfapilot Desktop verfügbar. Mit einem Tool können zum Beispiel Entwickler PDF-Dateien »low level« analysieren, um einen übersichtlichen und gleichzeitig präzisen Einblick in interne Datenstrukturen des PDFs oder der eingebetteten Fonts zu gewinnen. Ein weiteres kostenloses Werkzeug erlaubt die Anzeige von Tagging-Strukturen, die für Wiederverwendung von PDF-Inhalten oder die Konvertierung nach PDF/UA erforderlich sind.

»pdfaPilot Desktop« für die manuelle Verarbeitung stand-alone oder als Plugin für »Adobe Acrobat Pro« ist für 379 Euro erhältlich. Ein Upgrade von »pdfaPilot 9« kostet 129 Euro. »pdfaPilot Server«, CLI und SDK für die vollautomatische Verarbeitung und Integration in andere Lösungen sind ab 4.499 Euro erhältlich.

About the Author: Annette Stadler

Annette Stadler ist IT-Journalistin und leitet das Online-Portal ECMGUIDE.