ABBYY FineReader Engine nutzt KI-Standard DocLang
Anfang Juni stellte die Linux AI & Data Foundation mit »DocLang« einen neuen Standard vor, der Dokumente speziell für die Nutzung durch KI-Anwendungen strukturieren soll. Nun gehört ABBYY zu den ersten Anbietern, die das Format unterstützen.
Die Idee hinter DocLang
Inhalt dieses Artikels
DocLang resultiert aus der Arbeit der LF AI & Data Foundation, zu der ABBYY, IBM, HumanSignal, Nvidia und Red Hat zählen. Die LF AI & Data Foundation ist eine führende Organisation zur Förderung von Open-Source-Innovationen in den Bereichen künstliche Intelligenz und Daten unter dem Dach der Linux Foundation.
DocLang ist ein KI-nativer Dokumentenstandard, durch den Dokumente für KI-Anwendungen strukturierter und verlustärmer nutzbar werden sollen. Er ist darauf ausgelegt, die Art und Weise zu verbessern, wie Unternehmen Dokumentendaten für KI-Systeme aufbereiten, austauschen und verwalten. Dagegen sind aktuelle Dokumentenformate wie PDF, HTML, Markdown und andere auf die menschliche Nutzung und nicht auf die Interpretation durch KI-Systeme ausgelegt. Diese erfordern an KI-Schnittstellen eine individuelle Parser-Entwicklung. Neben einem hohen Entwicklungsaufwand, steigt damit die Anfälligkeit für Halluzinationen und die Einhaltung regulatorischer Vorgaben erschwert sich.
Zielsetzung von DocLang
DocLang schafft dagegen eine Abstraktionsschicht zwischen unstrukturierten Daten und intelligenten KI-Systemen. Nach den Vorstellungen der DocLang-Entwickler vereinheitlicht der Standard die Vielfalt an digitalen Dokumentenformaten, mit denen Unternehmen arbeiten. Zudem kann er KI-Systeme die deterministische Struktur verleihen, die sie für einen zuverlässigen Betrieb im Unternehmensmaßstab benötigen.

06-25-26-ABBYY-Max-Vermeir
Max Vermeir, VP of AI Strategy bei Abbyy (Bild: Abbyy)
»DocLang wurde gezielt entwickelt, um branchenspezifische Herausforderungen mit einem schlanken, standardisierten und KI-nativen Ansatz für die Darstellung von Dokumentenstruktur, -inhalt, -layout und -Governance zu bewältigen« erläutert Max Vermeir, VP of AI Strategy bei Abbyy.
ABBYY FineReader Engine – ausgestattet mit DocLang
Mit DocLang-Unterstützung bietet die ABBYY FineReader Engine Entwicklern nun ein einheitliches, für KI lesbares Format zur Darstellung von Dokumenten, die von Sprachmodellen und agentenbasierten KI-Systemen verarbeitet werden sollen. Vermeir führt aus: »Die FineReader Engine mit DocLang-Unterstützung ist auf eine effiziente maschinelle Verarbeitung sowie eine berechenbare Struktur ausgelegt, die für moderne Verfahren der KI-Tokenisierung und -Modellierung optimiert ist. Unternehmen profitieren von einer zuverlässigeren Interpretation, höherer Genauigkeit und geringerem Rechenaufwand.«
In ihrer Grundfunktion extrahiert ABBYY FineReader Engine Informationen aus Texten, Tabellen und andere Dokumentenstrukturen sowie Scans und PDFs. Sie stellt die Informationen in digitalen Formaten für die Weiterverarbeitung durch Anwendungen und KI-Systeme bereit. Genutzt wird die FineReader Engine von Systemintegratoren und Softwareherstellern wie Anbietern von ECM-Systemen, Dokumenten- und Erfassungslösungen. »Die ABBYY FineReader Engine wird bereits von Tausenden von Unternehmen eingesetzt, die jährlich Milliarden von Dokumenten verarbeiten«, berichtet Vermeir. Dessen Überzeugung nach können dank DocLang als KI-nativem Format nun noch mehr Unternehmen Innovationen vorantreiben und schneller auf ihre Geschäftsdaten zugreifen, um fundiertere und wirkungsvollere Entscheidungen zu treffen.
KI-Benchmark mit PDF und DocLang
Schon vor der offiziellen Vorstellung des DocLang-Standards verglich ABBYY in einem direkten Benchmark-Test auf der Kunden- und Partnerkonferenz »ABBYY Ascend« die Verarbeitung eines PDF-Dokuments mit der eines DocLang-Dokuments. In diesem Experiment wurden für dieselbe komplexe Aufgabe und unter Verwendung desselben KI-Modells identische Rahmenbedingungen geschaffen. Die einzige Variable war das Dokumentenformat (PDF versus DocLang). Die FineReader Engine mit DocLang verbesserte die Ausgabequalität erheblich, erhöhte die strukturelle Genauigkeit, senkte den Token-Verbrauch und reduzierte die Latenzzeiten.
Der kontrollierte Benchmark umfasste drei Arten von Unternehmensdokumenten: einen Geschäftsbericht, eine klinische Studie und einen Lieferantenvertrag. Diese Dokumente sind zwar für die menschliche Interpretation konzipiert, für Maschinen jedoch komplex zu verarbeiten.
Weitere Artikel
Bitkom-Monitor bewertet die digitale Verwaltung
Über den »Monitor Staatsmodernisierung« lässt sich ablesen, wie weit 222 Digitalisierungsprojekte von Staat und Verwaltung sind. Zwar sind zwei Drittel aller Vorhaben angeschoben, aber nur 9 Prozent abgeschlossen.
Internationale Perspektiven auf die E-Rechnung
Einheitliche Norm, unterschiedliche Realität: Obwohl EN 16931 die Grundlage für E-Rechnungen in der EU bildet, weichen die nationalen Umsetzungen deutlich voneinander ab. Unternehmen sollten sich darauf einstellen – und von Vorreitern lernen.



