Übersicht über IDP-Systeme
In dieser Übersicht finden sich Lösungen für Intelligent Document Processing (IDP), die Capture- und KI-Fähigkeiten in sich vereinen. Damit sind sie in der Lage, Daten aus Dokumenten zu erfassen und zu bewerten sowie Geschäftsprozesse zu automatisieren.
Kennzeichen von IDP-Lösungen
Inhalt dieses Artikels
IDP-Lösungen extrahieren Daten aus unstrukturierten und strukturierten Dokumenten und bieten die Möglichkeit, dokumentenbezogene Geschäftsprozesse zu automatisieren. Hierfür müssen sowohl Capture-Techniken als auch Künstliche Intelligenz (KI) integriert sein. Wichtig ist beide Technologie-Teilmärkte zu verstehen:
- Capture- oder Erfassungs-Anwendungen, die unstrukturierte Daten in strukturierte Informationen umwandeln. Diese lassen sich dann an eine andere Unternehmensanwendung weiterleiten und/oder von einer nachgelagerten Aufgabe oder einem Prozess nutzen. Solche Anwendungen können zunehmend eingebettete KI-Softwaredienste beinhalten, um beispielsweise Zuordnungen, Daten und Bilder zu erkennen.
- KI-Software zum Verstehen von Dokumenten und zur Gewinnung von Informationen aus gescannten Dokumenten und/oder Bildern von Dokumenten. Dokumente sind oft unstrukturiert, was bedeutet, dass der Ort oder das Format des Inhalts in zwei ansonsten ähnlichen Dokumentformen variieren kann. Anbieter, die KI-Technologien zum Verstehen von Dokumenten einsetzen, erforschen und integrieren zunehmend generative KI (GenAI) und große Sprachmodelle (LLMs). Ziel ist, zusätzliche Softwarefunktionen und -fähigkeiten wie semantisches Verständnis, Dokumentenabfragen und Entitätsextraktion einzubinden.
Einige der hier aufgeführten Lösungen waren in Vorgängerversionen in unserer Capture-Übersicht zu finden. Da sie sich hinsichtlich KI- und anderen Funktionen weiterentwickelt haben und nach Analystenmeinung sowie nach eigenen Bezeichnungen als IDP-Lösungen gelten, haben wir sie hier aufgeführt. Zu diesen Wechselkandidaten zählen Kodak Alaris, Opentext und SER.
Low-Code/No-Code-IDP-Plattform von ABBYY
Der Erfassungsspezialist ABBYY bietet mit »ABBYY Vantage« eine KI-basierte Low-Code/No-Code-IDP-Plattform an. Vantage ist als Cloud-First-Plattform konzipiert, auf die über die SOC2-zertifizierten Abbyy Cloud-Instanzen in Europa, den USA oder Australien zugegriffen werden kann. Alternativ gibt es flexible Bereitstellungsoptionen für den Betrieb von Vantage vor Ort oder innerhalb einer privaten Cloud-Instanz auf Microsoft Azure. Vantage nutzt Docker-Container und Kubernetes zur Orchestrierung von Containern und umfasst Protokollierung und Überwachung.
Von beliebigen Geschäftsdokumenten erkennt Vantage automatisch den Dokumententyp und empfiehlt den passenden Weiterbearbeitungsmodus, der als Vantage-Skill bezeichnet wird. Für die Verarbeitung der Dokumente und Daten bietet die IDP-Lösung vorgefertigte Vantage-Skills. Alternativ können Kunden im »ABBYY Marketplace« nach dem passendsten Skill suchen oder mit dem »Vantage Skill Designer« eigene Document-Skills entwerfen und trainieren. Der Marketplace bietet vortrainierte KI-Modelle und -Lösungen, die eine effiziente und präzise Verarbeitung jedes Dokumententyps ermöglichen sollen. Mit dabei sind auch Konnektoren für die Integration mit intelligenten Automatisierungs- oder Line-of-Business-Plattformen von Drittanbietern.
Laut Abbyy kann der Vantage Skill von jeder Plattform aus aufgerufen werden, einschließlich RPA, BCM, IA, IDP und ECM. Hierfür gibt es vorgefertigte Konnektoren. Mit »Vantage REST API« können Anwendende auch individuelle Schnittstellen entwickeln. Generell überwacht, misst und analysiert Vantage die Leistung der eingesetzten Skills und erstellt neue Lernmodelle, die eine kontinuierliche Verbesserung ermöglichen.
ABBYY Marketplace mit KI-Services
Der Abbyy Marketplace enthält rund 80 KI-Modelle und Services. Hierzu zählen beispielsweise Lösungen für Rechnungen, Bestellungen und den HR-Bereich sowie Angebote für den Transport- und Logistik-Bereich, die unter anderem Packlisten, Frachtbriefe und Handelsrechnungen unterstützen. Auch Abbyy-Partner und andere Drittentwickler können Assets beisteuern, um die Vielfalt des Marketplace-Angebots zu erhöhen und das Potenzial für die Integration mit zusätzlichen Plattformen zu erweitern.
Im KI-Bereich verfolgt Abbyy die Strategie, alle am Markt verfügbaren KI-Modelle und -Lösungen zu beobachten und für seine Lösungen die jeweils passendste einzusetzen. Damit will der Hersteller der wachsenden Nachfrage von Unternehmen nach qualitativ hochwertigen Daten nachkommen, die für den effektiven Einsatz von großen Sprachmodellen (Large Language Models, LLMs) erforderlich sind. Laut Abbyy optimiert die Integration von IDP mit generativer KI (LLMs) Ergebnisse, indem sie zuverlässigere Ausgaben ermöglicht, die den spezifischen Unternehmenskontext berücksichtigen. Darüber hinaus unterstützt Abbys Marketplace Nutzende von RAG-Systemen (Retrieval Augmented Generation) mit KI-Modellen, die als Anleitung für LLMs dienen. Sie helfen den Modellen, auf bestimmte Daten in ihrer Wissensdatenbank zu verweisen, anstatt eigene Antworten zu generieren, die anfällig für Halluzinationen sein könnten.
Abbyys IDP-Technologie ist beispielsweise auf globaler Basis in der Auftragsabwicklung von Carlsberg eingebaut. So kann die Brauereigruppe Aufträge, die per E-Mail eingehen, automatisch erfassen und die Daten sofort in das SAP-System des Unternehmens übertragen. Durch die Integration der IDP-Lösung in den Lieferschein-Scan-Prozess wird der Registrierungsprozess automatisch durchgeführt. Der Prozess für den Empfang und die Lagerung der erhaltenen Waren und die Wiederverwendung von Lieferantenetiketten wurde beschleunigt und Carlsberg hat einen besseren Überblick über den gesamten Lieferprozess.
End-to-End IDP-Plattform von Kodak Alaris
»KODAK Info Input Solution« ist eine IDP-Plattform von Kodak Alaris, die Künstliche Intelligenz (KI) und maschinelles Lernen (ML) nutzt. Ihr Ziel ist, Daten automatisch zu extrahieren, zu validieren und mit hoher Genauigkeit bereitzustellen. Mit dem »Open Intelligence« Design-Ansatz bietet sie Schnittstellen zu fortschrittlichen und leistungsfähigen KI-Technologien für Dokumente von führenden Unternehmen wie Google, Microsoft und Amazon. Der Vorteil liegt laut Kodak Alaris darin, dass diese KI-Modelle bereits mit Millionen von Dokumenten und Daten angelernt wurden, wodurch sie eine zuverlässige Formular- und Rechnungslesung sowie die Erkennung von Handschriften gewährleisten. Das soll von der Implementierung bis hin zum produktiven Einsatz Zeit sparen. Diese KI-Engines arbeiten in der Cloud, wo für den Nutzer unmerklich die Daten ausgelesen und wieder zurückgesendet werden. Dies kann in einigen Bereichen problematisch sein, doch Kodak Alaris hat hierfür eine Antwort: Die Microsoft-KI lässt sich auch als On-Premises-Lösung betreiben, was für Datenschutzkonformität sorgt.
KODAK Info Input Solution ist sozusagen eine technologieunabhängige End-to-End IDP-Plattform, mit der Unternehmen entscheiden können, welche KI-Engines am besten für ihre Geschäftsanforderungen geeignet sind.
Neuerungen aus Version 7
Die im Frühjahr 2024 vorgestellte Version 7 enthält einen neuen interaktiven Skript-Editor. Er vereinfacht die Erstellung, das Debugging und die Bereitstellung von Skripten, um automatisierte Workflows zu realisieren. Zudem gibt es einen verbesserten Human-in-the-loop (HITL) Client, der beim Scannen Tausende von Stapeln und Tausende von Bildern pro Stapel verarbeiten kann. Möglich ist auch, dass sich Mitarbeitende überall im Unternehmen einfach über einen Browser oder eine mobile App mit dem System verbinden können, um auf alle Automatisierungs- und KI-Modelle zuzugreifen.
Zu den weiteren Entwicklungen gehören die Integration von IDP in alltägliche Anwendungen wie Salesforce, ein neuer interaktiver Skript-Editor und die Möglichkeit, Dokumente aus der INfuse Smart Connected Scanning Solution von Kodak Alaris aufzunehmen, zu verarbeiten und in Echtzeit Feedback zu liefern.
OpenText mit klassischer und SaaS-Lösung
Mit »OpenText Intelligent Capture« hat OpenText eine IDP-Lösung, die auf der ehemaligen Captiva-Plattform aufbaut. Daher bleibt auch die Lizenzierung für bestehende Captiva-Kunden gleich.
Opentext Intelligent Capture nutzt maschinelles Lernen und künstliche Intelligenz, um manuelle Content-Prozesse zu automatisieren, wie die Kreditorenbuchhaltung, die Konvertierung von Back-Files und das Onboarding, und um Papier und digitalen Content in verwertbare Daten umzuwandeln.
Bei der automatischen Erkennung von Dokumenten werden Text- und Grafikmethoden kombiniert. Durch integrierte Texterkennung (OCR), maschinelles Lernen und Integrationen mit Recognition Engines von Drittanbietern verbessert sich die Genauigkeit der an andere Geschäftssysteme übergebenen Informationen. Die OCR-Genauigkeit ist für über 120 Sprachen und Sprachräume optimiert.
Ohne Skripterstellung ermöglicht Opentext Intelligent Capture die Gestaltung von Workflows, die erweiterte Regeln zur Erfüllung von Geschäftsanforderungen enthalten. Um einen sicheren Betrieb zu gewährleisten, sind die Daten sowohl im Speicher als auch während der Übertragung zwischen verbundenen Systemen verschlüsselt. Dies ist unabhängig davon, ob sich die Daten im selben Rechenzentrum, an einem anderen Ort oder in der Cloud befinden.
Generell gibt es verschiedene Bereitstellungsmöglichkeiten: On-Premises, als eingebettete Microservices oder in einer Private- oder Hybrid-Cloud-Umgebung, die von OpenText, Google Cloud, AWS oder Microsoft Azure gehostet wird. Opentext ermöglicht zudem eine native Integration der IDP-Softwarefunktionen in SAP.
Laut Marktforschungsunternehmen IDC besteht ein intuitiver Modelllernansatz, der mit jedem bereitgestellten Trainingsbeispiel und/oder jeder menschlichen Validierungsaktion kontinuierlich aktualisiert wird.
Alternativ zu Intelligent Capture bietet Opentext mit Core Capture eine SaaS-Lösung an, die funktionell etwas weniger Möglichkeiten bietet. Allerdings lässt sich Core Capture in SAP und Salesforce integrieren.
Retarus IDP mit umfassender EDI-Unterstützung
Die IDP-Lösung von Retarus ist Teil der Retarus Enterprise Cloud. Für die automatisierte und digitale Belegerfassung werden per E-Mail, Fax oder API eingehende Dokumente erfasst. Sie durchlaufen einen KI-basierten Multi-Modell-Ansatz in Verbindung mit Deep- und Machine-Learning-Technologien. Diese beschleunigen die Texterkennung im Vergleich zu herkömmlichen OCR-Methoden und ermöglichen die Extraktion aller relevanten Textinhalte. Text- und Semantikanalysen sorgen dafür, dass verschiedene Sprachen erkannt und verarbeitet werden. Die extrahierten Daten werden klassifiziert, validiert und strukturiert und lassen sich via Retarus Cloud EDI an Zielsysteme übertragen. Sollte doch einmal ein Dokument nicht korrekt erfasst werden, kann dieses in einem Human-in-the-Loop Interface nachbearbeitet werden.
Retarus IDP überzeugte die Marktanalysten von IDC in ihrer Betrachtung vor allem durch die umfassende Unterstützung von Electronic Data Interchange (EDI) und die robuste Infrastruktur. Mit dem Betrieb eigener Rechenzentren gewährleiste Retarus höchste Service-Levels für die besonderen Anforderungen seiner Kunden bei Geschwindigkeit, Sicherheit und Skalierbarkeit und biete zudem DSGVO-Konformität. Dies ist unerlässlich, da viele der IDP-Kunden von Retarus in geschäftskritischen oder stark regulierten Umgebungen arbeiten.
Retarus ist mit seiner IDP-Lösung beispielsweise beim Hersteller von Arbeits-, Gebrauchs- und Schutzausrüstung Engelbert Strauss im Einsatz. Die Entscheidung zugunsten Retarus fiel aufgrund der generischen, nicht templatebasierten Lösung, deren überzeugende Erkennungsquoten sowie die geplante Umsetzungszeit für die Einführung. Der Ansatz, aus den Bestellungen mittels OCR (Optical Character Recognition) den Textinhalt auszulesen, ist dabei nur der erste Schritt. Der Unterschied in den Erkennungsquoten wird durch den Einsatz von KI erzielt, die eine Bestellung so ausliest, als würde sie ein Sachbearbeiter erfassen.
SER mit vordefinierten Extraktionsmodellen
IDP ist bei SER keine separate Produktkategorie, sondern ein Kernstück der KI-gestützten Content-Services-Plattform »Doxis Intelligent Content Automation«, die Inhalte, Automatisierung und Intelligenz vereint. Die Cloud Capture Plattform »Doxis Intelligent Document Understanding« für Public & Private Cloud und hybride Szenarien sowie der »Doxis Classification & Extraction Service« für on-premises-Installationen sind keine reinen »Extraktionsdienste«. Sie decken das gesamte Spektrum von der Vorverarbeitung bis zur Nachverarbeitung ab, einschließlich der Anzeige, Hervorhebung, Validierung, Speicherung und Kontextualisierung von Daten. Dokumente aller Art werden automatisch analysiert und klassifiziert. Die für den jeweiligen Dokumenttyp relevanten Daten werden automatisch ausgelesen und weiterverarbeitende Prozesse automatisch angestoßen. Für jeden Fall kombiniert Doxis laut SER die am besten geeigneten Verfahren. »Doxis Intelligent Document Understanding« integriert ausgewählte Anbieter von Cloud Cognitive Services für Klassifizierung und Extraktion von Dokumenten.
Die Wirkungsweise verdeutlicht folgendes Beispiel: Ein Bewerbungsschreiben wird als Papierdokument mit Doxis Capture gescannt, OCR-gelesen oder als E-Mail importiert, im Archiv gespeichert und an die Cloud Capture Plattform »Doxis Intelligent Document Understanding« beziehungsweise on-premises an den »Doxis Classification & Extraction Service« zur weiteren Verarbeitung übergeben. Bei der Inhaltsanalyse erkennt Doxis automatisch die Dokumentart (Bewerbung), den Absender (Bewerber XY) und ermittelt selbstständig den zuständigen HR-Mitarbeiter. Aus diesen Informationen generiert das System einen Vorgang, der in den Postkorb des betreffenden Mitarbeiters eingestellt wird. Der Vorgang enthält neben dem gescannten Schreiben einen Link auf die entsprechende Stellenanzeige in Doxis Human Resources, wo mit den extrahierten Bewerberdaten auf Wunsch für jeden Bewerber automatisch eine Bewerberakte angelegt werden kann. So liefert Doxis dem HR-Mitarbeiter alle notwendigen Informationen, um zeitnah die Bewerbung zu prüfen und gegebenenfalls einen Termin mit dem Bewerber zu vereinbaren.
Zu den weiteren Einsatzbereichen, in denen die IDP-Lösungen von SER für Prozessoptimierungen sorgen, zählt die Verarbeitung von Purchase-to-Pay-Dokumenten wie Auftragsbestätigungen und Rechnungen, von Versand-, Empfangs- und Logistikdokumenten sowie von Wettbewerbs- und Marktinformationen.
Mit vordefinierten Extraktionsmodellen ist Doxis sofort für typische Anwendungsfälle wie Purchase-to-Pay-Prozesse einsetzbar. Für die Rechnungsverarbeitung und Automatisierung von Auftragsbestätigungen bietet SER auch vorgefertigte Lösungen, die die entsprechenden IDP-Verfahren nutzen. Die Kosten zur Nutzung der IDP-Verfahren basieren auf dem verarbeiteten Dokumentenvolumen.
Weitere Artikel
Insiders Technologies zeigt neue Produktkreation
Insiders Technologies richtet das Produktportfolio neu aus und demonstriert aktuell auf Veranstaltungen erste Resultate. Bereits auf dem DSAG-Partnertag war »360 Grad Invoice Management« zu sehen. Ebenso ist eine Präsentation auf dem E-Rechnungsgipfel geplant.
KI-basierte Prozesslösung von inovoo
Die Low-Code-Software »NOVO AI Studio« von inovoo nutzt vortrainierte KI-Modelle, um lokal oder cloud-basiert Prozesse wie Rechnungs-, Auftrags- und Vertragsverarbeitung zu automatisieren. Per RAG-Funktion lässt sich auch Unternehmenswissen einbinden.