Interview mit Gala Spasova von IDC zu Capture und IDP
Was ist der Unterschied zwischen einer Capture- und einer Intelligent Document Processing (IDP) Lösung?
Spasova: Nach der offiziellen Definition von IDC wird Capture als Teil von IDP betrachtet.
Capture-Anwendungen wandeln unstrukturierte Daten in strukturierte Informationen um, die an eine andere Unternehmensanwendung weitergegeben und/oder von einer nachgelagerten Aufgabe oder einem Prozess genutzt werden. Diese Anwendungen können zunehmend eingebettete KI-Software-Services verwenden, wie Eigennamen-Erkennung/Extraktion und Bilderkennung.
KI-Software für das Verstehen von Dokumenten nutzt eingebettete Technologien aus den Teilmärkten Konversations-KI und KI-Tools für computerbasiertes Sehen (Computer Vision, CV). Es können auch Lösungen wie Natural Language Processing (NLP), Ontologien und Sprachanalyse zum Einsatz kommen, um Informationen aus gescannten Dokumenten und/oder Bildern von Dokumenten zu gewinnen. Dokumente sind oft unstrukturiert, was bedeutet, dass der Ort oder das Format des Inhalts zwischen zwei ansonsten ähnlichen Formen variieren kann. Anbieter, die KI-Technologien zum Verstehen von Dokumenten einsetzen, untersuchen und integrieren zunehmend generative KI (GenAI) und große Sprachmodelle (LLMs), um zusätzliche Softwarefunktionen und -fähigkeiten bereitzustellen, darunter semantisches Verständnis, Dokumentenabfragen und erweiterte Entitätsextraktion.
Die Erklärung ist vergleichbar in der Quelle: IDC MarketScape: Worldwide Intelligent Document Processing Software 2023-2024 Vendor Assessment, Nov 2023, US49988723
Wann ist eine Capture-Lösung und wann eine IDP-Lösung empfehlenswert?
Spasova: Zunächst eignet sich die Capture-Lösung:
- für einfache Digitalisierungsanforderungen wie Konvertierung von Papierdokumenten in digitale Formate,
- für die Speicherung oder den grundlegenden digitalen Zugriff, für strukturierte Dokumente mit konsistentem Format und Layout, das heißt die Datenfelder befinden sich auf jedem Dokument an der gleichen Stelle,
- für die grundlegende Datenextraktion (bei der Extraktion einfacher, strukturierter Daten für grundlegende Indexierungs- oder Katalogisierungszwecke).
Bei begrenztem Budget und grundlegenden Anforderungen an die Dokumentenverarbeitung sind Capture-Lösungen ideal.
IDP-Lösung empfehlen sich:
- für komplexe Dokumentenprozesse, die ein Verständnis des Kontexts und die Extraktion spezifischer Informationen aus den Dokumenten erfordern
- bei der Verarbeitung unterschiedlicher Dokumententypen – eine Mischung aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zum Beispiel Rechnungen, Verträge, E-Mails, Berichte
- wenn das Ziel darin besteht, End-to-End-Geschäftsprozesse zu automatisieren, die Dokumente einbeziehen zum Beispiel automatische Rechnungsverarbeitung, Compliance-Prüfungen, Customer Onboarding.
IDP-Lösungen eignen sich am besten für die schnelle und effiziente Verarbeitung großer Mengen von Dokumenten bei minimalem menschlichem Eingriff.
Ab welchen Parametern – zum Beispiel Anzahl der Dokumente – ist IDP für Unternehmen prinzipiell interessant?
Spasova: IDP wird für Unternehmen interessant, die mit großen Mengen unterschiedlicher Dokumente, komplexen Anforderungen an die Datenextraktion, hohen Genauigkeitsanforderungen und der Integration der Dokumentenverarbeitung mit anderen Geschäftssystemen und Workflows zu tun haben. IDP ist auch vorteilhaft für Unternehmen, die strenge Compliance- und Sicherheitsanforderungen erfüllen müssen, die ihre Betriebskosten senken und ihre Effizienz durch Automatisierung verbessern wollen. Ebenso eignen sie sich für Unternehmen, die ein Wachstum ihrer Dokumentenverarbeitungsanforderungen erwarten und eine skalierbare Lösung benötigen.
Was sollten Benutzer bei der Auswahl einer Erfassungslösung beachten?
Spasova: Die Benutzer müssen sicherstellen, dass die Lösung die verwendeten Dokumententypen wie Formulare, Rechnungen und Briefe sowie Dokumentenformate – PDF, JPEG, TIFF- verarbeiten kann; dass sie in der Lage ist, die benötigten Daten genau zu extrahieren; dass sie in bestehende Systeme integriert werden kann; dass sie skalierbar ist, um das künftige Wachstum des Dokumentenvolumens und der Komplexität zu bewältigen; dass sie genau und zuverlässig ist; dass sie einfach zu bedienen ist; dass sie individuell angepasst werden kann und in der Lage ist, spezifische Anforderungen zu erfüllen; dass sie den Branchenvorschriften zum Beispiel GDPR, HIPAA, dem Datenschutz und der Sicherheit entspricht; dass sie kostengünstig ist und dass sie ein hohes Maß an Unterstützung und Wartung bietet. Die Technologie der optischen Zeichenerkennung (OCR) ermöglicht die Umwandlung eines »Bildes« beziehungsweise Scans von Text in ein maschinenlesbares Textformat, um relevante Informationen zu extrahieren.
Worauf sollten Anwender bei der Auswahl einer IDP-Lösung achten?
Spasova: Auf alle in der vorangegangenen Antwort genannten Punkte. Hinzu kommen die Merkmale der KI- und ML-Funktionen: NLP-Funktionen und verschiedene Stufen der komplexeren Integration in Geschäftsprozesse, da IDP tiefer in Geschäftsabläufe integriert werden und zur Automatisierung von Entscheidungsprozessen beitragen kann, sowie ein höheres Maß an Anpassung und Flexibilität.
Ja, es gibt erhebliche Unterschiede in der Qualität von IDP-Lösungen, die von den KI-Fähigkeiten, der Genauigkeit, der Skalierbarkeit, der einfachen Integration, der Anpassung, der Benutzerfreundlichkeit und den Supportleistungen beeinflusst werden.
Worauf sollten die Nutzer bei der Kostenbetrachtung achten?
Spasova: Die Nutzer sollten Lizenzgebühren, Implementierungskosten, Schulungskosten, Wartungs- und Supportgebühren, Skalierungskosten, Anpassungskosten und Hardwareanforderungen prüfen und diese gegen die potenziellen Einsparungen durch die betriebliche Effizienz abwägen – Stichwort Return on Investment. Wichtig ist auch ein Verständnis der Gesamtbetriebskosten, einschließlich indirekter Kosten wie potenzielle Ausfallzeiten oder die Notwendigkeit zusätzlicher Mitarbeiterschulungen.
Sehen Sie auch Anbieter auf dem Markt, die ihre Lösungen lediglich von Capture zu IDP umbenennen?
Spasova: Die Anbieter haben den Begriff »intelligente Erfassung« oder »intelligente Datenerfassung« übernommen. Zwischen dem Prozess, der Informationen erfasst beziehungsweise digitalisiert und der Weiterverarbeitung dieser Informationen/Daten besteht eine klare Unterscheidung. Es gibt einen großen Hype um die intelligente Dokumentenverarbeitung, die kaum eine erweiterte Intelligenz nutzt.
Sehen Sie große Unterschiede in der Qualität der angebotenen IDP-Lösungen?
Spasova: Ja, es gibt erhebliche Unterschiede in der Qualität von IDP-Lösungen, die von den KI-Fähigkeiten, der Genauigkeit, der Skalierbarkeit, der einfachen Integration, der Anpassung, der Benutzerfreundlichkeit und den Supportleistungen beeinflusst werden. Die Effektivität einer IDP-Lösung bei der Bewältigung realer Herausforderungen in der Dokumentenverarbeitung kann aufgrund dieser Faktoren stark variieren.
Was sollte beim Anschluss von Scanner-Hardware an Capture- und IDP-Lösungen beachtet werden?
Spasova: Zu berücksichtigen sind die Kompatibilität des Scanners inklusive der Prüfung auf unterstützte Modelle, Treiber und erforderliche Middleware, die Anschlussoptionen wie USB, Netzwerk und drahtlos, die mit der vorhandenen Infrastruktur und der Einrichtung der IDP-Lösung übereinstimmen müssen. Außerdem geht es um die Gewährleistung einer ausreichenden Auflösung und Qualität, die Berücksichtigung der Scangeschwindigkeit und des Volumens der zu verarbeitenden Dokumente, die Dokumentengröße und -art sowie Sicherheitsfunktionen wie Datenverschlüsselung. Darüber hinaus können Scanner mit integrierten Bildverbesserungsfunktionen – Zuschneiden, Geraderücken, Erkennung leerer Seiten – die Qualität der gescannten Dokumente verbessern und den Bedarf an manuellen Korrekturen verringern.
Was sollte bei der Anbindung von Unternehmenssoftware an Capture- und IDP-Lösungen beachtet werden?
Spasova: Es ist sicherzustellen, dass sowohl die Erfassungs-/IDP-Lösung als auch die Unternehmenssoftware robuste API-Unterstützung für die Integration bieten. Die Lösung sollte mit der Unternehmenssoftware in Bezug auf Datenformate, Kommunikationsprotokolle und Plattformanforderungen kompatibel sein. Anwender müssen überlegen, wie die extrahierten Daten auf die Felder und Strukturen der Datensoftware abgebildet werden, zum Beispiel ob sie transformiert werden müssen. Schließlich sind die Workflow-Automatisierung zu prüfen und Trigger-Aktionen einzurichten, die auf den Ergebnissen der Dokumentenverarbeitung basieren. Dazu zählen die Aktualisierung von Datensätzen, Einleitung von Aufgaben und das Senden von Benachrichtigungen. Wichtig sind auch die Fehlerbehandlungs- und Wiederherstellungsmechanismen des Systems für die Minimierung von Unterbrechungen und manueller Eingriffe. Die Auswirkungen der Integration des Systems mit der Unternehmenssoftware auf die allgemeine Systemleistung und die Latenzzeit sind zu bewerten. Schließlich gilt es Überwachungs- und Berichtsfunktionen zur Verfolgung von Verarbeitungsvolumen, Fehlern und Benutzeraktivitäten für die laufende Optimierung und Fehlerbehebung zu implementieren.
Wie wird sich KI auf die Verarbeitung unstrukturierter Daten aus Dokumenten auswirken?
Spasova: KI wird unter anderem die Datenextraktion verbessern, das kontextbezogene Verständnis erhöhen, die NLP-Fähigkeiten verbessern, eine automatisierte Entscheidungsfindung ermöglichen und prädiktive Analysen erleichtern. Die Entwicklung von KI-Technologien wird die Entwicklung von anspruchsvolleren IDP-Lösungen vorantreiben, die in der Lage sind, Dokumente mit zunehmender Komplexität und Variabilität zu verarbeiten.
Welche weiteren Trends sehen Sie in diesem Umfeld?
Spasova: Zu den Trends gehören hybride Bereitstellungsmodelle, die Cloud- und Vor-Ort-Lösungen kombinieren, die Integration von Blockchain-Technologie für die Dokumentenauthentifizierung und die Zunahme von Low-Code/No-Code-Plattformen. Es zeigen sich ein verstärkter Fokus auf den Datenschutz, Edge Computing für die Dokumentenverarbeitung an/nahe der Quelle der Datengenerierung und verbesserte Kollaborationstools zur Erleichterung von Remote-Arbeit. Außerdem beobachten wir eine zunehmende Betonung der KI-Ethik, die Nutzung von prädiktiven Analysen, die Anpassung von KI-Modellen für bestimmte Branchen/Anwendungsfälle und stärkere Bemühungen um Nachhaltigkeit.
Weitere Artikel
Insiders Technologies zeigt neue Produktkreation
Insiders Technologies richtet das Produktportfolio neu aus und demonstriert aktuell auf Veranstaltungen erste Resultate. Bereits auf dem DSAG-Partnertag war »360 Grad Invoice Management« zu sehen. Ebenso ist eine Präsentation auf dem E-Rechnungsgipfel geplant.
KI-basierte Prozesslösung von inovoo
Die Low-Code-Software »NOVO AI Studio« von inovoo nutzt vortrainierte KI-Modelle, um lokal oder cloud-basiert Prozesse wie Rechnungs-, Auftrags- und Vertragsverarbeitung zu automatisieren. Per RAG-Funktion lässt sich auch Unternehmenswissen einbinden.