Scannen, Klassifizieren – und was passiert dann?

25597-Scannen-Tropper

Nach dem Scannen müssen die Informationen in Folgesysteme fließen (Bild: Tropper Data Service)

Werden papierbasierte Dokumente digitalisiert oder Daten aus unstrukturierten elektronischen Medien ausgelesen, ist das erst der Anfang für digitale Prozesse in Unternehmen. Entscheidend ist, die elektronischen Daten in Folgeprozesse zu integrieren. Erst dann können Prozesse durchgehend digital ablaufen und Beschäftigte von Routineaufgaben entlastet werden. Eine große Rolle spielen Enterprise Information beziehungsweise Enterprise Content Management Systeme (EIM-/ECM-Systeme), da sie dokumentenbasierte Prozesse wie den Posteingangsprozess oder die Eingangsrechnungsverarbeitung unterstützen.

Die Eingangsrechnungsverarbeitung stellt einen wichtigen Teil der Wertschöpfungskette Purchase-To-Pay eines jeden Unternehmens dar. »Dieser Prozess ist in fast allen Unternehmen gegeben und daher wollen fast alle Unternehmen hier mit der Digitalisierung ihrer zentralen Prozesse beginnen«, erklärt Michele Barbato, Abteilungsleiter Produktmanagement von Ceyoniq Technology. »Mit diesem Prozess sind im Unternehmen viele Einsparungsmaßnahmen verbunden und mit einem Schlag ist das gesamte Unternehmen in einen Digitalisierungsprozess involviert. Das unterschätzen viele Unternehmen, da zunächst nur das Input-Management betrachtet wird.« Notwendige weitere Bausteine, wie eine digitale Akte oder ein digitaler Workflow werden vergessen oder sehr rudimentär betrachtet – teilweise sogar als fertiger Baustein vorausgesetzt. Doch nur mit einem unternehmensspezifischen Workflow können solche Projekte effizient durchgeführt werden. Dieser sollte schnell und einfach auf Basis von Standards zum Beispiel BPMN 2.1 oder digitalen Akten abgebildet werden können, um einen schnellen und beständigen ROI zu erzielen

Elektronische Eingangsrechnungsverarbeitung

25597-Ceyoniq-Michele-Barbato

Michele Barbato von Ceyoniq Technology warnt davor, digitale Folgeaufgaben zu unterschätzen (Bild: Ceyoniq Technology)

Im idealen Fall verläuft die Eingangsrechnungsverarbeitung von Anfang bis Ende komplett digital und es ist eine »Dunkelbuchung« möglich. Dabei werden die Rechnungsdaten vom Dokument erkannt und validiert. Im Abgleich mit den entsprechenden ERP-Daten wird beispielsweise überprüft, ob der extrahierte Rechnungssteller ein berechtigter Lieferant ist. Sind die Bestelldaten vorhanden und ist eine Freigabe für den Bestellprozess bereits erteilt, ist die Verarbeitung der Rechnung nur noch Formsache. Auf Basis aller Informationen erfolgt der Nachfolgeprozess komplett automatisiert ohne manuelle Zwischenschritte. Alle notwendigen Daten werden automatisch an die beteiligten Systeme und Anwender weitergeleitet.

Jedoch ist das der Idealzustand, der nicht immer in Projekten erreicht wird, wie Barbato berichtet: »Heutzutage werden selten Lieferantennamen extrahiert. Gute Softwareprodukte benutzen dafür die Kontonummer oder die Steuernummer des Lieferanten. Wenn diese Daten in den ERP-Daten nicht vorhanden oder schlecht gepflegt sind, kann das extrahierte Datum nicht validiert werden. Klassischerweise gehen diese Dokumente in einen manuellen Bearbeitungsworkflow. Dann muss ein Anwender manuell prüfen, warum der Lieferant nicht erkannt worden ist. Das ist ein Rückschritt und hat nichts mit Digitalisierung zu tun.«

Die größten Probleme bei der Digitalisierung von Dokumenten

schlecht gepflegte Stammdaten, zum Beispiel Lieferanten- oder Kundendaten
schlechte oder gar nicht organisierte Prozesse
keine definierten Ablagestrukturen wie digitale Akten
keine oder komplizierte Schnittstellen für die führenden Verfahren
schlechte Umwandlung von unstrukturierten in strukturierte Daten
komplizierte Input-Management-Lösungen
keine EIM-Produkte, die Workflows, digitale Akten und Metadaten bieten

Gibt es kein System wie ein ERP, um beispielsweise Rechnungsdaten zu validieren und geht es um die Erfassung von unstrukturierten Dokumenten, wird in EIMs häufig auf klassische Freiform-Datenextraktionswerkzeuge im Rahmen eines definierten Input-Managements zurückgegriffen. »Die unterschiedlichen Produkte bieten da verschiedene Ansätze: Grundsätzlich arbeiten viele Produkte auf Basis von Regeln. Dazu werden Module angeboten, um die notwendigen Daten aus strukturierten oder unstrukturierten Eingangsmedien zu ermitteln. Andere Produkte bieten vorgefertigte Lösungen mit bereits eingerichteten Regeln für einen bestimmten Anwendungsfall«, so Barbato.

Wie KI die Erfassung von unstrukturierten Informationen erleichtert

25252-DocuWare-Michael-Berger

Michael Berger, Geschäftsführer von Docuware, sieht in KI Potential, um Dokumente besser zu klassifizieren (Bild: Docuware)

Unterstützen lassen sich die klassischen Methoden durch Verfahren aus dem Bereich des Machine Learnings (ML) und der Künstlichen Intelligenz (KI). Diese können auch bei wenigen vorhandenen Informationen hilfreich sein wie Michael Berger, Geschäftsführer von DocuWare, berichtet: »Je geringer der Dokumentenbestand eines Kunden ist und je individueller die Informationen sind, die aus den Dokumenten erfasst werden sollen, umso komplexer wird auch das Problem, diese Daten zuverlässig zu ermitteln. Docuware setzt hier auf den Intelligent Indexing Service, der grundlegende Verfahren aus dem Machine Learning derart erweitert, dass auch bei kleinen Dokumentenmengen und einer kurzen Trainingsdauer bereits die gewünschten Informationen erfasst werden können.«

EIM-Anbieter können die benötigte KI beziehungsweise neuronalen Netze als Third-Party-Application von großen Unternehmen wie Google, Microsoft und Amazon Web Services als auch von kleineren Firmen beziehen. Diese Lösungen sind in der Regel für bestimme Anwendungsfälle bestimmt und bereits vortrainiert. »Wir erleben, dass viele Kunden und Interessenten KI anfragen, um diese Lösungen für die Optimierung ihrer Prozesse einzusetzen. Häufig werden aber eben die Folgeaufgaben wie die Einrichtung von digitalen und strukturierten Akten und Workflows unterschätzt«, betont Barbato. »Unternehmen versprechen sich zu Recht von einem KI-unterstützten Inputmanagement sehr hohe Einsparungseffekte und einen guten Einstieg in die Digitalisierung.« Jedoch müsse sich jedes Unternehmen bewusst sein, dass allein schon aus Compliance-Gründen wie GoBD weitere Bausteine notwendig seien.

Aufgaben beim Input-Management nach der Erfassung

Einrichtung von Schnittstellen zu führenden Verfahren
Stammdaten-Optimierungen für die Unterstützung der KI-Systeme
Einrichtung von Workflows
Möglichkeit von digitalen Akten
Aufsetzen von Berechtigungsstrukturen

Doch nicht nur KI, sondern auch klassische Techniken zur Klassifizierung bieten Verbesserungspotential wie Berger darlegt: »Gerade im Bereich OCR ist jede Verbesserung sinnvoll. Fehler, die hier gemacht werden, werden auch in allen folgenden KI- und nicht-KI basierten Algorithmen zu schlechteren Ergebnissen führen.« KI hat nach Bergers Meinung das Potential das Klassifizieren von größeren Datenmengen, zum Beispiel das Klassifizieren von Dokumenten, zu verbessern. Ebenso habe KI das Potential, bestimmte Problemstellungen, etwa das Indexieren von unstrukturierten Dokumenten, besser zu lösen als dies aktuell mit klassischen Algorithmen der Fall ist.

Egal ob mit KI oder ohne sollte jedes Unternehmen die Genauigkeit der angebotenen Lösung mit eigenen Dokumenten testen und sich nicht auf angegebene Erkennungsraten verlassen. Bei strukturierten Dokumenten wie einer Eingangsrechnung liegen die Erkennungsraten bei gut gepflegten Daten aus dem ERP-System häufig bei Werten zwischen 90 und 99 Prozent. Das gilt in der Regel auch für andere strukturierte Dokumente aus verschiedenen anderen Branchen, zum Beispiel Kontoeröffnungsdokumente oder Versicherungsanträge.

Weiterführende Links

About the Author: Annette Stadler

Annette Stadler ist IT-Journalistin und leitet das Online-Portal ECMGUIDE.