Auswahl verschiedener Capture-Lösungen

Diese Übersicht zu aktuell 18 verschiedenen Erfassungs- oder Capture-Systemen enthält spezialisierte Lösungen für bestimmte Input-Kanäle und Tools für Multi-Channel-Input. Beim Kauf sollten Kosten, Funktionsumfang, Benutzerfreundlichkeit und Anpassungsfähigkeit eine große Rolle spielen. *Update mit Aktualisierungen zu Parashift*

Erfassungs- oder Capture-Software lässt sich individuell auswählen oder im Gesamtpaket mit Scanner, Multifunktionsgeräten und anderer Software allen voran Enterprise-Content-Management- (ECM-) Paketen erwerben. Manche Lösungen, beispielsweise von Alos und Janich & Klass, sind auf bestimmte Input-Kanäle wie Scanner spezialisiert. Andere sind Universaltools wie von Ityx und Ephesoft, die geräte- und anwendungsunabhängig Informationen erfassen – sei es beispielsweise von Smartphones, E-Mails oder Scannern.

Auch bei Erfassungslösungen gibt es immer mehr cloud-basierte Lösungen wie von Kodak Alaris und dem Schweizer Start-up Parashift. Cloud-Lösungen können vorhandene Basis-Bausteine wie zur Zeichenerkennung (OCR) und Künstlicher Intelligenz (KI) nutzen und eigenes Know-how hinzufügen.

Für Kaufinteressenten lohnt sich auch ein intensiver Blick auf die Kosten, die aufgrund verschiedener Preismodelle sehr unterschiedlich ausfallen. So gibt es Lizenzen, die entweder anwenderbasiert sind, oder sich nach dem Dokumentenaufkommen richten beziehungsweise weitere, die leistungsbasiert sind.

Außerdem kommt es bei der Lösungsauswahl sehr auf den Funktionsumfang und die Bedienfreundlichkeit an. Nur wenn sich die Software leicht bedienen lässt, arbeiten die Mitarbeitenden damit effektiv. Wichtig ist vor allem, dass sie an die bestehenden Unternehmensprozesse angepasst wird und zum Unternehmen passt.

Alos Scan unterstützt das Produktions-Scannen

Hilfreich bei hochvolumigen Scan-Prozessen: Alos Scan (Bild: Alos)

22145-alos-scan

Hilfreich bei hochvolumigen Scan-Prozessen: Alos Scan (Bild: Alos)

Die Software »Alos Scan« ist eine Eigenentwicklung des ECM-Systemintegrators Alos, die besonders auf die Unterstützung des Produktions-Scannens ausgerichtet ist, aber auch E-Mails und andere externen Quellen berücksichtigt. Sie beschleunigt Produktions-Scan-Prozesse und verbessert durch bestimmte Erkennungs- und Auslesemechanismen die Extraktions- und Datenqualität.

Alos Scan verfügt über einen modularen Aufbau und eine intuitive Bedienerführung. Sie kann nahezu alle Beleg-Scanner anbinden und hat keine Volumenbegrenzung der Belegmenge. Zur Einzelplatzlizenz bietet Alos eine Netzwerklizenz mit einem Scan- und Indizierarbeitsplatz an. Statt weitere Vollversionen zu erwerben, skalieren Anwender ihre Produktions-Scan-Umgebungen kostenoptimiert durch den Erwerb von  Lizenzen für weitere Scan- und Indizierstationen.

Mit Alos Scan ist eine intelligente parallele Stapelverarbeitung möglich. Während des Scannens an einem oder mehreren Arbeitsplätzen, lässt sich im Hintergrund bereits ein automatischer Indizier- oder Exportschritt starten. Dies kann auf demselben oder einem anderen Arbeitsplatz im Netzwerk erfolgen, wobei die Software für die Nutzung im Netzwerk optimiert ist

Als zentrales Kontrollinstrument von Alos Scan zeigt die Stapelverwaltung während des Scan-Vorgangs stets den aktuellen Zustand aller Stapel an und gibt Auskunft darüber, welche Programmschritte gerade aktiv oder abgeschlossen sind. Hier lassen sich zudem die Scanner-Parameter wie Format und Auflösung eingeben, das Scannen von Stapeln starten, unterbrechen und löschen sowie darüber hinaus die automatischen Bildbearbeitungs- und Indizierungsfunktionen definieren. Eine auswertbare Log-Datenbank protokolliert jeden Schritt.

Alos Scan wird zur Installation mit vordefinierten Masken (Templates) und Stapeldefinitionen für Standard-Workflows ausgeliefert. Der Anwender kann die Masken verändern oder über Parameter Arbeitsabläufe neu definieren. Mit Hilfe des Maskengenerators lässt sich die Bearbeitung von Belegstapeln flexibel gestalten, indem beispielsweise Indexfelder, Trennkriterien und Parameter für das Löschen von Trennseiten festgelegt werden können.

Über Import- und Exportfunktionen unterstützt die Lösung bei der Verarbeitung von Scans externer Systeme und E-Mail-Eingängen, dem automatischen Erkennen und Auslesen von Informationen (unter anderem OCR, Barcode und Patchcode) genauso wie bei der Übergabe der eingelesenen Daten zur Weiterverarbeitung an unterschiedliche Folgesysteme wie DMS-, CRM-, ERP-, E-Mail- oder FileShare-Lösungen. Auch eine Anbindung zu Microsoft SQL-Servern ist möglich, so dass ergänzende Informationen aus Datenbanken im- und exportiert werden können.

In seiner Anfang 2022 veröffentlichten Version unterstützt Alos Scan Anwender und Anbieter von Scandienstleistungen bei der Umsetzung der TR-RESISCAN (TR-RESISCAN ready) durch die automatische Generierung des Transfervermerks. Über die im Transfervermerk enthaltenen Informationen lassen sich alle Schritte des Scan-Prozesses detailliert nachverfolgen, wodurch ein Ersatz der Papieroriginale durch die gescannten elektronischen Kopien ausdrücklich rechtlich erlaubt wird.

Mit der Technischen Richtlinie BSI TR-03138 »Ersetzendes Scannen (RESISCAN)« gibt das Bundesamt für Sicherheit in der Informationstechnik (BSI) Spezifikationen für informations- und rechtssichere Scan-Prozesse vor. Für die meisten Wirtschaftsbereiche genügt es, sich beim ersetzenden Scannen an die Vorgaben der GoBD zu halten. In der Justiz, der öffentlichen Verwaltung und dem Gesundheitswesen wird aber zum Teil auf die strengeren Vorgaben von TR-RESISCAN Wert gelegt.

Mit den zusätzlichen Modulen »ALOS Analyze« und »ALOS Touch« erhalten Anwender zudem optimierte Funktionalitäten für das Erkennen, Klassifizieren und Auslesen von Dokumenten.

Alos Analyze automatisiert diese Prozesse durch OCR-Texterkennung und die Zuordnung von Schlagworten zu bestimmten Dokumententypen. Eine schnellere Bearbeitung von Dokumenten sowie die Reduzierung der manuellen Zuordnung führen zudem zu einer geringeren Fehlerquote.

Mit Alos Touch können Anwender nicht identifizierbare Dokumente durch intuitive Bedienung per Maus oder Touchscreen manuell klassifizieren und direkt Ordnern oder Personen zuordnen.

Im Einsatz ist Alos Scan beispielsweise im HR-Bereich bei Henkel und beim Finanzdienstleister Hoist zur Digitalisierung des Posteingangs.

Amagno magnetisiert Dokumente

In Amagno kann jeder Nutzer ohne Mehrpreis Dokumente klassifizieren (Bild: Amagno)

22145-capture-amagno

In Amagno kann jeder Nutzer ohne Mehrpreis Dokumente klassifizieren (Bild: Amagno)

Das Enterprise Content Management System (ECM-System) AMAGNO vom gleichnamigen Hersteller enthält ein eigen entwickeltes Capturing- und Klassifizierungswerkzeug, das auch Zeichenerkennung (OCR) beinhaltet, welches nicht seitenlimitiert ist. Jeder Amagno-Nutzer kann grundsätzlich das Klassifizieren und Tagging beziehungsweise Strukturieren mittels Schlagworten vornehmen, das Amagno ürsprünglich »Magnetisieren« nannte. Der Nutzerkreis lässt sich durch entsprechende Rechtevergabe aber auch einschränken. Alle Eingangsquellen wie Dateien, E-Mails und gescannte Belege können berücksichtigt werden.

Das Klassifizieren geschieht,  indem der Anwender Dokumenttypen und Werte anklickt und zu bereits festgelegten Merkmalen zuordnet beziehungsweise diese Merkmale im gleichen Arbeitsschritt kurz definiert. Die daraus entstehende »Schwarmklassifizierung« hat eine schnelle Automatisierung der Ablage des gesamten Unternehmens zur Folge.

Wenn man Amagno nicht als ECM einsetzt, sondern nur die Capturing- und Klassifizierungsfähigkeiten nutzen möchte, lassen sich alle Dateien und Meta-Daten via XML, CSV oder Restful API exportieren. Ebenso können die Daten direkt an einen externen Web-Service, zum Beispiel ein anderes ECM-System, übergeben werden.

Amagno gibt es als komplettes ECM in der Cloud (AMAGNO Business Cloud). Alternativ ist die Software als On Premise auf der Windows-Plattform verfügbar. Zu den Kunden zählen EWE, Lürssen Werft und Unilift.

Dvelop-Lösung für eigenes ECM-Repository und Fremdsysteme

d.capture batch von d.velop ist modular aufgebaut (Bild: Dvelop)

22145-dvelop-dcapture-batch

d.capture batch von d.velop ist modular aufgebaut (Bild: Dvelop)

Die selbst entwickelte Lösung »d.capture batch« von d.velop ist für die Repositories der ECM-Lösungen »d.3ecm« und »ecspand« ausgelegt. Laut Dvelop kann es mit geringem Customizing auch in weitere Content-Repositories implementiert werden, so dass die Lösung unabhängig vom ECM-System einsetzbar ist. Dcapture Batch ist modular aufgebaut und verarbeitet gescannte Dokumente stapelorientiert. In sogenannten Stapelklassen wird für Dokumente gleicher Art wie Rechnungen und Lieferscheine eine  Verarbeitungskette festgelegt, welche Module in welcher Reihenfolge zur Bearbeitung der Stapel aufgerufen werden sollen. In der Administration von Dcapture Batch werden diese veränderbaren Stapelklassen zentral verwaltet und stehen so zur Ausführung in Verbindung mit den passenden Dokument-Typen.

Mittels des Scanmoduls lassen sich Papierdokumente digitalisieren. Eine integrierte Barcode-Erkennung bietet dabei die Möglichkeit, Einzelseiten automatisiert zu Dokumenten zusammenzufassen. Leerseiten werden erkannt und automatisch entfernt. Sind Seiten oder Dokumente verdreht eingescannt, werden diese automatisch korrekt ausgerichtet.

Das Auge des Nutzers erkennt Dokumente auch anhand ihrer Farbgebung, die OCR erkennt Buchstaben am besten in schwarz/weiß. Darum unterstützt Dcapture Batch bei vielen Scannertypen für farbige Dokumente die Multistreamfunktion. Mit dieser Funktion werden beim Scannen mehrere Bilder erzeugt. Ein Farbbild für die optische Anzeige und ein Schwarz/Weiß-Bild für die OCR-Verarbeitung.

Im nächsten Schritt werden mit der bereits integrierten OCR-Erkennung (ein funktional erweitertes OCR-Tool ist optional als Zusatzmodul erhältlich), Informationen aus den Dokumenten ausgelesen. Die so ermittelten Indexwerte können mit den verwendeten Datenbanken, CRM- und ERP-Systemen abgeglichen werden, um die Datenqualität zu steigern. Die ausgelesenen Indexwerte lassen sich entsprechend der zugehörigen Stapelklasse individuell gestalten. Ausgelesene Werte werden im Indexierungsmodul angezeigt. Bei eventuell aufgetretenen Unstimmigkeiten können Nutzer hier manuell nacharbeiten und dabei auch auf Drittsysteme zugreifen.

Nach der Indexierung werden Dokumente und Seiten für die  Übergabe an die nachfolgenden Systeme bereitgestellt. Das Exportmodul bereitet die Daten so auf, dass Dokumente und Indexwerte direkt an das Repository übergeben werden. Für Fach-, CRM- oder ERP-Systeme können darüber hinaus mit der Scripting-Engine auch spezifische Export-Varianten erstellt werden. Beim  Export  können Nutzer zwischen verschiedenen TIFF- und PDF-Formaten wählen, darunter auch PDF-Searchable, in dem mittels einer Volltextsuche nach Begriffen recherchiert werden kann. Um Speicherplatz zu sparen, lassen sich PDF-Exporte mit dem Zusatzmodul MRC stark komprimieren. Die exportierten Daten können nicht nur über die API, sondern auch im Dateisystem abgelegt oder direkt an einen FTP-Server übertragen werden.

Dcapture ist direkt beim Hersteller und über die Partner im »d.velop competence network« als Kauflizenz und Mietlizenz on premises verfügbar. In der Cloud-Variante erfolgt die Abrechnung pro User pro Monat.

Zu den Referenzkunden zählen unter anderem Zentis, Weber, JAB Josef Anstoetz und Eismann Tiefkühl-Heimservice.

Cloudbasierte App-Lösung für Input-Auftgaben (Bild: Dvelop)

22145-dvelop-inbound-scan

Cloudbasierte App-Lösung für Input-Aufgaben (Bild: Dvelop)

Neben Dcapture Batch bietet Dvelop  auch die App »d.velop inbound scan« als cloudbasierte Scan- und Klassifizierungslösung, mit der Anwender Papierbelege über einen intuitiven Dialog digitalisieren und mit anderen elektronischen Belegen zusammenfassen können. Über eine von Dvelop standardmäßig angebotene API lassen sich lokale wie auch Netzwerkscanner anbinden und Dateien über einen Importdialog importieren, so dass beispielsweise das stapelweise Erfassen gesammelter Papierpost möglich ist. Nach dem Scannen lassen sich Seiten hinzufügen oder löschen, drehen oder in eine andere Reihenfolge bringen.

Die Dokumententrennung bei der Stapelerfassung von Schriftstücken wie Rechnungen, Belegen, Lieferscheinen oder allgemeinen Schriftwechseln erfolgt manuell oder auf Basis von künstlicher Intelligenz. Wenn der optionale KI-Dienst gebucht wurde, analysiert das System automatisiert die Dokumente und schlägt dem Anwender passende Kategorien vor. Welche Seiten wie zu Dokumenten zusammengefasst werden und in das ECM-System überführt werden sollen, entscheiden die Anwender dank der Checkboxen im Dialog selbst.

Für den Export stellt Dvelop einen Erweiterungspunkt und eine API bereit, damit sich Dritte als Repository oder Fachprozess zum Beispiel Postverteilung oder Eingangsrechnungsverarbeitung anbinden können. Weitere Anbindungen wie an SAP oder SharePoint online sind gerade in Vorbereitung.

Die Bereitstellung der kompletten Lösung ist ebenso wie das Einscannen selbst kostenfrei. Abgerechnet wird nach tatsächlicher Nutzung, abhängig von der Anzahl der Dokumente, die tatsächlich weiterverarbeitet und in ein ECM-System oder Drittsystem überführt werden. Unternehmen mit hohem Dokumentenaufkommen zahlen ab 2 Cent pro Dokument.

Die Nutzung kann als Cloud-Service rein in der »d.velop cloud« erfolgen und aus beliebigen Anwendungen und Plattformen heraus angesprochen werden. Kunden mit einer On-Premises-Installation nutzen den Service einfach als Hybrid-Dienst.

Dvelop Inbound Scan ist der erste Service aus der »d.velop inbound suite«. In den nächsten Monaten sollen noch weitere Services für den Import von Dokumenten folgen wie ein Postfach, über das der Kunde seine Rechnungen direkt in die Dvelop cloud importieren kann. Aber auch eine E-Mail-Postfach-Überwachung und eine Dateisystem-Überwachung sind vorgesehen, damit alle Belege eines Unternehmens über die Dvelop Inbound Suite verarbeitet werden können.

ECM-Hersteller Easy mit umfangreicher Erfassungslösung

22145-EASY-Capture-Center

Für die einheitliche Erfassung von Dokumenten aus unterschiedlichen Quellen steht »EASY Capture Plus« von easy. Das Leistungsspektrum umfasst die Erfassung von Papierbelegen per Scan, von Dokumenten direkt aus Office-Anwendungen heraus, aus E-Mail Systemen oder aus dem Dateisystem heraus sowie aus Druckdatenströmen. Mit dem Extraktionsmodul extrahiert und erkennt Easy Capture Plus automatisch Daten und Inhalte aus den eingehenden Dokumenten über einen für alle Quellen einheitlichen Weg. Nach der Erfassung und Extraktion der Daten übergibt Easy Capture Plus per integrierten Transaktionsmanagement alle Inhalte an nachfolgende Systeme.

Die flexiblen Funktionsmodule erlauben, dass sich die Lösung in unterschiedliche Unternehmensprozesse integrieren lässt. So gibt es »EASY Capture Plus – Scan« für effizientes Scannen von Papierbelegen inklusive Heftung. Die Anbindung an Hochleistungsscanner ist über Standard-Schnittstellen möglich. »EASY Capture Plus – Batch« regelt die Verarbeitung von Dokumenten aus dem Filesystem zur Massenverarbeitung umfangreicher Dateibestände. »EASY Capture Plus – Mail« sorgt für die automatische prozessorientierte Verarbeitung von E-Mails und Dokumenten aus diesen heraus. Unterstützt werden zum Beispiel »Microsoft Exchange«, »Tobit David«, »MIMEsweeper« und »GroupWise«. »EASY Capture Plus – Office« regelt die interaktive Erfassung von Office-Dokumenten aus »Microsoft Office« und »Open Office«, sowie dem »Windows Explorer«. »EASY Capture Plus – Print« löst die Erfassung von Dokumenten aus allen auf Windows basierenden Anwendungen beim Drucken.

In Abhängigkeit vom Erfassungsvolumen erfolgt die modulweise Lizenzierung. Unabhängig von der Quelle kann eine automatische Konvertierung in verschiedene Exportformate, wie etwa in das für die Langzeitarchivierung geeignete PDF/A erfolgen.

»EASY Capture Read« erlaubt das Lesen von Inhalten aus PDF und Bilddateien per OCR und Barcode. Das Designstudio zur Erstellung der Projektszenarien ist im WYSIWYG-Stil gestaltet. Es stehen alle benötigten Funktionen wie Splitting, zonenbasierte Inhaltsgewinnung, mit direkter und indirekter, sowie stichwortbasierte Festlegung,  Scripting, Datenbankrückgriffe und unter anderem auch die Verwendung von regulären Ausdrücken zur Verfügung. So lassen sich Szenarien zur Extraktion etwa von Rechnungen, Lieferscheinen und ähnlichem realisieren. Mit »Capture Verify«, einer im Capture Scan-Client integrierten interaktiven Validierungslösung  können die Extraktionsergebnisse geprüft und gegebenenfalls korrigiert werden.

Zu den weiteren Features zählen die Möglichkeit der flexiblen und einheitlichen Erfassung von Dokumenten auch in verteilten Standorten mit zentraler Administration und der Offlinemodus, der die flexible Erfassung auch ohne dauerhafte Verbindung zum Server gestattet.

Neben einer 32-Bit-Version steht client- und serverseitig in der Version »EASY Capture Plus 5.0« eine 64-Bit-Variante bereit. Easy empfiehlt grundsätzlich den Einsatz der 64-Bit-Variante am Server, da sich aufgrund des erheblich größeren adressierbaren Speicherraums sehr große Dokumente effizient verarbeiten lassen.

Easy Capture Plus wurde von Easy Software gemeinsam mit dessen Partner CTO Balzuweit aus Stuttgart, als Nachfolgeprodukt für »EASY Capture« entwickelt und 2011 veröffentlicht.

Das Produkt ist heute bei über 3.000 Kunden – darunter Lidl, DHL, Delphi Automotive und Rossmann – im Einsatz.

Ephesoft mit Cloud-Lösung für verschiedene Input-Kanäle

22145-Ephesoft

Das Capture-Produkt »Ephesoft Transact« des von Kofax aufgekauften Anbieters Ephesoft basiert auf einer Open-Source-Architektur und kann auf Windows- und Linux-Betriebssystemen arbeiten. Die Java-basierte, offene Architektur, die branchenspezifische Werkzeuge nutzt, stellt sicher, dass Kunden nicht an proprietäre Technologien gebunden sind. Die Anwendung  bietet die Möglichkeit, Dokumente automatisiert zu verarbeiten, zu klassifizieren, Informationen zu extrahieren, zu validieren und zu exportieren.

Die Capture-Software ist von Grund auf für das Web entwickelt, agiert selbstlernend und ist skalierbar. Aufgrund der Mandantenfähigkeit lassen sich verschiedene Standorte eines Unternehmens getrennt auswerten. Die Capturing-Lösung automatisiert die Dokumenten-Erfassung und bietet alle klassischen Features, um unstrukturierte Daten in verwertbare Informationen zu verwandeln. Von gemischter Eingangspost über Prüfbögen und Anträgen bis zu Eingangsrechnungen und Patientenakten reichen die verarbeiteten Dokument-Typen.

Ephesoft unterstützt ein breites Spektrum an Eingangskanälen wie Scanner, MFPs, Fax, Verzeichnisse und E-Mail. Über die »SnapDoc App« für »iOS« und »Android« können auch mobile Geräte in die Dokumentenerfassung einbezogen werden. Dank der offenen Architektur lassen sich beliebige Zielsysteme integrieren wie Dokumenten- und Enterprise-Content-Management-Systeme, Enterprise- Ressource-Planning-Werkzeuge und Datenbanken. Eine besondere Einbettung bietet Ephesoft für Lösungen von Box, Salesforce und Microsoft – insbesondere für »SharePoint« in lokaler als auch der Online-Variante.

Neben der klassischen Texterkennung (OCR) beherrscht Ephesoft Transact die Extraktion intelligenter Zeichenerkennung (ICR, Intelligent Character Recognition) und optischer Markierungserkennung (OMR, Optical Mark Recogition). Beides ist für On-Premises-, Hybrid- und Cloud-Lösungen verfügbar und in der Benutzeroberfläche integriert. Zudem verfügt die Lösung über KI-Handschrifterkennungsfunktionen, die Druck- und Schreibschrift erkennt. Hinzu kommt ein »Table Rule Builder«, mit dem die Extraktion von Positionsdetails in Tabellen auch für technisch nicht versierte Mitarbeiter zu realisieren ist. Eine geführte In-App-Konfigurationsfunktion hilft Administratoren, die zu extrahierenden Positionsinformationen zu identifizieren. Transact erstellt dann automatisch die Extraktionsregeln und wendet sie auf alle nachfolgenden Dokumente an, die von demselben Lieferanten eingereicht werden.

Brainware von Hyland mit Spezialmodul für Rechnungserfassung

Hyland führt die Capture-Lösung Brainware wieder unter ihrem ursprünglichen Namen (Bild: Hyland)

22145-Hyland-Brainware

Hyland führt die Capture-Lösung Brainware wieder unter ihrem ursprünglichen Namen (Bild: Hyland)

Der Anbieter von Lösungen für Enterprise Content Management (ECM) und Content Services Hyland bietet die Capture-Lösung »Brainware« an, die vormals unter dem Namen »Perceptive Intelligent Capture« von Lexmark vertrieben wurde. Hyland führt das Produkt seit der Akquisition des Perceptive-Geschäftsbereichs 2017 unter seinem ursprünglichen Namen Brainware im Portfolio und entwickelt es seither kontinuierlich weiter.

Brainware umfasst die gesamte Prozesskette – von der Dokumentenerfassung über Klassifizierung, Datenextraktion und Validierung bis hin zum Export. Die Software extrahiert und erfasst relevante Informationen aus verschiedenen Arten von Dokumenten – papiergebunden oder elektronisch – und unterstützt ein breites Spektrum an Eingangskanälen.

Zur Klassifizierung der Dokumente nutzt Brainware optische Zeichenerkennung (OCR, Optical Character Recognition) sowie intelligente Erfassungs- und Extraktionsfunktionen. Diese erkennen um welchen Dokumententyp es sich handelt und klassifizieren das Dokument beispielsweise als Rechnung oder Bestellformular.

Die Software benötigt dazu keine Templates und verlässt sich nicht ausschließlich auf traditionelle Extraktionsmethoden wie der Verwendung von Schlüsselwörtern und Ankerpunkten. Stattdessen erkennt die Lösung Muster und Ähnlichkeiten und extrahiert Daten entsprechend.

Brainware ist mit der bereits vorhandenen Erfassungsstruktur einsetzbar – einschließlich Multifunktionsgeräten (MFPs) und Scannern aller Hersteller, E-Mail- und Fax-Servern sowie anderer Technologien. Die Daten können in unterschiedlichen Formaten (XML, EDI, CSV, TXT, DBF und XLS) mit anderen Business-Applikationen ausgetauscht werden.

Zudem ist eine Integration mit Datenbanken, ERP-Systemen sowie ECM- und Content Services Plattformen möglich. So können Dokumente automatisch indiziert und direkt in den Workflow geroutet werden.

Brainware erlaubt dem Nutzer Einblicke in die Prozesse, zum Beispiel in Form von Anzeigen des Dokumentenflusses in Management Dashboards und mittels Tracking des Dokumentenstatus. Zudem liefert die Lösung Analysen und Statistiken, die Auskunft über die Leistung des Systems geben. Dies ermöglicht es Unternehmen, Erfolge zu messen und nachzuweisen und unterstützt die kontinuierliche Verbesserung der Extraktionsgenauigkeit sowie die Beschleunigung der Prozesse.

Für die Erfassung von Rechnungen steht das Spezialmodul »Brainware for Invoices« zur Verfügung. Diese Lösung ermöglicht unter anderem bei Rechnungen ohne Bestellbezug das Anhängen von Codes durch Abgleich der Daten mit anderen Bilanzposten. Zudem können automatisch Anbieter- und Lieferantennummern aus der Anbieter-Master-Datei für Rechnungen vergeben werden.

Brainware ist direkt bei Hyland oder über das Hyland-Partnernetzwerk erhältlich und kann On-Premises oder aus der Cloud bereitgestellt werden. Die Abrechnung erfolgt lizenz- oder volumenbasiert.

Brainware ist heute bei 370 Kunden weltweit im Einsatz, darunter Siemens, Shell und Airbus.

Ityx bietet AI Platform für Omnichannel-Lösungen

Funktionsweise der Omnichannel-Lösung von Ityx (Bild: Ityx)

22145-Ityx-Schema

Funktionsweise der Omnichannel-Lösung von Ityx (Bild: Ityx)

Die »AI Platform« von ITyX ist eine Omnichannel-Workflow- und-Integrationsplattform, die mittels Künstlicher Intelligenz (KI) und maschinellem Lernen Inhalte erfasst und weiterleitet. Dabei sind regelbasierte, bildbasierte und zonale Klassifikation im Prozess kombinierbar. Unabhängig von Eingangskanal, Sprache, Art und Struktur analysiert und versteht die Lösung textbasierte Inhalte beispielsweise im Posteingang oder im Kundenservice. In Verbindung mit den Ityx Front-End Produkten oder Dritt-Anwendungen erfasst sie Textinformationen und transferiert sie zu Geschäftsprozessen und Drittsystemen.

So kann die Lösung in einer Enterprise Content Management (ECM) Software alle Input-Kanäle wie E-Mail, Brief-Post, Web, Social Media innerhalb und außerhalb des Unternehmens zusammenführen. Im Customer Experience Management lassen sich kontextuelle Kunden- und Vorgangsinformationen erfassen, um Serviceprozesse auszulösen.

Nachdem die AI Platform aus allen Servicekanälen und Routinevorgängen antrainiert wurde, kann sie eingehende Korrespondenz den richtigen Serviceprozessen, Zuständigkeiten und Service-Level zuordnen. Die für den jeweiligen Serviceprozess relevanten Daten werden den Korrespondenzinhalten mittels semantischer Extraktionsverfahren automatisch entnommen und mit Daten aus den Bestandssystemen angereichert. Die Textinhalte können aus folgenden Dateiformaten stammen: PDF, TIFF, JPEG, PNG, MSG, DOC, HTML, wobei der Ex- und Import diese Schnittstellen unterstützt: FTP, SFTP, FTPS, E-Mail (IMAP, POP3), File, VFS, WEBDAV und WEBDAVS.

Werden die für den Serviceprozess definierten Konfidenzwerte nicht erreicht, erfolgt zur Sicherheit eine manuelle Nachbearbeitung. Das Ergebnis dieser Qualitätssicherung fließt dynamisch in die Verbesserung der AI Datenbasis ein, so dass der Wirkungsgrad der Automation während des Betriebs wächst. Der Vorgang wird nun an »MAILROOM« von Ityx oder eine andere genutzte Case Management Software übergeben. Es ist ein verteilter Betrieb auf mehreren Servern möglich.

Die Kosten für die AI Platform als Service beginnen bei 3,5 Cent je Vorgang inklusive Wartung und Support. Darin sind Features wie ein integrierter OCR-Service, ein Process Automation Kit und ein Workflow Designer enthalten.

Dpuscan von Janich & Klass steuert unterschiedliche Scanner parallel

Die Variante QSI unterstützt die Qualitätssicherung (Bild: Janich & Klass)

22145-Janich-und-Klass-Dpuscan

Die Variante QSI unterstützt die Qualitätssicherung (Bild: Janich & Klass)

Die Scan-Software »DpuScan« von Janich & Klass Computertechnik ist sowohl für zentrale Scan-Lösungen mit hohem Durchsatz und großem Volumen als auch für dezentrales, abteilungsbezogenes Arbeiten konzipiert. Sowohl für Single-, Dual- als auch für Multistream-Verarbeitung bietet Dpuscan Funktionen zur Scanner-Steuerung, Imagebearbeitung und Speicherung der gescannten Bilder. Neben der Anbindung an die »XINO Scanner« von Janich & Klass werden über die Schnittstellen ISIS und Twain viele weitere Dokumentenscanner unterstützt. Damit bietet Dpuscan die Möglichkeit, mit einer Software auch einen heterogenen Gerätepark inklusive der Qualitätssicherungsplätze zu betreiben. Jedoch kann die Software auch als Einzelplatz-Lizenz erworben werden.

Ab der Version 6.0 kann Dpuscan zwei unterschiedliche Scanner aus einem Scanprofil ansteuern wie Durchlauf- und Großformat-/Planscanner. Der Anwender wechselt per Tastendruck im gewählten Profil zwischen den beiden Scannern, so dass alle Unterlagen, von herkömmlichen Dokumenten bis hin zu großformatigen Zeichnungen oder geösten Verträgen, fortlaufend in einem Verzeichnis digitalisiert vorliegen. Ein aufwändiges Nachbearbeiten des Belegstapels an einem anderen Verarbeitungsplatz mit Umsortierung der Reihenfolge oder Einfügen und Ersetzen eines Platzhalter-Papiers entfällt.

Dpuscan steht mit den Varianten »DpuScan Office« und »DpuScan Expert« in zwei verschiedenen Betriebsarten zur Verfügung. Dpuscan Office ist mit vordefinierten Einstellmöglichkeiten schnell konfiguriert und eignet sich für Standardanwendungen. Für komplexe und anspruchsvolle Anwendungen bietet die Variante Dpuscan Expert viele Konfigurationsmöglichkeiten.

Der »Document-Explorer« liefert eine komfortable Ansicht der Dokumentenstruktur mit einer variablen Betrachtungsweise eines mehrseitigen Dokuments, wahlweise linksbündig, rechtsbündig oder randorientiert. Eine optisch unterstützte Darstellungsform von zusammengehöriger Vorder- und Rückseite eines Beleges unterstützt das Arbeiten.

Für verschiedene Einsatzzwecke stehen unterschiedliche Programmvarianten zur Verfügung. Nach Funktionalität unterschieden werden die Varianten »Standard«, »Professional« und »Gold«, die die Scanstationen in voller Geschwindigkeit unterstützen. Die Variante »QSI« bedient die Qualitätssicherung und die auf einen separaten Arbeitsplatz ausgelagerte Indexierung während das Modul »DpuClassify« für die Belegklassifizierung konzipiert ist. Für Stationen mit weniger leistungsfähigen Scannern gibt es die geschwindigkeitslimitierten »GL Varianten«. »DpuServer« bietet die Möglichkeit, basierend auf Stationsgruppen Lizenzen und/oder Profile zu verteilen. Die Lizenzen sind für die dynamische Verteilung als Floating Lizenzen verfügbar.

Webbasierte Erfassungslösung plus mobiler App von Kodak Alaris

Erfassungssoftware, die auch Nicht-Kodak-Scanner versteht (Bild: Kodak Alaris)

Erfassungssoftware, die auch Nicht-Kodak-Scanner versteht (Bild: Kodak Alaris)

Die webbasierte, mobile Erfassungsanwendung »Info Input Solution« von Kodak Alaris ermöglicht die einfache Erfassung von Informationen per TWAIN-kompatibler Scanner, über eine App auf einem mobilen oder smarten Gerät sowie aus digitalen Dateien (einschließlich E-Mail) aus Anwendungen. Die neueste Version bietet eine erweiterte Dokumentenklassifizierung und -trennung, was die manuelle Vorbereitung verringert, da beim Scannen beispielsweise keine Trennblätter zwischen verschiedenen Dokumenten nötig sind.

Info Input Solution kann den Dokumententyp für die korrekte Verarbeitung nach dem Scannen über Klassifizierung oder Barcodes bestimmen, Skripte validieren und Datenbankabfragen durchführen, um Administratoren Flexibilität bei der Durchsetzung von Geschäftsrichtlinien zu gewährleisten.

Für mobile Android- und iOS-Geräte bietet Kodak Info Input Solution eine App, womit sich Dokumente und Belege mit dem Smartphone oder Tablet digitalisieren lassen. Die gescannten Informationen können direkt in digitale Workflows eingebunden werden.

Mit Thick-Client-ähnlicher Leistung kann die Erfassungslösung Scanner unterstützen, die 10 bis 210 Blatt pro Minute verarbeiten. Aufgrund des asynchronen Stapel-Downloads können Mitarbeiter mit der Indizierung gescannter Dokumente beginnen, während ein Stapel noch heruntergeladen wird und so Wartezeiten eliminieren.

Über Strichcode, optische Zeichenerkennung (OCR), intelligente Zeichenerkennung (ICR) oder optischer Markierungserkennung (OMR) können Benutzer den Indexierungsprozess so einrichten, dass Schlüsseldaten automatisch aus Dokumenten extrahiert werden, wodurch die Verarbeitungszeit verkürzt wird. Zudem ermöglicht die Lösung die Überwachung des Stapelstatus, um Details zu prüfen und doppelte Arbeit zu vermeiden.

Für die Indexierung und Indexvalidierung steht das optionale Modul Advanced Form Designer zur Verfügung. Dateneingabebildschirme können jetzt so gestaltet werden, dass sie wie Originaldokumente aussehen, so dass Sie Indexinformationen direkt auf dem Formular selbst eingeben oder validieren können, anstatt sie in ein Indexierungsraster einzugeben. Dies ist nützlich bei der Erfassung vieler Indexfelder oder Indexdaten, die sich auf mehreren Seiten eines Dokuments befinden, beispielsweise Bestellformulare und Anträge auf Krankenversicherung.

Die Scanfunktion kann optional innerhalb einer Geschäftsanwendung ausgeführt werden, so dass Benutzer die Anwendung zum Scannen nie beenden müssen. Die direkte Integration der Erfassung in den Geschäftsprozess reduziert Fehler und macht Informationen leichter verfügbar.

Kodak Info Input Solution basiert auf »Java«, das Webdienste für die gesamte Kommunikation mit standardmäßiger Secure Sockets Layer (SSL)-Verschlüsselung nutzt.

Beispielsweise hat ein Unternehmen Info Input Solution bei mehr als 50 Niederlassungen weltweit im Einsatz, um Rechnungen schnell und sicher zu erfassen. Der Anwender schätzt vor allem die einfache Verwaltung und Implementierung von Jobs durch das eigene IT-Personal und der damit verbundenen vollständigen eigenen Kontrolle über die Softwarelösung.

Erfassungsspezialist Kofax bietet Plattform-Lösung

22145-Kofax-Capture

Mit »Kofax Capture« von Kofax steht Unternehmen eine Plattform für die Erfassung von Dokumenten zur Verfügung. Die Lösung ermöglicht eine hochvolumige Erfassung von Dokumenten und Daten von mobilen Endgeräten, Dokumentenscannern, Multifunktionsgeräten, Email- und Faxsystemen, Webservices oder Verzeichnisstrukturen. Geschäftsprozesse können durch frühestmögliche Informationserfassung von Beginn an mit digitalisierten Dokumenten arbeiten, was sich auf die Prozesseffizienz und die Kundenerfahrung positiv auswirkt. Kofax Capture bietet über 140 Schnittstellen zu verschiedenen Fachanwendungen, Enterprise-Content-Management-, Enterprise-Resource-Planning-, Business-Process-Management- und Workflow-Lösungen an. Zur Anbindung an Business-Systeme von IBM, Oracle, Microsoft, OpenText, Hyland, Pega und weiteren Anbietern verwendet Kofax Capture Standard-Exportskripte. Der Export in ODBC-kompatible Datenbanken oder ASCII-Dateien mit Trennzeichen ist ebenso möglich. Durch den modularen Aufbau der Kofax Capture-Lösung ist eine individuelle Abstimmung auf die Bedürfnisse von Unternehmen, jeglicher Größe möglich. Die Plug-and-Play-Module reichen von automatischer Dokumententrennung über Scannen der Post und automatische Klassifizierung unstrukturierter Dokumente bis hin zu leistungsfähigen Formularverarbeitungswerkzeugen, die auch aus problematischen Dokumenten Informationen extrahieren. Zudem ermöglicht die Softwarearchitektur, die Fähigkeiten mit benutzerdefinierten Skripten auszuweiten.

Für Unternehmen, die eine hohe Verfügbarkeit und Disaster-Recovery für geschäftskritische Anwendungen benötigen, gibt es die »Kofax Capture Enterprise Edition«. Durch das Fernmanagement der Systemleistung in Echtzeit können Unternehmen auf Ausnahmen schnell reagieren und den angestrebten Datendurchsatz gewährleisten. Mittels Terminal-Services- und Citrix-Server-Technologie erweitert sich die Erfassung auf das gesamte Unternehmen. Zusätzlich bietet die Enterprise-Edition Optionen zur Nutzung von Datenbankmanagementsystemen der Enterprise-Klasse wie »IBM DB2«, »Microsoft SQL Server Enterprise« und »Oracle Database«.

Capture-Lösungen von Kofax sind unter anderem bei ABB Schweiz, DB Schenker und der Hartmann Gruppe im Einsatz. Das Lizenzmodell von Kofax Capture lässt sich in drei verschiedene Modelle unterteilen: »Volume Licences« steuert, wie viele Seiten innerhalb eines Jahres von der Kofax Capture-Installation importiert und verarbeitet werden. »Station Licenses« beschreibt die Lizenzmöglichkeit einer sogenannten Concurrent Station, die es ermöglicht, eine bestimmte Anwendung auf einer bestimmten Maschine oder Station laufen zu lassen. »Feature Licenses« betrifft die Lizensierung optionaler Komponenten, die helfen den Erfassungsprozess zu verbessern. Hierbei erfolgt eine individuelle Lizensierung der Komponenten. Grundsätzlich erfolgt eine individuelle Zusammensetzung der Preise je nach anstehendem Projekt.

Kyocera Capture Manager mit zwei Varianten für KMUs

Der Kyocera Capture Manager bietet zwei Varianten mit unterschiedlichen OCR-Engines (Bild: Kyocera Document Solutions)

22145-Kyocera-KCM

Der Kyocera Capture Manager bietet zwei Varianten mit unterschiedlichen OCR-Engines (Bild: Kyocera Document Solutions)

Unter der Bezeichnung »KYOCERA Capture Manager (KCM)« bietet KYOCERA Document Solutions ein Tool zur Optimierung von Geschäftsabläufen durch Datenerfassung. KCM unterstützt Unternehmen bei der Automatisierung von Arbeitsabläufen durch Erfassung, Verarbeitung, Klassifizierung und Weiterleitung von Dokumenten-Daten, unabhängig davon, ob sie von Papier gescannt oder digital per E-Mail, Internet oder Mobiltelefon empfangen werden.

Neben zwei Testvarianten existieren mit »Lite« und »Pro« zwei Lizenzmodelle für Unternehmensanwender. Die Lite-Version für einen Basispreis von 600 Euro richtet sich an kleinere bis mittelgroße Unternehmen mit einfachen Dokumentenprozessen für die keine Mobilität erforderlich ist und das Scan-Volumen rund 1.000 Seiten pro Monat beträgt. Zur Texterkennung verwendet sie die Optical Character Recognition (OCR) Engine »GDPicture OCR«. Für Unternehmen mit komplexeren Dokumentenprozessen, die Mobilitätsfunktionen wünschen, und ein Scan-Volumen bis 3.000 Seiten pro Monat haben, empfiehlt sich die Pro-Version. Preislich startet das Grundpaket für einen Multifunktionsdrucker bei 1.000 Euro. Soll ein zusätzlicher Multifunktionsdrucker oder eine E-Mail-Erfassung hinzukommen kostet das weitere 400 beziehungsweise 200 Euro.

Nach der Erfassung identifiziert und klassifiziert KCM den Dokumententyp, extrahiert die erforderlichen Informationen und bereitet die Daten für die Verarbeitung durch andere Systeme vor. Der KCM verfügt über verschiedene Bildkorrekturverfahren wie Ränder, Leerzeilen und leere Seiten löschen, Punkt-, Stanzloch- und Linienentfernung, Entstörung, Bildbinarisierung sowie automatische Drehung. In der Pro-Version können Texte, die aus den festgelegten Bereichen erkannt und extrahiert werden, mit dem Originalbild zusammengeführt und nachträglich korrigiert werden. Durch das Hinzufügen einer Validierungsaufgabe zu einem Scan-Workflow werden die Benutzer über eine Benachrichtigung informiert, um ein Dokument gegebenenfalls zu prüfen.

Scan-Workflows lassen sich mit einem Workflow Designer erstellen. Administratoren können Dateneingabeverfahren, Bildkorrektur, Datenerkennung, Datenextraktion und Verteilung der extrahierten Daten selbst konfigurieren. Bildkorrekturprozesse, die einem Scan-Workflow hinzugefügt wurden, werden automatisch ausgeführt. Die Benutzer kann der Administrator beispielsweise auch über Active Directory verwalten und deren Zugriff auf Scan-Workflows steuern.

Die Dokumente und extrahierten Daten können dann automatisiert an ein Dokumentenmanagement-System, an eine Finanz-/ Buchhaltungssoftware oder auch an einen Netzwerkspeicher oder Cloud Service übergeben werden.

Autostore von Nuance leitet Workflows ein

Nutzeroberfläche von Nuance Autostore aus Anwendersicht (Bild: Nuance)

22145-Nuance-Autostore

Nutzeroberfläche von Nuance Autostore aus Anwendersicht (Bild: Nuance)

Als Datacapture Middleware optimiert »AutoStore« von Nuance den Datenaustausch zwischen verschiedenen Anwendungen, indem die Software an die im Unternehmen eingesetzte Applikationen anknüpft und erweitert. Funktional gliedert sich die Lösung in die Bereiche Erfassung, Verarbeitung und Weiterleitung.

So erfasst sie elektronische und gedruckte Dokumente aus unterschiedlichen Quellen wie Multifunktionsgeräten, verschiedensten Scanner-Typen, Mobilgeräten und elektronischen Ordnern. Die Anbindung an die Scan-Hardware geschieht über die TWAIN-Schnittstelle. In moderne Displays von Scan-Geräten lässt sich die Bedienung der Autostore-Funktionen und weiterer Workflow-Prozesse via OpenAPI und Webbrowser direkt einbinden. Die Bedienfelder lassen sich sowohl als Schaltflächen mit vordefinierter Inhaltsauswahl als auch als freie Eingabefelder mit Zahlen und Text gestalten. In Echtzeit sind Anwender direkt am Display in der Lage, ihre Ordner zum Beispiel die Windows-Ordnerstruktur zu durchsuchen, auf diese zuzugreifen und den Scan-Zielordner auszuwählen.

Autostore kann die erfassten Informationen zusätzlich zu üblichen Scan-Formaten wie PDF auch in zusätzlichen Formaten als RTF- und XLS-Dateien speichern, sodass eine nachträgliche manuelle Konvertierung nicht mehr notwendig ist. Anwender können die gescannten Dokumente direkt mit den entsprechenden Programmen öffnen und weiterbearbeiten.

Über zonale Texterkennung bietet Autostore die Möglichkeit, die integrierte Texterkennung auf bestimmte Bereiche des gescannten Dokuments zu beschränken. So können bei standardisierten Lieferscheinen Kundennummern oder ähnliches automatisch ausgelesen werden. Aufgrund der Bildverbesserung lassen sich störende Elemente wie Tonerpunkte oder –linien automatisch entfernen.

Bei der Weiterleitung oder Dokumentverteilung kann der Bediener vordefinieren, wo das Dokument gespeichert werden soll. Die beispielsweise beim Scannen mitgegebenen Informationen wie Rechnungsnummern können den Dateinamen automatisch um dieses Kriterium erweitern, um eine strukturierte Ablage zu erreichen. Durch zahlreiche Konnektoren lassen sich die Dateien direkt an verschiedenste Systeme wie Datenbanken, Archiv-, DMS- und Content-Management-Systeme weiterleiten.

Opentext bietet über Captiva dezentrale Erfassungslösungen

Das Funktionsprinzip von Opentext Captiva (Bild: Opentext)

22145-Opentext-Captiva

Das Funktionsprinzip von Opentext Captiva (Bild: Opentext)

Mit »Captiva Capture« bietet OpenText eine Erfassungslösung, die pro Tag mehrere Tausend bis zu mehrere Millionen von Dokumenten für unterschiedliche Applikationen und Zwecke verarbeiten kann. Die Ende-zu-Ende-Capture-Lösung deckt die Bereiche Erfassung, Klassifizierung, Datenextraktion, Informationsauswertung und Weiterleitung an nachgelagerte Systeme ab. Unabhängig ob Informationen zentral oder verteilt sind, ermöglicht Captiva Capture die Erfassung von Papier, elektronischen Dateien und Datenquellen, wandelt sie in digitalen Content um und leitet sie an Back-End-Systeme und Content-Repositories weiter.

Um verteilte Anwendungen ortsunabhängig zu unterstützen, besteht die Möglichkeit verteilte Capture Server an verschiedenen Orten wie unterschiedlichen Posteingangsstellen und im zentralen Back-Office-Bereich zu nutzen, wo hohe Volumina anfallen. Mit dem Web Client lassen sich einzelne Filialen, Servicepunkte und Außendienstmitarbeiter an der Stelle, wo papierbasierte Informationen oft erstmals ankommen, für das Scannen und die Indexierung ausrüsten.  Dabei werden Sicherheitsmaßnahmen, Anwenderprofile und auch komplexe Workflows zentral über den Captiva-Server gemanagt, der nicht vor Ort installiert sein muss.

Noch im Laufe des Jahres 2019 plant Opentext einige Veränderungen und Neuerungen für Captiva, das ursprünglich 2017 über die Akquisition der Enterprise-Content-Division (ECD) von Dell/EMC ins Unternehmen kam und über viele namhafte Kunden verfügt. So nutzen laut Opentext weltweit mehr als 5.000 Unternehmen und Organisationen wie in Deutschland BASF im Personal- und Posteingangsbereich, BMW für das Leasing- und Vertragsmanagement und die Commerzbank für die Belegerfassung von hunderten Millionen gescannter Dokumente im Jahr Captiva.

2019 sollen nun die Technologien von »OpenText Capture Center« und »Captiva Capture« über das neue Produkt »OpenText Capture« näher zusammen gebracht werden, so dass sie sich gegenseitig ergänzen.Opentext plant sowohl Opentext Capture Center als auch Captiva Capture mit Services und Restful APIs anzureichern, damit man von einem Produkt Funktionen des anderen Produkts aufrufen kann. Für die Kunden soll sich damit eine deutliche Leistungssteigerung ergeben. Im Sicherheitsbereich ist zusätzlich zur verschlüsselten Übertragung der Daten eine dauerhafte Verschlüsselung auf Applikationsebene angekündigt. Auf Cloud-Ebene sind ebenfalls Veränderungen angekündigt: Im zweiten Quartal soll neben Microsoft Azure auch AWS unterstützt werden. Um die Erkennungsraten zu verbessern, will Opentext im vierten Quartal neue Methoden für maschinelles Lernen integrieren.

Das Lizenzierungs- und Bereitstellungsmodell bietet vier Server-Bundles: »Enterprise«, »Standard«, »Basic Recognition« und »Advanced Recognition«, zu denen zusätzliches Seitenvolumen gekauft werden kann. Mit »Captiva Scan Client«, »Captiva Attended Client« und »Captiva Web Client« stehen drei Clients zur Verfügung.

Parashift arbeitet mit Schwarmintelligenz

Nutzeroberfläche von Nuance Autostore aus Anwendersicht (Bild: Nuance)

25212-parashift-pp-extraction

Mit dem Cloud-Dienst von Parashift lassen sich zum Beispiel Rechnungsdaten auslesen (Bild: Parashift)

Das Schweizer Unternehmen Parashift wurde 2018 gegründet und bietet seine Online-Plattform zur Datenextraktion seit 2021 als Service an. Die Lösung basiert auf »Google Cloud« und nutzt OCR-Services von Google. Darauf bauen Machine-Learning-Lösungen von Parashift auf, die Schwarmintelligenz nutzen. Parashift bietet die Lösung als Cloud-Plattform-Produkt mit Servern in der Schweiz, wenngleich im Rahmen der Enterprise Edition auch On-Premise-Optionen möglich sind.

Jede Sprache, die eine Variante der lateinischen Schrift verwendet, wird out-of-the-box unterstützt. Die beliebtesten Sprachen, die von Kunden verarbeitet werden, sind derzeit Deutsch, Französisch, Italienisch, Englisch, nordische Sprachen (Dänisch, Norwegisch, Schwedisch, Finnisch), Spanisch, Portugiesisch, Tschechisch, Slowakisch, Polnisch, Ungarisch und Rumänisch. Mit einigen Anpassungen kann die Parashift Plattform auch andere Zeichensätze wie Chinesisch verarbeiten. Die Benutzeroberfläche von Parashift unterstützt derzeit nur Englisch

Die Parashift Plattform kann schon seit dem Start über eine REST-API in jede bestehende IT-Infrastruktur und Software integriert werden. Außerdem arbeitet Parashift mit Lösungspartnern zusammen, die die Plattform in Standardsoftwarelösungen wie ECM, BPM, RPA oder ERP-Systeme integrieren. Im ECM-Umfeld kooperiert das Schweizer Unternehmen beispielsweise mit DocuWare, ELO Digital Office und M-Files, im CRM-Bereich mit BSI und im ERP-Sektor mit SAP. Zu den Kunden von Parashift zählen swisscom, Axa und BMW.

Das Pricing von Parashift basiert auf verschiedenen Faktoren wie gewünschtes Supportlevel, Onboarding und Schulung sowie dem Volumen-Kontingent an Seiten zur Verarbeitung pro Jahr. Der Seitenverarbeitungspreis kostet maximal 10 Cent und sinkt je mehr Verarbeitungskontingent auf einmal eingekauft wird. Der Einstiegspreis beträgt 6.000 Euro netto pro Jahr und beinhaltet sämtliche Kosten für die Verwendung der Lösung.

Paperstream Capture Pro von PFU mit lebenslanger Lizenz

Aufgaben die PFU-Software Paperstream Capture Pro lösen kann (Bild: PFU)

23543-PFU-Paperstream-Capture-Pro

Aufgaben die PFU-Software Paperstream Capture Pro lösen kann (Bild: PFU)

In Kombination mit den Dokumentenscannern der »fi Series« und »SP Series« sowie weiteren Erfassungsgeräten können Firmen und Behörden mit der Software »PaperStream Capture Pro« von PFU Papier-basierte Informationen und Dokumente digital erfassen.

Auch Altdaten von Faxgeräten werden für eine standardisierte Erfassung akzeptiert und durchlaufen die gleichen Prozesse für Bildverbesserung, Qualitätskontrolle und Verarbeitung. Paperstream Capture Pro verwaltet die Metadaten gescannter Dokumente. Diese Metadaten werden nach der Verifizierung verwendet, um die gescannten Dateien gemäß voreingestellter Regeln und Benutzerprofile an den gewünschten Backend-Speicherort weiterzuleiten, entweder an lokale oder Cloud-basierte Repositories oder an ECM- oder DMS-Workflows.

Der »Multi-Station-Modus« erlaubt es Administratoren, bis zu sieben Anwendern identische Einstellungen zu vergeben und somit Arbeitsabläufe zu dezentralisieren. Die Ressourcen zur Erfassung können je nach Struktur, Ort und Größe einer Organisation flexibel erweitert werden, um die Arbeitsbelastung zu verteilen. Gleichzeitig lassen sich die einzelnen Phasen des Erfassungsprozesses, zum Beispiel Extraktion, Bestätigung oder Übermittlung der Daten an den betreffenden Wissensarbeiter delegieren. Paperstream Capture Pro verfügt über eine lebenslange Lizenz, wodurch keine zusätzlichen verbrauchsabhängigen Kosten entstehen.

Mit Hilfe von Reporting-Funktionen lassen sich das Betriebsverhalten der Scan-Stationen, die Indexierung und die Freigabe der Scan-Stapel überwachen. Dies verbessert die Verteilung der Arbeitslast und die Performance-Messung. Außerdem verwendet die Lösung Barcodes und multi-zonale Optical Character Recognition (OCR). Damit lassen sich die Trennung von Dokumenten und die Anwendung von bis zu 20 Metafeldern zu den Regeln für die Dateinamenvergabe spezifizieren.

SER klassifiziert im Kern des ECM-Systems

Doxis4 Classification & Extraction Service gehört zu den Cognitive Services der Doxis4-Software (Bild: SER)

22145-Doxis4-Cognitive-Services

Doxis4 Classification & Extraction Service gehört zu den Cognitive Services der Doxis4-Software (Bild: SER)

Egal ob gescannte oder originär elektronische Dokumente wie E-Mails und importierte Dokumente aus dem Filesystem, der »Doxis4 Classification & Extraction Service« von SER analysiert und ordnet sie mithilfe der Kontextinformationen den passenden E-Akten und Vorgängen zu. Voraussetzung hierfür ist die Nutzung des Enterprise Content Management (ECM) Systems »Doxis4«.

Die Wirkungsweise verdeutlicht folgendes Beispiel: Ein Beschwerdebrief wird mit »Doxis4 Capture« gescannt, OCR-gelesen, im Archiv gespeichert und an den Doxis4 Classification und Extraction Service zur weiteren Verarbeitung übergeben. Bei der Inhaltsanalyse erkennt Doxis4 automatisch die Dokumentart (Beschwerde), den Absender (Kunde XY) und ermittelt selbstständig den zuständigen Kundenbetreuer. Aus diesen Informationen generiert das System einen Vorgang, der in den Postkorb des betreffenden Mitarbeiters eingestellt wird. Der Vorgang enthält neben dem gescannten Schreiben, einen Link auf die entsprechende Kundenakte und auf die Bestellhistorie des Kunden aus dem ERP-System sowie Informationen über die bisherige Geschäftsbeziehung aus dem CRM. So hat der Kundenbetreuer zeitnah den Beschwerdebrief auf dem Bildschirm, inklusive der für die Bearbeitung notwendigen Informationen.

Anstatt alle Inbound Services dem eigentlichen ECM-System voranzustellen, hat SER Inhaltsanalyse und Datenextraktion (Classification und Extraction Service) in den Kern seines ECM-Systems verlagert. Nur die klassische Digitalisierung von Papierdokumenten (Capture und OCR) befindet sich weiterhin am Beginn des Dokumenten-Eingangsprozesses. Dadurch stehen die intelligenten Methoden für Inhaltsanalyse und Datenextraktion nicht nur zur Verarbeitung von Eingangsdokumenten zur Verfügung, sondern können ebenfalls auf bereits im ECM befindliche Daten und Dokumente angewendet werden.

Technisch basiert der Service auf KI-Funktionen mit  intelligenten, lernenden Algorithmen sowie regelbasierten Methoden. Der Doxis4 Classification und Extraction Service  muss lizenziert werden. Die Kosten sind vom Volumen der zu verarbeitenden Dokumente abhängig.

Crosscap von SRZ vergibt elektronische Signatur

Scannen und Erfassen mit elektronischer Signatur (Bild: SRZ)

22145-SRZ-Crosscap

Scannen und Erfassen mit elektronischer Signatur (Bild: SRZ)

Mit der Scansoftware »CROSSCAP« von SRZ lassen sich kleine und große Belegmengen effizient digitalisieren, verarbeiten und gesetzeskonform mit einer elektronischen Signatur versehen. Als Einzel- oder auch Mehrplatzlösung unterstützt Crosscap alle marktgängigen Scanner über aktuelle Twain-Treiber für das Einzelblatt-, Stapel- und Multistreamscannen.

Die Dokumententrennung ist über Patch- und Barcodes, Leerseiten, Seitenzähler sowie per Hand möglich. Um Leerseiten auszufiltern, verfügt die Software über eine einstellbare Leerseitenerkennung, die Leerseiten markiert, anzeigt und beim Export löscht. Diverse Bearbeitungsfunktionen wie Geraderücken der Seiten und das Entfernen von Schmutz- und Lochstellen stehen automatisch und manuell zur Verfügung.

Eine Indexierung kann auf Projekt-, Dokument- oder Seitenebene per Hand, Barcode und über die Texterkennung erfolgen.

Crosscap bietet eine 1D- und 2D-Barcodeerkennung, die über das komplette Image oder in einer bestimmten Zone ausgewertet wird. Dabei lassen sich Barcodes über reguläre Ausdrücke filtern, vergleichen und auswerten.

Über eine ODBC-Schnittstelle können Systeme wie »dBASE Files«, »Excel Files« und »Oracle« angebunden werden, um beispielsweise erkannte Indexdaten abzugleichen oder Zusatzinformationen einzufügen.

Das Modul »digiseal Office pro« ermöglicht eine qualifizierte, fortgeschrittene und einfache Signatur. Qualifizierte elektronische Signaturen sind beim ersetzenden Scannen in bestimmten behördlichen Anwendungsbereichen vorgeschrieben. Darüber hinaus bietet SRZ auch eine Version gemäß TR-RESISCAN, welche das Bundesamt für Sicherheit in der Informationstechnik (BSI) veröffentlicht hat. Diese Technische Richtlinie beschreibt das ersetzende Scannen bei bestimmten behördlichen und auch privatwirtschaftlichen Anwendungen, die besonders hohe Schutzanforderungen haben.

Cloud-native Capture-Plattform von xSuite Group

Capture-Software mit automatischer Klassifikation von xSuite Group (Bild: xSuite Group)

22145-xsuite-capture-helix

Capture-Software mit automatischer Klassifikation von xSuite Group (Bild: xSuite Group)

Mit »xSuite Capture« und »xSuite Archive« bietet xSuite Group zwei ECM-Lösungen als Cloud-Dienste an, die einem Cloud-native-Ansatz folgen. Damit können die Vorteile der Cloud-Technologien in den Bereichen Skalierbarkeit, Innovationsgeschwindigkeit und Flexibilität voll ausgeschöpft werden.

Das vor allem auf die Zusammenarbeit mit SAP spezialisierte Unternehmen xSuite ist in der Lage, Beleginformationen von zum Beispiel Rechnungen mit xSuite Capture direkt zu übertragen. Dabei kann sich xSuite Capture in eine bestehende Systemlandschaft einbetten und einen durchgängigen Prozess ermöglichen. Wählbar ist auch, ob die Validierung des Belegs über den Webbrowser in der Cloud erfolgt oder direkt im SAP-System.

Im Detail sieht es so aus, dass die Dokumente in den unterstützten Formaten über unterschiedliche Eingangskanäle – wie bei­spielsweise den Scan Client, definierte E-Mail-Postfächer oder andere definierte Kanäle – ins System gelangen. Die Verarbeitung der Belege startet mit der Konvertierung in das technisch notwendige Format. Bei Formaten ohne einen Volltext er­folgt anschließend eine OCR, worauf dann die automatisier­te Erfassung (Extraktion der Daten) abläuft. Die Daten aus den Rechnungsdokumenten werden auf Basis eines Regel­werkes erkannt, interpretiert und plausibilisiert.

Die Kreditorenerkennung erfolgt anhand von Stammdaten. Das bedeutet, dass nach dem Muster gearbeitet wird, bei dem die Stammdaten aus dem ERP-System zunächst der Beleglesung zur Verfügung gestellt werden. Dieser bekannte Ansatz wird durch KI unterstützt. Wenn Nutzende eine Korrektur bei einem Dokument vornehmen, lernt das System im Hintergrund automatisch mit.

Die Lösung Capture bietet die Möglichkeit, die anschließen­de Validierung der Rechnungsdaten vollständig innerhalb des Rechnungsworkflows von xSuite durchzuführen. Die Validierung enthält daher alle relevanten Komponenten für die Visualisierung und Kommunikation. Für Buchhaltungsabteilungen sind alle prüfungsre­levanten Informationen damit sofort im Zugriff.

Für eine revisionssichere Langzeitarchivierung kann das cloudbasierte xSuite Archiv genutzt werden.

Die Cloud-Lösungen der xSuite werden in einem deutschen, ISO-zertifizierten Rechenzentrum unter Einhaltung höchster Datenschutz- und Sicherheitsvorkehrungen gehostet. Der Betrieb erfolgt durch die xSuite Group. Die monatlichen Kosten für xSuite Capture als Clouddienst ergeben sich aus der Anzahl der Dokumente pro Jahr sowie der Vertragslaufzeit.

About the Author: Annette Stadler

Annette Stadler ist IT-Journalistin und leitet das Online-Portal ECMGUIDE.