CaixaBank setzt bei OCR auf »Abbyy FineReader Engine«

Die Architektur von »FineReader Engine« (Bild: Abbyy)

21154-abbyy-finereader-engine-architektur

Die Architektur von »FineReader Engine« (Bild: Abbyy)

Nachdem die spanische CaixaBank die spanischen Aktivitäten der britischen Barclays-Bank übernommen hatte, gab es viel zu Digitalisieren der umfangreichen Archive. Bei dem umfangreichen Projekt zur Digitalisierung von 25 Millionen Dokumenten aus dem Archiv der Barclays-Bank kommt OCR-Technologie des Data-Capture-Spezialisten Abbyy zum Einsatz.

»Wir haben schon zuvor zahlreiche Optionen auf dem Markt ausgewertet und beschlossen, die Texterkennungstechnologie von Abbyy für die Digitalisierung unserer eigenen Dokumente einzusetzen, da sie über eine hohe Genauigkeit verfügt und an ein großes Spektrum von Dokumententypen angepasst werden kann«, sagt Jorge Cortada Fernandez, BPO Technology Director bei CaixaBank. »Als CaixaBank das Bankgeschäft von Barclays in Spanien Ende 2014 übernahm, war es nötig, deren 25 Millionen Archivdokumente zu digitalisieren. Wir wussten aus Erfahrung, dass ‚Abbyy FineReader SDK’ hierfür gut geeignet sein würde. Zwei unserer Technologiepartner – Indra BPO und Serimag Media – unterstützten uns bei diesem Projekt mit der Entwicklung einer eigenen Komplettlösung. Beide haben zahlreiche Erfahrung in den Bereichen Bildverarbeitung und automatische Dokumentenverarbeitung, und erwiesen sich bei dem Projekt als ideale Partner. Aufgrund unserer guten Erfahrung evaluieren wir derzeit künftige Projekte, bei denen wir möglicherweise andere OCR-Technologien von Abbyy implementieren, wie zum Beispiel im Bereich der mobilen Dokumentenerfassung.«

Unterschiedlichste Bank-Unterlagen mussten digitalisiert und klassifiziert und in ECM-System eingespeist werden

Bei dem Digitalisierungsprojekt der Barclay-Bank-Unterlagen war es nötig, Bankarchive zu digitalisieren und zu klassifizieren sowie bestimmte Daten aus den Dokumenten zu extrahieren, wie zum Beispiel Ausweis- oder Umsatzsteuernummern, Rechnungsbeträge und Kundennamen. Die 25 Millionen Dokumente wurden zum Scannen an den externen Scan-Dienstleister Indra BPO geliefert.

Das Spektrum der Dokumente war laut Abbyy sehr breit gefächert und beinhaltete Kreditakten, Risikobewertungen, Hypotheken- und Darlehensanträge, Bestellanforderungen, Überweisungsaufträge, Rechnungen, Schecks, Personalausweise und viele andere Dokumentenarten. Die gescannten Dokumentenbilder wurden dann an die Serimag-Lösung weitergeleitet, die mit der »FineReader Engine« von Abbyy die eigentliche Texterkennung vornahm und mit den Serimag-Tools die Klassifizierung der Dokumente durchführte.

Hilfreiche Abbyy-Funktionen zur Bildvorbearbeitung

Mittels der Abbyy-Funktionen zur Bildvorbearbeitung konnte die Lösung Bilddateien vor der Erkennungsphase korrigieren und feststellen, ob Unterschriften in einem Vertrag vorhanden sind. Die Finereader-Engine erreichte bei vielen Dokumenten eine Erkennungsrate zwischen 92 und 97 Prozent, was der Bank folglich viel Zeit für die Nachbearbeitung ersparte. Schließlich wurden die Dokumente als durchsuchbare PDF- und als TIFF-Dateien im Enterprise-Content-Management-System (ECM) der Bank archiviert.

.

About the Author: Engelbert Hörmannsdorfer