KI im Dokumentenarchiv: Chancen und Risiken
Umfangreiche Dokumentenbestände eröffnen Unternehmen große Chancen, künstliche Intelligenz gewinnbringend einzusetzen. Der Artikel erläutert, wie sich geeignete Lösungen unterscheiden und sicher in bestehende Archive integrieren lassen.
Studien zur KI-Nutzung deutscher Unternehmen
Inhalt dieses Artikels
Künstliche Intelligenz (KI) ist in der deutschen Wirtschaft angekommen. Laut einer aktuellen Studie des ITK-Verbands Bitkom nutzt bereits jedes dritte Unternehmen KI. »In irgendeiner Form« verwenden sogar 98 Prozent der Unternehmen hierzulande KI wie ABBYY in der Studie »State of Intelligent Automation: GenAI Confessions 2025, The good, the bad, and risks with Enterprise AI« herausfand. In dieser Zahl sind jedoch 43 Prozent inbegriffen, die GenAI nur aufgrund von BYOS (Bring Your Own Software) im Unternehmen nutzen. Hinsichtlich Compliance- und Sicherheitsaspekten ist dies ein nicht unerhebliches Risiko.
Doch die zentrale Erkenntnis der Studie ist für Dr. Marlene Wolfgruber, Director of Product Marketing für Intelligent Document Processing bei Abbyy, »dass die anfängliche Erwartung, generative KI löse alle Geschäftsprobleme, definitiv nicht erfüllt werden konnte. Zahlreiche Unternehmen räumen ein, dass deutlich mehr KI-Technologien beziehungsweise Gen-KI erforderlich sind, um geschäftskritische Prozesse erfolgreich zu vereinfachen oder zu beschleunigen.«
Warum es zwischen KI und Archiv besonders matcht
Zu den häufigsten Einsatzfeldern von GenAI zählt mit 57 Prozent die Automatisierung von dokumentenbasierten Geschäftsprozessen. Nur die Datenanalyse und Gewinnung von Erkenntnissen liegt mit einem Prozent darüber. Für dokumentenbezogene Unternehmensaufgaben eignet sich KI besonders gut, weil in der Regel bereits große Mengen an Archivdokumenten vorhanden sind. »Da generative KI ihre Stärke vor allem im Verarbeiten von Inhalten hat, profitiert jedes Archiv, in dem große Mengen an Daten vorgehalten werden«, unterstreicht Philipp Braun, Product Owner bei ELO Digital Office. Die Automatisierung monotoner Aufgaben mit Hilfe Künstlicher Intelligenz erleichtere darüber hinaus den Arbeitsalltag erheblich.
Dies bestätigt auch Jens Büscher, Gründer und CEO von Amagno: »In den Archiven unserer Kunden schlummert ein riesiges, oft ungenutztes Potenzial. Die KI ist der Schlüssel, um diesen Datenschatz zu heben. Sie versteht den Kontext und die Zusammenhänge in den Dokumenten und ermöglicht so völlig neue Anwendungsfälle.« So könne sich ein Personaler auf Knopfdruck die Leistungen eines Mitarbeiters zusammenfassen lassen, anstatt Akten zu studieren. Das Controlling kann per Frage Trends in Finanzberichten aufdecken. Der Produktsupport identifiziert wiederkehrende Kundenprobleme, indem er die KI tausende von Tickets analysieren lässt.
Mehrwert durch KI und archivierten Content
»Anstatt Inhalte nur passiv zu speichern, ermöglicht die KI den Unternehmen, mit archivierten Daten zu interagieren, als würden sich die User mit einem sachkundigen Assistenten unterhalten. So werden Muster, Zusammenhänge und Trends aufgedeckt, die zuvor verborgen waren«, erklärt Arsalan Minhas, Associate Vice President of Sales Engineering for EMEA & APAC bei Hyland. In Unternehmensarchiven optimieren virtuelle KI-Assistenten die Suche und den Abruf historischer Aufzeichnungen, Prüfpfade und Kommunikationen. So werden Compliance und eDiscovery mit minimalem manuellem Aufwand ermöglicht.
Jens Büscher, CEO und Gründer von Amagno (Bild: Amagno)
»In Medienarchiven generiert KI automatisch beschreibende Tags, Anmerkungen und Transkripte aus Videoinhalten. Dadurch wird das Material durchsuchbar und eine schnelle Wiederverwendung der Inhalte unterstützt. In Multimediaarchiven wandelt die Spracherkennung Audio- und Videoarchive in Text um. So stehen intelligente Such- und Analysefunktionen für zuvor nicht zugängliche gesprochene Inhalte zur Verfügung«, erläutert Minhas weiter.
Was den KI-Einsatz erschwert
Bei der geordneten Implementierung von GenAI sehen sich deutsche Unternehmen jedoch mit einigen Herausforderungen konfrontiert. Laut der Abbyy-Studie bemängeln 29 Prozent, dass es keine ausreichenden Governance/KI-Richtlinien gibt. Einige Unternehmen unterschätzen auch den Daten- und Trainingsaufwand. So erweist sich für 27 Prozent das Training von Modellen schwieriger als erwartet. Jeweils 26 Prozent sehen die mangelnden Fähigkeiten der Mitarbeiter sowie die schwierige Integration in bestehende Prozesse als problematisch. 20 Prozent bemängeln, dass keine Einbindung von Unternehmensdaten möglich ist.
Ein weit verbreiteter Fehler sei nach Aussagen von Wolfgruber auch die Annahme, Gen-KI könne zuverlässig und ohne Vorbereitung präzise Erkenntnisse aus jedem Dokumentenarchiv gewinnen. »Wir haben Kunden erlebt, die damit experimentierten. Die Ergebnisse sahen auf den ersten Blick gut aus. Bei genauerem Hinsehen stellte sich jedoch heraus, dass generative KI in unsicheren Fällen aufgrund mangelnder Daten- beziehungsweise Dokumentenqualität einfach frei erfundene Daten hinzufügte«, warnt Wolfgruber. Inkonsistente Formate und fehlender Kontext können ebenfalls zu Fehlern oder Trugbildern führen.
Archiv-Vorbereitungen für den KI-Einsatz
Arsalan Minhas, Associate Vice President of Sales Engineering for EMEA & APAC bei Hyland
Hat das Dokumentenarchiv qualitative Defizite, besteht der erste Schritt darin, archivierte Inhalte zu organisieren und zu bereinigen, um Vollständigkeit, Konsistenz und Qualität sicherzustellen. »Dazu gehört die Anreicherung mit Metadaten und die Klassifizierung unstrukturierter Inhalte, damit diese für die KI-Verarbeitung leichter zugänglich werden«, ergänzt Minhas. Hierbei können wiederum KI-, OCR- und Dokumentenmanagement-Tools helfen, die viel manuelle Arbeit ersparen. Ist jedoch eine Dokumentenmanagement- oder Enterprise Content Management-Lösung ordnungsgemäß im Einsatz, dürfte sowieso kaum Bereinigungsaufwand vorhanden sein. In der Regel liegen Daten dann maschinenlesbar und klassifiziert vor.
In jedem Fall sollten sich Unternehmen zunächst einen Überblick über ihre Prozesse und Workflows verschaffen. Zu klären ist, in welchen Bereichen der Einsatz von KI sinnvoll und welche Ausprägung von KI dabei geeignet erscheint. Wenn sich das Modelltraining als komplex gestaltet, sind vortrainierte, zweckgebundene KI-Lösungen häufig die bessere Wahl.
Welche Art von KI geeignet ist
Oft steht es den anwendenden Unternehmen frei, welche KI-Lösungen in Verbindung mit der Archivierungs- beziehungsweise Enterprise Content Management Lösung zum Einsatz kommt. ELO ermöglicht seinen Kunden beispielsweise, dass in die ELO ECM Suite integrierte Large-Language-Model (LLM) frei zu wählen. »Es lassen sich alle gängigen KI-Anbieter – wie ChatGPT und Gemini – oder auch eigene Sprachmodelle einbinden. Zudem ist der parallele Einsatz mehrerer Modelle für gleiche oder unterschiedliche Aufgaben möglich. Außerdem arbeiten wir an weiteren KI-Lösungen, die ganz ohne externe Dienste auskommen«, berichtet Braun. Bei der Auswahl des passenden KI-Modells spielen Kriterien wie der Datenschutz, Tokensize und Budgets die wichtigste Rolle. Hinsichtlich Tokensize kommt es darauf an, wie viele Tokens das KI-Modell in welcher Geschwindigkeit verarbeiten soll.
ECM-Hersteller Amagno rechnet ebenfalls transparent über Token ab, obwohl hier die KI kein aufgesetztes Fremd-Tool, sondern Teil des Kernprodukts ist. »Wir glauben, dass Komplexität der Feind von Produktivität ist. Anstatt Kunden mit komplexen Baukastensystemen und undurchsichtigen Preismodellen zu konfrontieren, bieten wir eine tief integrierte, vollumfängliche Lösung«, erklärt Büscher den Ansatz, bei dem die KI-Funktionen für die gesamte Organisation bereitstehen. Obgleich die »Amagno Business Cloud« bereits für KI-Zwecke aufbereitete und maschinenlesbare Dokumente enthält, empfiehlt Büscher eine Art »Archivhygiene« vorzunehmen: Es geht darum, zu entscheiden, welche Daten für die KI relevant sind, und die Datenqualität zu prüfen. Ist diese Vorbereitung abgeschlossen, funktioniert die Aktivierung folgendermaßen: Lizenz erwerben und den Service für die gewünschten Bereiche per Klick freischalten. Die KI beginnt sofort, den Wert aus den vorbereiteten Daten zu erschließen. Dabei berücksichtigt sie die Zugriffsberechtigungen der Personen, um den Schutz sensibler Informationen zu gewährleisten.
KI und Cloud
Etwas einschränkend kann es sein, wenn Kunden Dokumentenarchive in KI-Verbindung nutzen wollen, die On-Premises arbeiten. »Für uns sind Cloud und KI zwei Seiten derselben Medaille. Die enorme Rechenleistung, die für moderne Sprachmodelle erforderlich ist, lässt sich nur in einer skalierbaren Cloud-Umgebung effizient und wirtschaftlich sinnvoll bereitstellen«, ist Büscher überzeugt. Daher hat der Hersteller entschieden, »Amagno.AI« exklusiv für seine Business Cloud anzubieten.
Auch Minhas vertritt die Ansicht, dass cloud-native ECM-Lösungen die ideale Grundlage bilden, um KI-Funktionen einzubetten, zu skalieren und fortlaufend zu erweitern: »Cloud-native ECM-Plattformen ermöglichen es, KI-Modelle und -Services direkt im Content-Management-Ökosystem zu integrieren und kontinuierlich zu aktualisieren. Anwender erhalten so in Echtzeit Zugriff auf intelligente Funktionen wie erweiterte Suche, automatisierte Klassifizierung und kontextbezogene Empfehlungen, ohne dass Verzögerungen oder Unterbrechungen auftreten, die bei Legacy-Systemen typisch sind.«
Cloud-native Architekturen nutzen Microservices und Containerisierung, wodurch KI-Komponenten dynamisch nach Bedarf skaliert werden können. So lassen sich schwankende Arbeitslasten reibungslos bewältigen, und die Performance bleibt unabhängig vom Content-Volumen oder der Nutzeraktivität konsistent.
Wiederum legt ELO großen Wert darauf, dass jede KI-Lösung auch On-Premises zur Auswahl steht. »Es kann jedoch erweiterter Aufwand entstehen, wenn beispielsweise ein Sprachmodell On-Premises zur Verfügung gestellt werden muss. Ist dies umgesetzt, funktioniert der ELO Assistant On-Premises genauso wie in der Cloud«, versichert Braun.
Fazit zu KI und Archiv
Die Verbindung zwischen KI und Dokumentenarchiv kann viele Vorteile bieten: Sie erschließen verborgene Erkenntnisse, ermöglichen die Automatisierung monotoner aber auch hochkomplexer Aufgaben und verbessern die Entscheidungsfindung. Das Archiv wird so vom reinen Datenspeicher zu einem aktiven, intelligenten Assistenten, der bei Analysen, Übersetzungen und kreativen Aufgaben unterstützt.
Allerdings besteht das Risiko ungenauer Ergebnisse bei schlechter Datenqualität. Fehlen die passenden Kontrollmechanismen, können auch falsche Resultate und Missdeutungen die Folge sein. Zudem sollte es den Beschäftigten im Unternehmenskontext nicht erlaubt sein, »mitgebrachte« KI-Software zu verwenden. Fehlerhafte Automatismen könnten ebenso die Folge sein wie die unerlaubte Weitergabe kritischer Unternehmensdaten.
Weitere Artikel
KI im digitalen Archiv macht den UnterschiedAdvertorial
Die stetig wachsenden Dokumenten- und Datenmengen gesetzeskonform zu archivieren, gleicht häufig einer Herkulesaufgabe. Archivierungssoftware schafft Abhilfe, speziell wenn sie mit intelligenten Tools kombiniert wird.
Konfigurationen auf Knopfdruck: nscale 10.1
Sechs Monate nach dem Major Release »nscale 10« veröffentlicht Ceyoniq planmäßig die Version 10.1 seiner Informationsplattform. Zu den Neuerungen zählen eine konfigurierbare App für Updates, gleichzeitige Dokumentenbearbeitung und KI-Funktionen.