Das wichtigste im Archiv sind die Suchfunktionen. Erst sie machen aus einem Datensilo einen nützlichen Aufbewahrungsort für revisionskritische und geschäftsrelevante Informationen. Wenige Schlüsselpunkte führen zur richtigen Such/Index-Lösung.
von Ulrike Rieß
Bild: pixelio.de/JenaFoto24.de
Gezielt Daten in einem Archiv zu finden beschreiben viele als die »Suche nach der Nadel im Heuhaufen«. Das liegt daran, dass unterschiedliche Datentypen in einem Archiv vorkommen. Datenbanken verfügen über strukturierte Daten, E-Mail-Anwendungen schreiben semi-strukturierte Informationen – aber erheblicher ist das Aufkommen unstrukturierter Daten. Dazu gehören zum Beispiel Präsentationen, Office-Dokumente, PDFs und alle Formen von Media-Files. Diese Informationen zu verwalten, auszuwerten bzw. schnell zu finden, stellt oft ein Problem für IT-Verantwortliche dar. Gesetzliche Richtlinien, Buchhaltungsprozesse und andere Suchanforderungen tun ihr Übriges, um die Wahl der optimalen Such/Index-Lösung zu erschweren. Allerdings reichen bereits einige Kriterien, die bei der Auswahl in Betracht gezogen werden sollten.
Geschäftsanforderungen verstehen
Eine Studie der Firma Xiotech zeigt, dass 90 Prozent aller US-Unternehmen gesetzliche Vorgaben einhalten müssen. Einige dieser Organisationen riskieren sogar Gerichtsverfahren, weil ihre Speicherabläufe nicht den Bestimmungen entsprechen. Ein Verstoß gegen Rechtsvorgaben kann zudem zu hohen Geld- oder sogar Gefängnisstrafen führen. Daher ist es wichtig, ein Dokumenten-Management und/oder ein Discovery-Tool einzusetzen, um kritische Daten optimal zu verwalten. Allerdings unterscheiden sich die am Markt vorhanden Produkte erheblich in ihrem Funktionsumfang. Daher ist es zwingend erforderlich, die internen Abläufe und ihr Zusammenspiel zu verstehen. Und die verantwortlichen Abteilungen müssen ihre Daten nach Wichtigkeit und Zugriffsanforderungen klassifizieren. Geschäftsführer und IT-Verantwortliche sollten wissen, welche Auflagen eingehalten werden müssen und welche Konsequenzen zu erwarten sind, wenn sich das Unternehmen nicht daran hält.
Index und Suche
Die Indexierungs- und Suchmöglichkeiten sind letztlich die ausschlaggebenden Funktionen bei einer Archivierungslösung. E-Mail-Archive können immerhin Millionen an unstrukturierten Dateien beherbergen. Dadurch ist es nahezu unmöglich, auf herkömmliche Weise – nur mit dem Dateinamen – spezifische Mails und damit verbundene Informationen zu finden. Jedes Dokumenten- und Records-Management-Tool sollte umfassende und wirkungsvolle Index/Such-Funktionen aufweisen. Dabei geht es um die Metadaten, die bei der Indexierung hinzugefügt werden. Diese Metadaten können viele beschreibende Attribute enthalten, die eine Suche erleichtern. Das heißt, eine Datei muss im Vorfeld mit sinnvollen Attributen – Metadaten – ausgestattet werden, so lässt sie sich später schnell und themenbezogen wiederfinden.
Auch die Suchfunktion muss ähnlich leistungsstark sein. Eine Volltextsuche sollte in der Lage sein, mit verschiedenen Angaben, Datum, Name oder Kontext, die relevanten Mails samt Anhängen aufzuspüren. Kontextuelle Suche mit Schlüsselworten muss ebenso möglich sein, damit selbst kleine Bezugsworte ausreichen, um erfolgreich zu suchen und finden.
Bei einem zu erwartenden hohen Datenaufkommen benötigt der Archivsuchende auch die entsprechende Speicherkapazität und -performance. Gerade Kontext-Suche benötigt große Rechner-Ressourcen. Administratoren sollten im Vorfeld Tests mit Partnern und/oder Anbietern durchführen, um die Leistungsanforderungen ihrer IT-Umgebung abdecken zu können.
IT-Verantwortliche müssen zudem ein Programm wählen, das ihnen die gesuchten Files und deren Suche so aufbereitet, wie es interne oder rechtliche Bestimmungen vorgeben. So listen viele Software-Varianten die Output-Daten in Suchmaschinenformat auf, ähnlich wie bei Google. Andere erfüllen rechtsspezifische und gesetzeskonforme Dokumentationsrichtlinien oder folgen Vorgaben von Justizinstanzen, Handelsinstitutionen oder Börsenaufsichten.
Reports und Datenanalyse
Reports und die Fähigkeit der Datenanalyse sind ebenso wichtig wie oben angegebene Index/Such-Funktionen. IT-Verantwortliche oder auch andere Abteilungen benötigen stets den Überblick der verfügbaren Informationen und andere Details wie Alter, Typ oder Bewertung der Datei. Somit kann der Administrator das Datenvolumen und die Einhaltung der Aufbewahrungsbestimmungen überwachen.
Workflow-Analyse und Audit-Funktion helfen, Zugriffsanalysen und Nutzerprofile zu erstellen. Dadurch kann ein Unternehmen seine sensiblen Daten vor falschem Zugriff oder Sabotage schützen. Die jeweilige Software sollte es ermöglichen, die Nutzer zu identifizieren, die versuchen, unautorisierte Aktionen durchzuführen. Dabei muss das Tool Zugriffe, Lösch-, Kopier- oder Transferversuche sowie andere Aktionen verfolgen und dokumentieren können.
Policy-Management
Regelbasiertes Management ist wichtig, damit der Administrator jeden Datentyp entsprechend seiner Aufbewahrungszeit am richtigen Speicherort ablegen kann. Die Aufbewahrungsfristen variieren je nach Unternehmen und Branche. Sind diese identifiziert, kann der IT-Verantwortliche die »passenden« Regeln aufsetzen und automatisieren. Die Lösung muss aber auch Löschvorgänge garantieren, denn nach Ablauf der Verwahrzeit müssen die Daten vernichtet werden. Zum einen aus rechtlichen Gründen, zum anderen, um interne Ressourcen optimal zu nutzen. Mit der entsprechenden Regel sollten Files nach ihrem internen »Ableben«, automatisch gelöscht werden.
Für die Umsetzung der Regeln kann sich der Administrator im besten Falle an der bereits vorhandenen Aufbewahrungs- und Vernichtungsrichtlinie für Papierdokumente richten. Buchhaltung, Personalabteilung und Chefetage sollten darüber Bescheid wissen. Damit erreicht das Unternehmen eine schnelle und vor allem einheitliche Umsetzung aller gegebenen Richtlinien.