05.01.2015 (eh)
4.7 von 5, (9 Bewertungen)

Chaos Communication Congress 31C3 und der »Xerox-Scanner-Fall«

  • Inhalt dieses Artikels
  • Fehler im Pattern-Matching-Algorithmus der JBIG2-Kompression
  • Betroffene Xerox-Modelle sind in Großunternehmen und bei Scandienstleistern vielfach eingesetzte Arbeitstiere

Softwarefehler in der Kompression der Workcentre-Scanner/Kopierer: Aus »6« wurde eine »8«, aber nicht jedesmal (Bild: David Kriesel)Softwarefehler in der Kompression der Workcentre-Scanner/Kopierer: Aus »6« wurde eine »8«, aber nicht jedesmal (Bild: David Kriesel)Was war der spektakulärste Vortrag auf dem Chaos Communication Congress 31C3, der zum Jahreswechsel in Hamburg stattfand? Es gab viele, sehr viele – aber aus ECMguide.de-Sicht war es sicherlich der Beitrag »Glaube keinem Scan, den du nicht selbst gefälscht hast« von dem Systemingenieur David Kriesel: Er deckte im Sommer 2013 auf, dass Xerox-Scanner/Kopierer Marke »WorkCentre« und auch »ColorQube« Zahlen beim Abspeichern von gescannten Dokumenten vertauschten. Vor allem wurde bei dem Softwarefehler aus einer »6« oftmals, aber nicht immer, eine »8«.

Das ärgerliche an dem Fehler: er ist tückisch – er fällt nicht auf. Das auf der Kopie wiedergegebene Zeichen sieht perfekt aus, ist aber schlicht falsch. Kriesel deckte auf, dass der Fehler – es betraf den Pattern-Matching-Algorithmus der JBIG2-Kompression – in den Xerox-Betriebssystemen sagenhafte acht Jahre sein Unwesen trieb.

Fehler im Pattern-Matching-Algorithmus der JBIG2-Kompression

Zunächst redete sich Xerox im Sommer 2013 heraus, dass es nur den »Normal«-PDF-Modus betreffe, aber nicht in den »higher«- und »highest«-Modi. Und diese würden laut Betriebsanleitung für professionelle Scans empfohlen. Doch Kriesel wies nach, dass es auch die höher auflösenden Modi betraf. In seinem Vortrag auf dem 31C3-Kongress zeigte er auf, wie er sich in die Materie einarbeitete – und Xerox zunächst nicht reagierte. Aber nachdem es nicht mehr von der Hand zu weisen war, reagierte Xerox recht professionell, und beseitigte mit Patches den Softwarefehler.

Das untenstehende Video vom 31C3-Kongress ist absolut sehenswert. Es dauert zwar etwas über eine Stunde, aber wenn Sie mit Scannern zu tun haben, sollten Sie sich die Zeit nehmen. Denn der Beitrag beschreibt auch andere Probleme der Kompression, die zu Inhaltsveränderungen führen können.

Betroffene Xerox-Modelle sind in Großunternehmen und bei Scandienstleistern vielfach eingesetzte Arbeitstiere

Bedenken Sie: Xerox-Modelle sind absolute Arbeitstiere, und werden vielfach auch in Posteingangszentren von größeren Unternehmen sowie bei Scandienstleistern eingesetzt. Wenn hier möglicherweise zigmillionenfach aus einer »6« eine »8« wurde, wanderten Millionen von Datensätzen mit falschen Belegnummern oder Kundennummern oder Rechnungsbeträgen in SAP-Systeme zur weiteren Verarbeitung. Wurden die Originale anschließend vernichtet, lässt sich der Fehlscan nicht mehr nachweisen.

Abgesehen von falschen Abrechungen könnte sich Kriesel laut seinem Blog auch noch Fehlermöglichkeiten in Bauplänen (mit vertauschten Quadratmeterzahlen), falsche Ingenieurspläne vielleicht bei Autobahnbrücken oder Zahlendreher bei Arzneimitteldosierungen vorstellen.

Kriesel weist eingangs von seinem Vortrag ironisch auf eine Art »Disclaimer« hin: »Wer ein inniges Verhältnis zu seinem Kopierer hat, und das gerne beibehalten möchte, der sollte den Vortrag nicht anhören.« Und da der Fehler erstmals auf einem Bauplan auffiel, meinte er abschließend noch mit einem kleinen Seitenhieb auf die Probleme des Berliner Flughafens BER: »Auf welchen Kopieren wurden eigentlich die Baupläne für den Berliner Flughafen kopiert?«


David Kriesel: Xerox-Fall auf dem Chaos Communication Congress 31C3

.
Kommentare (2)
09.01.2015 - UKampffmeyer

Lieber Herr Hörmannsdorfer,
der XEROX-Fall aus dem Jahr 2013 ( bei uns im Blog im August 2013 hier www.project-consult.de/ecm/in_der_diskussion/xerox_scanning_ver%c3%a4ndert_buchstaben_und_ziffern und im Oktober 2013 hier www.project-consult.de/ecm/in_der_diskussion/rechtsg%c3%bcltigkeit_gescannter_dokumente_ein_musterversuch#comment-2373 ) rührt von einer falschen Implementierung der Kompressionsalgorithmen für ein bestimmtes Ausgabeformat - XEROX hat hier zu sehr an die Speicheroptimierung denn an die Übereinstimmung von Ursprungsdokument und Scan gedacht. Wie viele Dokumente mit dem "Zahlendreher-Fehler" ("6" und "8" sind immer das Beispiel, es geht aber auch um andere Zahlen wie "1" und "7" und um Buchstaben) nun wirklich in den Archiven liegen, ist eine ganz andere Frage. Der Fehler in der Scan-Software war zumindest durch den Patch (der den JBIG2 Pattern Matching abschaltete) behebbar. Der XEROX-Programmierfehler interessiert mich dabei weniger als die Tatsache, dass die Qualitätssicherung der Scan-Ergebnisse bei der Anwendern nicht funktioniert. Eine einfache Sichtkontrolle offenbart den Fehler nicht und wenn man dann zum Beispiel auch mit Massen-Scan-Verfahren arbeitet, wo nur eine Stichprobe angesehen wird, kommen solche fehlerhaften Dokumente ins Archiv. Hier hilft auch nicht das Signieren der gescannten Dokumente mit Verfahren der Massensignatur oder nach TR 03138 ResiScan (immerhin hat man aber beim Signieren während des Scannens dann einen "Schuldigen", der nicht ausreichend geprüft hat - den Eigentümer der Signaturkarte). Dies habe ich in einem Beitrag zum "Wiesbadener Urteil" im Dezember 2014 versucht - leicht ironisch - zu beleuchten: www.project-consult.de/ecm/in_der_diskussion/das_wiesbadener_urteil_zum_scannen#comment-2638.
Fazit: wir verlassen uns zu sehr auf unzureichende Technik!

Ulrich Kampffmeyer

06.01.2015 - eh

Kleiner Nachtrag seitens der Redaktion: Falls ein Xerox-Anwender den Patch tatsächlich noch nicht aufgespielt haben sollte - hier gibt es ihn zum Download:
www.office.xerox.com/scanning-software-patch/enus.html