Digitaler Posteingang

Erkennung & Klassifizierung

Kern der Lösung: Datenerkennung

Generisches Verfahren

Das generische Verfahren zeichnet sich durch allgemeingültige Regeln aus. Mit Hilfe dieser Regeln werden Schlüsselattribute eindeutig zugeordnet. Beispielsweise wird ein Datum eindeutig durch die Formatierung erkannt und kann nicht mit anderen Strings (Zeichenketten) verwechselt werden. Weiterhin zeichnet sich dieses Verfahren dadurch aus, dass es KI-unterstützt trainiert werden kann. Dadurch sinkt der administrative Aufwand enorm.

Template basiertes Verfahren

Die sogenannten regulären Ausdrücke (siehe generisches Verfahren) werden auch im Template basierten Verfahren eingesetzt. Einzelne Treffer werden so weiter eingeschränkt und von überflüssigen Teilstrings befreit. Das Verfahren zeichnet sich vor allem durch das Heranziehen von Templates bzw. Dokumentenvorlagen aus. Dabei werden Werte im Dokument primär an festgelegten x-/y- Koordinaten gesucht. Gerade bei strukturierten Formularen bietet sich diese Vorgehensweise ergänzend an, da hierdurch die Auswertungsqualität gesteigert wird. Zwar bedeutet es, dass für jedes Formular ein eigenes Template angelegt werden muss, allerdings erfolgt die Text-Extraktion so schnell und präzise.

Die richtige Zuordnung der Empfängers basiert auf den ausgelesenen Werten. Hierbei gibt es verschiedene Verfahren, welche in Kombination zum Einsatz kommen. Die nachfolgende Abbildung zeigt die 3 Textextraktionsverfahren.

Abbildung der drei Verfahren zur Datenerkennung

Validierung der Stammdaten

Letztlich werden die erkannten Daten nach Möglichkeit gegen externe Datenbanken validiert, sodass die Erkennungsrate nochmals gesteigert werden kann. Dabei werden zum Beispiel Stammdaten von Mitarbeitenden oder Lieferanten abgefragt und mit gefundenen Werten auf dem Dokument verglichen. Bei einem Match schlägt die Software dem/der Anwender:in den Treffer vor und reichert den Beleg direkt mit weiteren Informationen aus der Datenbank an. Die Ergebnisse der Validierung werden dem/der Anwender:in bei Bedarf in einer Oberfläche angezeigt. Es erfolgt eine optionale manuelle Prüfung und Korrektur. Durch das dadurch entstandene Nutzerfeedback kann die Software weiter trainiert und optimiert werden.

💡Die Kombination der verschiedenen Vorgehensweisen addiert die Vorteile der einzelnen Verfahren auf und negiert dabei die negativen Auswirkungen.

Klassifizierung im Webclient

Das nachfolgende Bild zeigt die Erkennung inkl. Stammdatenabgleich der Empfänger:innen der Korrespondenz. Die farblich markierten Textpassagen auf dem Dokument (links) sind die von der Software erkannten Werte und werden innerhalb der Webindexmaske strukturiert dargestellt (rechts). In diesem Fall erkennt die Software, wer der/die Empfänger:in ist und welcher Abteilung er/sie angehört.

WEITER ZUR POSTVERTEILUNG

Vom Posteingang zur Dokumentenverarbeitung

Der Posteingang nutzt als wesentliche Komponenten eine OCR-Erkennung, sowie ein Modul zur Klassifizierung. Damit ist technisch dasselbe Grundgerüst vorhanden, wie zum Auslesen von sämtlichen Dokumenten wie Rechnungen, Bestellungen und Lieferscheinen.

Beispielsweise: Mit Hilfe einer rechnungsspezifischen Erweiterung des oben genannten generischen Verfahrens und einer erweiterten Datenbankabfrage zur Validierung der Kreditorenstammdaten lässt sich hiermit der Grundstein für ein Folgeprojekt zur digitalen Rechnungsverarbeitung legen.

Vorteile

Oberfläche ist Mitarbeitenden bekannt
Wissensvorsprung & Know-How Transfer
Bewährte Software minimiert Projektrisiken

Erfolgsgeschichte Implenia ♥ d.velop

Erkennen Sie Ihre Poststücke automatisiert und stellen Sie sicher, dass keine Briefe oder Pakete wochenlang liegen bleiben. In dem Video erfahren Sie, wie das Unternehmen Implenia diese Lösung bereits erfolgreich einsetzt.