Digitaler Posteingang
Erkennung & Klassifizierung
Kern der Lösung: Datenerkennung
Generisches Verfahren
Das generische Verfahren zeichnet sich durch allgemeingültige Regeln aus. Mit Hilfe dieser Regeln werden Schlüsselattribute eindeutig zugeordnet. Beispielsweise wird ein Datum eindeutig durch die Formatierung erkannt und kann nicht mit anderen Strings (Zeichenketten) verwechselt werden. Weiterhin zeichnet sich dieses Verfahren dadurch aus, dass es KI-unterstützt trainiert werden kann. Dadurch sinkt der administrative Aufwand enorm.
Template basiertes Verfahren
Die sogenannten regulären Ausdrücke (siehe generisches Verfahren) werden auch im Template basierten Verfahren eingesetzt. Einzelne Treffer werden so weiter eingeschränkt und von überflüssigen Teilstrings befreit. Das Verfahren zeichnet sich vor allem durch das Heranziehen von Templates bzw. Dokumentenvorlagen aus. Dabei werden Werte im Dokument primär an festgelegten x-/y- Koordinaten gesucht. Gerade bei strukturierten Formularen bietet sich diese Vorgehensweise ergänzend an, da hierdurch die Auswertungsqualität gesteigert wird. Zwar bedeutet es, dass für jedes Formular ein eigenes Template angelegt werden muss, allerdings erfolgt die Text Extraktion so schnell und präzise.
Die richtige Zuordnung des Empfängers basiert auf den ausgelesenen Werten. Hierbei gibt es verschiedene Verfahren, welche in Kombination zum Einsatz kommen. Die nachfolgende Abbildung zeigt die 3 Textextraktionsverfahren.

Validierung der Stammdaten
Letztlich werden die erkannten Daten nach Möglichkeit gegen externe Datenbanken validiert, sodass die Erkennungsrate nochmals gesteigert werden kann. Dabei werden zum Beispiel Mitarbeitende- oder Lieferantenstammdaten abgefragt und mit gefundenen Werten auf dem Dokument verglichen. Bei einem Match schlägt die Software dem/der Anwender:in den Treffer vor und reichert den Beleg direkt mit weiteren Informationen aus der Datenbank an. Die Ergebnisse der Validierung werden dem/der Anwender:in bei Bedarf in einer Oberfläche angezeigt. Es erfolgt eine optionale manuelle Prüfung und Korrektur. Durch das dadurch entstandene Nutzerfeedback kann die Software weiter trainiert und optimiert werden.
💡Die Kombination der verschiedenen Vorgehensweisen addiert die Vorteile der einzelnen Verfahren auf und negiert dabei die negativen Auswirkungen.
Klassifizierung im Webclient
Das nachfolgende Bild zeigt die Erkennung inkl. Stammdatenabgleich des Empfängers der Korrespondenz. Die farblich markierten Textpassagen auf dem Dokument (links) sind die von der Software erkannten Werte und werden innerhalb der Webindexmaske strukturiert dargestellt (rechts). In diesem Fall erkennt die Software, wer der Empfänger ist und welcher Abteilung er angehört.

Vom Posteingang zur Dokumentenverarbeitung
Der Posteingang nutzt als wesentliche Komponenten eine OCR-Erkennung, sowie ein Modul zur Klassifizierung. Damit ist technisch dasselbe Grundgerüst vorhanden, wie zum Auslesen von sämtlichen Dokumenten wie Rechnungen, Bestellungen und Lieferscheinen.
Beispielsweise: Mit Hilfe einer rechnungsspezifischen Erweiterung des oben genannten generischen Verfahrens und einer erweiterten Datenbankabfrage zur Validierung der Kreditorenstammdaten lässt sich hiermit der Grundstein für ein Folgeprojekt zur digitalen Rechnungsverarbeitung legen.
Vorteile
- Oberfläche ist Mitarbeitenden bekannt
- Wissensvorsprung & Know-How Transfer
- Bewährte Software minimiert Projektrisiken
Erfolgsgeschichte Implenia ♥ d.velop
Erkennen Sie Ihre Poststücke automatisiert und stellen Sie sicher, dass keine Briefe oder Pakete wochenlang liegen bleiben. In dem Video erfahren Sie, wie das Unternehmen Implenia diese Lösung bereits erfolgreich einsetzt.