Automatische Dokumentenverarbeitung für höchste Ansprüche
Im gesamten Projekt dienten und fungierten uns das Team von Karakun als hervorragender und verlässlicher Partner, welcher auch mit unserem ERP- und M365-Consultant super effizient zusammenarbeitete.
Wir sind von der Leistung so überzeugt, dass wir uns bereits zu den nächsten Projekten mit Karakun austauschen.
Björn Börner
Elektronische Dokumente wie Bestellungen, Lieferscheine oder Rechnungen sind das vorherrschende Format zum Austausch von Daten im B2B. Diese Dokumente sind jedoch nicht für die maschinelle Verarbeitung optimiert, was eine Automatisierung erheblich erschwert. Dabei bietet sich Unternehmen gerade in diesen Bereichen enormes Einsparpotenzial durch schnellere, effizientere und weniger fehleranfällige Prozesse.
Dieses Potenzial hat auch unsere Kundin CVS engineering GmbH aus Rheinfelden (Deutschland) erkannt. CVS produziert Kompressoren und Vakuumpumpen für den Einsatz in Fahrzeugen (v.a. in LKW und Bahnen) und vertreibt diese weltweit. Insgesamt gehen pro Jahr etwa 10’000 Auftragsbestätigungen und Rechnungen von den Zulieferern des Unternehmens ein, Tendenz steigend. Bislang wurden die relevanten Daten aus diesen Dokumenten manuell ausgelesen, in das eigene ERP-System übertragen und dabei mit denen der zugehörigen Bestellung verglichen. Diesen zeitaufwändigen und fehleranfälligen manuellen Prozess will CVS durch einen automatisierten Workflow ersetzen.
Eine geeignete Softwarelösung soll die relevanten Daten aus dem betreffenden Dokument automatisch auslesen und mit denen aus dem ERP abgleichen, die Mitarbeitenden bei Abweichungen (z.B. bei Menge, Preis oder Liefertermin) und Datenfehlern auf diese hinweisen und ihnen im ERP eine einfache Kontroll- und Korrekturmöglichkeit bieten. Die eingehenden Rechnungen und Auftragsbestätigungen sollen anschliessend vollautomatisch im DMS (SharePoint) archiviert, der Direktlink zu diesen im ERP mit den betreffenden Bestellpositionen abgelegt werden.
CVS hat zunächst verschiedene Standard-Softwareprodukte auf dem Markt getestet, die auf das Verarbeiten von Rechnungen spezialisiert sind. Die evaluierten Anwendungen lieferten für diesen Anwendungsfall jedoch kein vollständig zufriedenstellendes Ergebnis. CVS hat sich deshalb auf die Suche nach einem Partner gemacht, der ihre speziellen Bedürfnisse umsetzen und eine nahtlose Integration der Individuallösung in ihre Systemlandschaft leisten kann. Diesen Partner hat CVS in Karakun und seiner HIBU-Plattform gefunden.
Dokumenteninhalt als Automationsgrundlage
Um die Datenextraktion in der gewünschten Qualität umsetzen zu können, waren Kenntnisse über die Darstellung der Daten in den zu erwartenden Dokumenten erforderlich (allgemeines Layout, Anordnung und Bezeichnung von einzelnen Informationselementen usw.). In einer initialen Analysephase wurde diesbezüglich eine erhebliche Variation beobachtet und es wurden viele ungewöhnliche, teilweise inkonsistente Layoutentscheidungen der Lieferanten v.a. bei den tabellarischen Dokumentabschnitten identifiziert. Auch bei den Bezeichnungen für bestimmte Angaben (z.B. Versandkosten, Verpackungskosten und Lieferscheinnummern) und deren Platzierungen waren substanzielle Unterschiede zu sehen.
Basierend auf den gewonnenen Erkenntnissen haben wir die HIBU-Plattform angepasst. Für dieses Projekt haben wir zunächst regelbasierte Extraktionskomponenten verwendet und erweitert, da für den Einsatz von Machine Learning (ML) nicht genügend geeignete Trainingsdaten vorhanden waren und die Kosten für deren Beschaffung/Erstellung den vertretbaren Rahmen weit überschritten hätten. Durch den produktiven Einsatz und manuelle Kontrollen generiert der regelbasierte Ansatz als Nebenprodukt über die Zeit jedoch ausreichende Trainingsdaten, um zukünftig HIBUs ML-Komponenten trainieren zu können.
Agile Herangehensweise
Mit einem MVP-Ansatz (Minimum Viable Product) haben wir diese erweiterten Extraktionskomponenten zunächst nur für die Layouts der 15 häufigsten Lieferanten konfiguriert. Automatische Tests stellen sicher, dass die Extraktion für diese Lieferanten vollständig und fehlerfrei funktioniert. Für alle anderen Lieferanten wurde eine generische Extraktionslogik konfiguriert, die primär „false positives“ minimiert und deshalb einzelne Zieldatenfelder im Zweifelsfall nicht befüllt. Zusätzlich haben wir mit dem Kunden eine Verarbeitungspipeline aufgesetzt, die für alle eingehenden E-Mails in zwei Mailboxen (Outlook 365) die relevanten PDF-Anhänge automatisch an die Extraktionskomponente übergibt und nach der Extraktion weitere Analysen sowie eine Validierung der extrahierten Daten durchführt. Die resultierenden Daten werden mit der zugrundeliegenden Bestellung abgeglichen und zur weiteren Verarbeitung an das ERP-System der Kundin übergeben. Die Originaldokumente und relevante Metadaten werden zudem automatisch im angebundenen DMS archiviert.
Nutzen wird schnell sichtbar
Schon nach kurzer Zeit beobachtete CVS einen erheblichen messbaren Nutzen, primär in Form von Zeitersparnis. Hierdurch ermutigt, bat uns die Kundin, die Extraktion für viele weitere Lieferanten zu konfigurieren, um auch für diese die Datenextraktion im Vergleich zur generischen Logik zu verbessern. Da lediglich Abweichungen von der generischen Logik konfiguriert werden mussten, waren bei diesen nur wenige Änderungen der Zieldatenfelder nötig.
Im Projektverlauf hat das Karakun-Team eine Reihe besonderer Herausforderungen gelöst. Exemplarisch hierfür stehen unvollständige, inkonsistente oder defekte Tabellenlayouts oder Daten, die wie eine Bestellposition aussehen, aber andere Informationen enthalten. Manche dieser Herausforderungen sind auch für Menschen beim manuellen Verarbeiten der Dokumente problematisch, andere hingegen nur für die maschinelle Verarbeitung.
Workflow-Automatisierung bringt die erhoffte Zeitersparnis und Entlastung
Der Betrieb läuft in hohem Masse automatisch. Mit verschiedenen Statuscodes informiert die ausgerollte Lösung das ERP, falls im Workflow unerwartete Ergebnisse auftreten. Diese Meldungen sowie die Resultate eigener Plausibilitätschecks zeigt das ERP den CVS-Mitarbeitenden in der Benutzeroberfläche an und ermöglicht ihnen unmittelbar manuelle Korrekturen. Hierzu kann auch das betreffende PDF bei Bedarf mit einem Mausklick geöffnet werden.
Im praktischen Betrieb zeigt sich, dass die umgesetzte Lösung einen grossen Anteil der eingehenden Auftragsbestätigungen und Rechnungen vollautomatisch ausliest und dass bei den anderen Dokumenten nur einzelne Felder manuell ergänzt oder korrigiert werden müssen. Den Mitarbeitenden bringt diese neue Lösung eine wesentliche Vereinfachung und Ablösung von monotonen Arbeitsschritten, das Unternehmen profitiert schon jetzt von massiven Einsparungen bzw. kann seine Knowledge-Worker für anspruchsvollere Aufgaben einsetzen.
Dieser Use-Case lässt sich branchenunabhängig auf eine Vielzahl weiterer Anwendungsfälle übertragen, bei denen dokumentenbasierte Prozesse automatisiert werden sollen. Die Menge der zu verarbeitenden Dokumente ist dabei unbegrenzt. Auch bei besonders herausfordernden Layouts (insbesondere bei tabellarisch dargestellten Informationen) können wir mit der HIBU-Plattform gezielt und zuverlässig die benötigten Angaben auslesen und in den richtigen Kontext bringen. Mit HIBU und mit unserer kombinierten Expertise in Language Intelligence und Softwareentwicklung ermöglichen wir unseren Kunden enormes Automations- und Einsparpotential.