AI-gestützte Dokumentenverarbeitung

Die Ausgangslage

Ausgangspunkt war ein sehr konkretes operatives Problem im Backoffice: Eingehende Rechnungen mussten manuell ausgelesen, nach einem internen Standard umbenannt und anschließend in bestehende Prozesse überführt werden. Das war fehleranfällig, zeitaufwendig und band täglich Ressourcen für Tätigkeiten, die strukturiert und wiederkehrend genug waren, um digital unterstützt zu werden.

Im nächsten Schritt wurde deutlich, dass das Problem nicht auf Rechnungen begrenzt war. In vielen Unternehmen werden Informationen aus Dokumenten noch immer manuell vom Blatt in digitale Systeme übertragen. Genau daraus entstand die Idee, aus einer punktuellen Lösung ein größeres Produkt zu entwickeln: eine Prozessplattform für dokumentenbasierte Arbeitsabläufe.

Die eigentliche Herausforderung

Die Herausforderung lag nicht nur darin, Daten aus Dokumenten zu extrahieren, sondern dies mit einer Genauigkeit und Verlässlichkeit zu tun, die im Unternehmensalltag wirklich tragfähig ist. Gerade im Dokumentenkontext sind Vorlagen selten sauber standardisiert. Jede Rechnung ist im Grunde eine Schneeflocke: Aufbau, Felder, Platzierung und Format unterscheiden sich teils stark voneinander. Hinzu kommen problematische Sonderfälle wie handschriftliche Ergänzungen, die gerade bei handwerklich geprägten Dokumenten regelmäßig vorkommen.

Deshalb wurde früh nicht nur ein einzelner technischer Ansatz verfolgt, sondern die Extraktion systematisch gegeneinander getestet. Ausgangspunkt war klassische OCR, die anschließend durch LLM-basierte Extraktion herausgefordert wurde. Das LLM erreichte bei den relevanten Feldern eine Korrektheit von rund 98 Prozent. Entscheidend war dabei ein sehr präzises Prompt Engineering: Das Modell sollte bei Unsicherheit lieber NULL zurückgeben als einen Wert, den es nicht sicher zuordnen konnte. Genau diese Verlässlichkeit machte den Unterschied zwischen einer Demo und einem produktiv nutzbaren System.

Vom Einzelfall zum Produkt

Aus der ursprünglichen Rechnungslogik wurde bewusst kein Spezialtool für nur einen Dokumenttyp, sondern eine abstraktere Produktbasis entwickelt. Etwa 90 Prozent der zugrunde liegenden Logik ließen sich so verallgemeinern, dass daraus eine Plattform für dokumentenbasierte Prozesse entstehen konnte. Die restlichen 10 Prozent blieben bewusst als Bereich für individuelle Nacharbeit oder kundenspezifische Erweiterung erhalten.

Dadurch wurde aus einer lokalen Lösung für Dateibenennung und Datenerfassung eine Plattform, die dokumentenbasierte Abläufe im Unternehmenskontext strukturiert verarbeitet, prüfbar macht und in weiterführende Workflows überführt.

Der Rechnungsworkflow

Im Rechnungsprozess lief der Workflow so ab, dass eingehende Dokumente per Bulk Upload in das System hochgeladen wurden. Ein in Europa DSGVO-konform betriebenes LLM extrahierte die relevanten Informationen aus den Dokumenten. Das Backend bereitete diese Daten auf und übergab sie an das Frontend.

Dort wurden alle Dokumente in einer List View mit Ampelsystem dargestellt. So war auf einen Blick erkennbar, ob die Auslesung vollständig war oder ob einzelne Werte fehlten. Über dieselbe Web-Anwendung konnte das jeweilige PDF direkt eingesehen und fehlende Informationen schnell ergänzt werden. In der Praxis war das nur selten nötig, weil die Extraktion in rund 95 bis 98 Prozent der Fälle bereits vollständig war. Gerade problematische Dokumente mit handschriftlichen Ergänzungen machten jedoch deutlich, warum ein Human-in-the-Loop-Konzept operativ sinnvoll ist.

Freigabe-Workflow und operative Einbettung

In vielen Unternehmen endet Dokumentenverarbeitung nicht bei der Extraktion. Rechnungen müssen häufig zusätzlich durch Verantwortliche freigegeben werden. Deshalb wurde dieser Schritt direkt in das System integriert.

Rechnungen konnten mit einem Klick zur Freigabe weitergeleitet werden. Der verantwortliche Entscheider erhielt automatisch eine E-Mail mit dem Hinweis, dass offene Rechnungen zur Freigabe vorliegen. Nach dem Einloggen konnte er diese freigeben oder ablehnen. Im Dashboard des Backoffice war unmittelbar sichtbar, welche Rechnungen freigegeben wurden und welche noch offen sind. Nach der Freigabe verschwanden erledigte Vorgänge aus der offenen Sicht in ein Archiv, damit der Status jederzeit klar und operativ handhabbar blieb.

Mehr als nur Rechnungen

Die Plattform war nicht nur für Rechnungen gedacht. Ein weiterer dokumentenbasierter Prozess betraf Verordnungen im Kontext eines 8A-Ablaufs. Dort gingen morgens Mitarbeiter physisch zum Briefkasten, entnahmen die eingegangenen Dokumente, scannten diese ein und übertrugen die relevanten Informationen manuell in das Zielsystem.

Mit dem Bulk-Upload und der KI-gestützten Extraktion konnte dieser Ablauf deutlich vereinfacht werden. Statt Daten von Hand zu übertragen, mussten Mitarbeitende nur noch im Human-in-the-Loop prüfen, ob das System an einer Stelle Unsicherheit erkannt hatte. Damit wurde aus manueller Datenerfassung ein kontrollierter Prüfprozess mit massiv reduziertem operativen Aufwand.

Plattformlogik, Rechte und Compliance

Technisch wurde die Lösung als Multi-Tenancy-API mit Rollen- und Rechtesystem aufgebaut. Je nach Mandant und Nutzerrolle konnte gesteuert werden, wer Dokumente hochladen darf, wer Freigaben erteilen kann und wer Format- oder Prozessregeln festlegen darf.

Zusätzlich spielte Compliance eine wichtige Rolle. Für Unternehmensprüfungen wurde ein Dokument erzeugt, das den gesamten Verarbeitungsablauf der Rechnungen nachvollziehbar beschreibt. Damit konnten nutzende Unternehmen direkt aus dem System heraus eine Grundlage herunterladen, um bei Prüfungen nachvollziehbar darzulegen, wie Dokumente verarbeitet werden und dass die Originale unverändert bleiben. Gerade im Rechnungsumfeld war diese GoBD-relevante Einordnung wichtig.

Produktansatz und meine Rolle

Das Produkt entstand nicht aus einer isolierten Entwicklerperspektive, sondern aus der Verbindung von operativem Problemverständnis, technischer Evaluierung und direkter Kundennähe. Der Ansatz war bewusst sales-first: Anforderungen wurden nicht im luftleeren Raum definiert, sondern direkt an realen Kundenprozessen gespiegelt, dokumentiert und priorisiert.

Meine Rolle begann zunächst als Product Lead und ging später in die Verantwortung als Business Unit Leiter über. Dazu gehörten die Produktidee, die Priorisierung von Features, das Prompt Engineering für die Extraktionslogik, die Übersetzung realer Prozesse in digitale Abläufe sowie die Führung eines cross-funktionalen Setups aus Entwicklung und Vertrieb.

Die Wirkung im Alltag

Das System reduzierte manuellen Aufwand dort, wo zuvor Informationen aus Dokumenten von Hand in Prozesse oder Zielsysteme übertragen werden mussten. Statt Datenerfassung als tägliche Routinearbeit zu organisieren, wurde ein prüfbarer, steuerbarer und weitgehend automatisierter Ablauf geschaffen.

Der eigentliche Wert lag dabei nicht nur in der Extraktion selbst, sondern in der Verbindung aus KI, Workflow, Freigabe, Rollenlogik und operativer Einbettung. Genau dadurch wurde aus einer technischen Einzelfunktion eine Plattform, die manuelle Backoffice-Prozesse im Mittelstand strukturell entlasten kann.

Zurück zur Übersicht