KI-gestützte Förderantragsprüfung
KI unterstützt Sachbearbeitende bei der Prüfung von Förderanträgen auf Vollständigkeit, Förderfähigkeit und formale Fehler, strukturierter, schneller und konsistenter als rein manuelle Durchsicht.
- Problem
- Die Prüfung von Förderanträgen auf Förderfähigkeit ist zeitintensiv und komplex: Sachbearbeitende müssen Förderrichtlinien mit Antragsinhalten abgleichen, fehlende Unterlagen erkennen und Ermessensspielräume abwägen, bei steigendem Antragsvolumen und zunehmend komplexen Programmregeln.
- KI-Lösung
- Ein KI-System liest Förderrichtlinie und Antragsdokumente, prüft systematisch auf Vollständigkeit und Förderfähigkeitsmerkmale, markiert Konfliktpunkte und liefert Sachbearbeitenden eine strukturierte Prüfliste, die Entscheidung trifft immer der Mensch.
- Typischer Nutzen
- Prüfzeit je Antrag sinkt um 30–50 Prozent, Nachforderungsquote beim Ersteingang reduziert sich, konsistente Prüfung auch bei wechselnden Sachbearbeitenden, Ermessensspielräume bleiben klar beim Menschen.
- Setup-Zeit
- 12–16 Wochen bis Pilotbetrieb inkl. Regelformalisierung
- Kosteneinschätzung
- 10.000–40.000 € Einrichtung, 1.000–4.000 €/Monat laufend
Es ist Montag, 8:47 Uhr.
Sachbearbeiterin Karoline Rüther öffnet den nächsten Förderantrag im Stapel, einen Digitalisierungsantrag eines kleinen Metallverarbeitungsbetriebs aus dem Umland. 34 Seiten, drei Anhänge, ein handgeschriebener Finanzierungsplan. Ihr erstes Ziel: herausfinden, ob der Betrieb überhaupt förderfähig ist, bevor sie die nächsten zwei Stunden in eine inhaltliche Prüfung investiert.
Sie öffnet die Förderrichtlinie des Landes, 62 Seiten, Stand Juli 2024, die dritte Fassung in zwei Jahren. Seite 11 enthält die Förderfähigkeitskriterien. Seite 29 die Ausnahmeliste für Kleinstbetriebe. Seite 41 den Abschnitt über Vorrangigkeitsprüfungen gegenüber anderen Förderprogrammen. Sie kennt die Richtlinie gut, aber „gut” heißt nicht, dass sie jeden Querverweis sofort im Kopf hat.
Zwei Stunden später hat sie ihre Einschätzung: Der Betrieb liegt knapp unterhalb der Mitarbeiterschwelle für diesen Programmweg. Aber auf Seite 31 gibt es eine Öffnungsklausel für Betriebe mit bestimmten Investitionsvorhaben im produzierenden Gewerbe. Gilt das hier? Sie schreibt sich eine Notiz, fragt am Nachmittag ihre Kollegin, die aber gerade im Urlaub ist.
Der Antrag landet in der Warteschleife. Bearbeitungszeit laut Bescheid: bis zu zehn Wochen. Der Unternehmer ruft mittwochs an.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
Die Förderantragsprüfung ist kein Randproblem der deutschen Verwaltung. Förderbehörden auf Bundes- und Landesebene bearbeiten jährlich Zehntausende von Anträgen, aus Programmen zur Digitalisierung, Energieeffizienz, Aus- und Weiterbildung, regionalen Strukturhilfen und EU-Kofinanzierungsprojekten. Und bei jedem einzelnen Antrag muss dieselbe Frage beantwortet werden: Passt dieser konkrete Sachverhalt zu diesen konkreten Programmregeln?
Das Problem ist nicht, dass Sachbearbeitende diese Prüfung nicht können. Das Problem ist, dass sie sie hunderte Male im Jahr wiederholen, mit steigendem Regelwerk, wechselnden Förderbedingungen und konstantem Zeitdruck.
Erfahrungswerte aus Verwaltungsprojekten zeigen, dass 35 bis 40 Prozent der Bearbeitungszeit im deutschen Förderwesen auf formale Prüfschritte entfallen, Vollständigkeit der Unterlagen, Förderfähigkeit der Antragsteller, Einhaltung von Fristen und Formerfordernissen, noch bevor die eigentliche inhaltliche Prüfung beginnt. Das ist der Teil, der sich durch strukturierte KI-Unterstützung beschleunigen lässt.
Typische Muster, die Sachbearbeitende täglich kosten:
- Mehrfachsuche in der Förderrichtlinie, dieselben Paragraphen für ähnliche Konstellationen immer wieder nachschlagen, weil Querverweise nicht intuitiv sind
- Grenzfälle ohne klare Subsumtion, Antragsteller, die nicht eindeutig in eine Förderkategorie fallen, und bei denen Ermessen gefragt ist, das Zeit braucht
- Inkonsistenz bei Vertretungen, wenn eine Sachbearbeiterin erkrankt, prüft ihre Vertretung nach eigenem Verständnis der Richtlinie, mit unterschiedlichen Ergebnissen
- Wissenssilos, neue Kolleginnen und Kollegen brauchen Monate, um die Eigenheiten eines Förderprogramms vollständig zu kennen
Und der Druck wächst: Die Bundesregierung hat sich verpflichtet, Förderverfahren zu vereinfachen und Bearbeitungszeiten zu verkürzen. Gleichzeitig steigt das Antragsvolumen, besonders in Digitalisierungs- und Transformationsprogrammen.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-gestützter Prüfung |
|---|---|---|
| Prüfzeit je Antrag (Vollständigkeit + Förderfähigkeit) | 45–90 Minuten | 15–30 Minuten |
| Nachforderungsquote beim Ersteingang | 30–50 % | 15–25 % |
| Konsistenz bei gleichartigen Anträgen | Abhängig von Sachbearbeitender | Strukturierte Checkliste als Ankerpunkt |
| Einarbeitung neue Mitarbeitende (Programmkenntnisse) | 3–6 Monate | 4–8 Wochen mit KI-Regelunterstützung |
| Rückverfolgbarkeit der Prüfentscheidung | Notizen, oft lückenhaft | Dokumentierte Prüfpfade mit KI-Output |
Die Zahlen sind Erfahrungswerte aus Verwaltungsprojekten und vergleichbaren Automatisierungsinitiativen, keine repräsentative Studie. Die tatsächliche Zeitersparnis hängt stark von der Komplexität des Förderprogramms, der Qualität der eingereichten Unterlagen und der Reife des eingesetzten Systems ab.
Einschätzung auf einen Blick
Zeitersparnis, hoch (4/5)
Eine strukturierte KI-Prüfunterstützung spart je nach Programmkomplexität 30–60 Minuten pro Antrag. Bei 50 Anträgen pro Monat entspricht das zwei bis vier Personentagen monatlich, ein echter Kapazitätsgewinn, der in dieser Kategorie nur von KI-gestützter Antragsprüfung und der automatischen Bescheidgenerierung übertroffen wird. Die Zeitersparnis tritt schnell ein, nicht erst nach Monaten der Systemoptimierung.
Kosteneinsparung, mittel (3/5)
Die Einsparung entsteht indirekt über weniger Nachforderungskorrespondenz, kürzere Bearbeitungszeiten und entlastete Kapazitäten. Direkt monetarisierbar ist sie schwerer als bei Systemen, die Vollkosten pro Bescheid direkt zählen. Einrichtungskosten von 10.000–40.000 Euro liegen im mittleren Bereich unter den verglichenen Verwaltungsanwendungsfällen.
Schnelle Umsetzung, mittel (3/5)
12–16 Wochen bis zum Pilotbetrieb sind realistisch, nicht wegen der Technik, sondern wegen der Regelformalisierung. Wer die Förderfähigkeitskriterien eines Programms als maschinenlesbare Prüfliste formulieren will, muss damit rechnen, dass das Fachwissen zuerst aus den Richtlinien extrahiert und validiert werden muss. Schneller geht nur, wer mit einem Sofort-Einstieg per ChatGPT oder Claude und manuellem Prompt beginnt, das dauert einen Nachmittag.
ROI-Sicherheit, hoch (4/5)
Zwei zentrale KPIs sind direkt messbar: Prüfzeit pro Antrag (vor/nach) und Nachforderungsquote beim Ersteingang. Beides sind Kennzahlen, die viele Förderbehörden ohnehin erheben. Der ROI ist damit einer der nachweisbarsten unter den Verwaltungsanwendungsfällen, vergleichbar mit KI-gestützter Antragsprüfung, die mit einer 5 bewertet ist und primär Vollständigkeit prüft.
Skalierbarkeit, mittel (3/5)
Das System skaliert gut innerhalb eines Förderprogramms, mehr Anträge, gleicher Aufwand. Aber jedes neue Förderprogramm braucht eine eigene Regelformalisierung. Eine einmal konfigurierte Lösung überträgt sich nicht automatisch auf ein anderes Programm mit anderen Kriterien. Das unterscheidet diese Lösung von universellen Ansätzen wie dem Bürger-Chatbot, der einmal aufgesetzt alle Anfragen bedient.
Richtwerte, stark abhängig von Programmkomplexität, Antragsvolumen und Reifegrad der eingesetzten Infrastruktur.
Was das System konkret macht
Die Kerntätigkeit einer KI-gestützten Förderantragsprüfung folgt einem einfachen Prinzip: Das System bekommt zwei Inputs, die Förderrichtlinie und den eingereichten Antrag, und gibt einen strukturierten Output: eine Prüfliste mit Ampelstatus.
Technisch läuft das über Generative KI in Kombination mit Retrieval-Augmented Generation (RAG):
Schritt 1: Dokumentenextraktion
Der eingereichte Antrag, oft ein PDF-Paket mit Anhängen, wird durch ein Dokumentenerkennungssystem verarbeitet. Relevante Felder werden extrahiert: Antragsteller, Investitionssumme, Beschäftigtenzahl, Branche, Projektziel, beigefügte Unterlagen.
Schritt 2: Regelabgleich
Ein LLM liest die Förderrichtlinie als Kontext und prüft die extrahierten Antragsdaten gegen die definierten Kriterien: Ist der Antragsteller grundsätzlich förderfähig? Sind alle Pflichtunterlagen beigefügt? Welche Ausnahme- oder Öffnungsklauseln könnten greifen? Gibt es formale Fehler in der Berechnung?
Schritt 3: Strukturierte Ausgabe
Das Ergebnis ist keine Entscheidung, sondern eine Prüfliste: Grün für eindeutig erfüllte Kriterien, Gelb für Grenzfälle und Ermessenssituationen, Rot für fehlende Unterlagen oder erkennbare Ausschlussgründe. Jede Markierung enthält einen Verweis auf den relevanten Paragraphen der Förderrichtlinie.
Was das System nicht macht: Es entscheidet nicht. Es empfiehlt nicht die Ablehnung oder Bewilligung. Es bereitet vor, strukturiert, nachvollziehbar und mit vollständiger Quellenangabe. Die Sachbearbeiterin prüft, gewichtet Ermessensspielräume und trifft die Entscheidung. Das ist kein Designfehler, sondern eine rechtliche Notwendigkeit, dazu mehr im folgenden Abschnitt.
Was in der Praxis hilft, und was nicht
Das System hilft besonders bei Routineprüfungen mit klaren Kriterien: Ist das Unternehmen zum Zeitpunkt der Antragstellung angemeldet? Hat es weniger als 250 Beschäftigte? Sind alle Pflichtformulare beigefügt und ausgefüllt? Diese Fragen beantwortet KI schnell und zuverlässig.
Es hilft weniger bei komplexen Ermessensentscheidungen: Wenn die Förderrichtlinie Spielraum lässt, etwa ob ein Projekt „überwiegend innovativen Charakter” hat, ist das eine Wertungsfrage, die die Sachbearbeiterin kennt und das System nicht.
Die Bundesagentur für Arbeit hat 2024 mit einem vergleichbaren Ansatz für Studienbescheinigungen begonnen: Ein Klassifikationsmodell, trainiert mit Dokumenten aller 422 akkreditierten Hochschulen, prüft die Echtheit von über 150.000 Studienbescheinigungen jährlich, eine repetitive, regelgebundene Aufgabe, die sich für automatische Vorprüfung eignet.
Rechtliche Grenzen: §35a VwVfG und der EU AI Act
Dieser Abschnitt ist kein Hinweis auf einen abstrakten Datenschutzaspekt. Er beschreibt eine harte rechtliche Grenze, die die gesamte Systemarchitektur prägt.
§35a Verwaltungsverfahrensgesetz (VwVfG) erlaubt vollständig automatisierte Verwaltungsakte nur, wenn drei Bedingungen gleichzeitig gelten: erstens muss eine Rechtsvorschrift die vollständige Automatisierung ausdrücklich zulassen, zweitens darf kein Ermessen ausgeübt werden, und drittens darf kein Beurteilungsspielraum bestehen.
Für Förderanträge bedeutet das konkret: Solange Förderrichtlinien Ermessen enthalten, und fast alle tun das, kann KI keine bindenden Entscheidungen treffen. Das System darf Vorprüfungen durchführen, Checklisten erstellen, Inkonsistenzen markieren und Entwürfe für Nachforderungsschreiben generieren. Aber die finale Bewilligungs- oder Ablehnungsentscheidung ist und bleibt ein Verwaltungsakt, der von einer autorisierten Sachbearbeiterin oder einem Sachbearbeiter getroffen wird.
Das ist kein Nachteil. Es ist der Sinn dieser Lösung: KI übernimmt die systematische Vorarbeit, der Mensch die Entscheidungsverantwortung.
Der EU AI Act klassifiziert KI-Systeme, die für Verwaltungsentscheidungen verwendet werden und wesentliche Auswirkungen auf Personen oder Unternehmen haben, als Hochrisiko-KI (Annex III). Das bedeutet: Wer ein solches System einsetzt, muss es registrieren, dokumentieren, auf Diskriminierungsrisiken prüfen und ein laufendes Monitoring sicherstellen. Die Anforderungen gehen deutlich über eine einfache DSGVO-Prüfung hinaus und sollten vor dem Aufbau eines produktiven Systems mit dem Datenschutzbeauftragten und der Rechtsabteilung abgestimmt werden.
Praktische Konsequenz für das System-Design: Die KI-Ausgabe muss immer als Vorschlag und niemals als Entscheidung formuliert sein. Jede Prüfliste enthält die Quellenreferenz, damit die Sachbearbeiterin die Einschätzung direkt nachprüfen und abweichen kann. Abweichungen sollten dokumentiert werden. Das Vier-Augen-Prinzip bleibt bei allen Bescheiden über einem Betragsschwellenwert angebracht, auch wenn das System sauber arbeitet.
Konkrete Werkzeuge, was wann passt
Je nach vorhandener Infrastruktur und technischem Reifegrad gibt es sehr unterschiedliche Einstiegspunkte.
ChatGPT oder Claude, wenn du morgen starten willst
Beide Assistenten können eine Förderrichtlinie als Kontext aufnehmen und strukturierte Prüffragen zum Antrag beantworten. Der Einstieg kostet einen Nachmittag und nichts außer einem Benutzerkonto. Die Einschränkung: Ohne API-Integration ist es ein manueller Prozess, die Sachbearbeiterin kopiert relevante Antragsstellen in den Chat. Das ist für sporadische Prüfungen oder als Einstiegstest sinnvoll, aber kein skalierbarer Workflow für hunderte Anträge. Datenschutzhinweis: US-Hosting, keine Behördentauglichkeit für personenbezogene Antragsdaten im Standardbetrieb.
Microsoft 365 Copilot + Power Automate, für M365-Behörden
Wer Microsoft 365 bereits nutzt, hat den kürzesten Weg zu einer integrierten Lösung. Power Automate übernimmt den Workflow: Antrag eingeht, Dokumente werden extrahiert, Copilot befragt die Förderrichtlinie aus dem SharePoint, die Prüfliste landet im Ticket-System. Für Behörden, die bereits auf Microsoft-Infrastruktur standardisiert sind, ist das die praktischste Option, Datenhaltung in EU-Rechenzentren über das EU Data Boundary-Programm verfügbar. Lizenzkosten: Copilot ab 15,60 €/Person/Monat (als M365-Add-on), Power Automate Premium ab 13 €/Person/Monat.
Azure Document Intelligence + Azure OpenAI Service, für skalierbare Lösung
Die technisch robusteste Option für Förderbehörden mit hohem Antragsvolumen: Azure Document Intelligence extrahiert strukturiert Felder aus Antragsformularen und Anhängen, Azure OpenAI Service führt den Regelabgleich mit der Förderrichtlinie durch. EU-Hosting in West Europe oder Switzerland North, DSGVO-konforme Vertragsgestaltung standardmäßig verfügbar. Entwickleraufwand erforderlich; realistischer Budgetrahmen: 15.000–40.000 Euro Einrichtung, 1.000–3.000 Euro monatlich laufend je nach Volumen. Für Behörden, die langfristig mehrere Förderprogramme über die Plattform abwickeln wollen, ist das die skalierbarste Grundlage.
govdigital, für maximale Datensouveränität
Wer als Landes- oder Bundesbehörde auf US-Cloud-Anbieter verzichten muss oder will, ist bei govdigital richtig. Die öffentlich-rechtliche Genossenschaft bietet KI-Infrastruktur ausschließlich für Behörden, mit Datenhosting in deutschen Rechenzentren ohne US Cloud Act-Risiko. Die gd.KI-Werkstatt entwickelt gemeinsam mit Mitgliedsbehörden wiederverwendbare KI-Lösungen. Einschränkung: Portfolio noch im Aufbau, Beschaffung über Rahmenverträge mit Mitgliedsorganisationen wie Dataport oder ekom21. Kein direkter Self-Service.
Zusammenfassung: Wann welcher Ansatz
- Pilottest oder sporadische Nutzung → ChatGPT oder Claude manuell
- Behörde nutzt Microsoft 365, Antragsvolumen unter 500/Jahr → Microsoft 365 Copilot + Power Automate
- Hohes Antragsvolumen, dedizierte IT-Kapazität → Azure Document Intelligence + Azure OpenAI Service
- Strenge Anforderungen an Datensouveränität (keine US-Anbieter) → govdigital als Infrastruktur
Datenschutz und Datenhaltung
Förderanträge enthalten regelmäßig personenbezogene Daten: Name, Adresse, Kontonummer, Beschäftigtenzahlen, Jahresabschlüsse. Für die KI-gestützte Verarbeitung gilt DSGVO Art. 28, der Auftragsverarbeitungsvertrag (AVV) mit dem Systemanbieter ist Pflicht, nicht Option.
Für die genannten Werkzeuge im Überblick:
- Azure Document Intelligence + Azure OpenAI Service (EU-Region): EU-Hosting in Niederlande oder Schweiz, AVV standardmäßig verfügbar, kein Training auf Kundendaten, datenschutzrechtlich für Behörden geeignet, wenn EU Data Boundary aktiviert ist
- Microsoft 365 Copilot mit EU Data Boundary: Daten verbleiben in europäischen Rechenzentren, AVV über Microsoft-Portal abrufbar, empfohlene Option für bestehende M365-Behörden
- ChatGPT / Claude (Standardbetrieb): US-Hosting, kein EU Data Boundary für Behörden. Für Tests mit nicht-personenbezogenen Beispieldaten verwendbar, nicht für produktiven Antragsbetrieb mit echten Antragstellerdaten
- govdigital: Deutsche Rechenzentren, kein Zugriff durch US Cloud Act, öffentlich-rechtlicher Betrieb, maximale Datensouveränität, aber nur für öffentliche Einrichtungen zugänglich
Zusätzlich zur DSGVO-Prüfung: Der EU AI Act klassifiziert Systeme mit Auswirkungen auf Verwaltungsentscheidungen als Hochrisiko-KI. Das erfordert eine Risikobewertung, technische Dokumentation und ein laufendes Monitoring, noch bevor das System in den Produktivbetrieb geht. Frühzeitige Einbindung von Datenschutzbeauftragten und juristischer Beratung spart spätere Nacharbeit.
Was es kostet, realistisch gerechnet
Soforteinstieg (manueller LLM-Workflow)
- ChatGPT Business oder Claude Team: ca. 25 €/Person/Monat
- Aufwand: Ein bis zwei Tage für Prompt-Entwicklung und Richtlinienaufbereitung
- Skalierung: Nicht, funktioniert für drei bis fünf Anträge täglich, nicht für hunderte
Mittlerer Ausbaugrad (Microsoft 365 Copilot + Power Automate)
- Einmalig: 8.000–18.000 € Einrichtungsaufwand (Workflow-Konfiguration, Richtlinienaufbereitung)
- Laufend: 3.000–6.000 €/Monat bei 30–50 Lizenzen (Microsoft 365 Copilot + Power Automate Premium)
- Skalierung: Gut für ein bis drei Förderprogramme mit bestehendem M365-Ökosystem
Dedizierte Lösung (Azure Document Intelligence + Azure OpenAI Service)
- Einmalig: 15.000–40.000 € Entwicklung, Regelformalisierung, Integration in Fachverfahren
- Laufend: 1.000–4.000 €/Monat (Azure-Infrastruktur + API-Kosten, volumenabhängig)
- Skalierung: Technisch unbegrenzt, Volumen skaliert ohne proportional steigende Personalkosten
Wie du den ROI tatsächlich misst
Zwei Kennzahlen reichen: Prüfzeit je Antrag (vor/nach, stichprobenweise erhoben) und Nachforderungsquote beim Ersteingang (Anteil der Anträge, bei denen im ersten Schritt Unterlagen nachgefordert werden). Beide sind einfach zu messen, beide sind in vielen Förderbehörden bereits als interne KPI bekannt. Wer eine Referenzmessung vor dem Rollout macht, hat nach drei Monaten belastbare Zahlen.
Konservatives Szenario
Eine Sachbearbeiterin prüft im Schnitt zehn Anträge pro Woche à 60 Minuten Prüfzeit. KI-Unterstützung spart 25 Minuten je Antrag, konservativ, realistisch. Das sind 250 Minuten pro Woche, vier Stunden pro Person. Bei fünf Sachbearbeitenden: 20 Stunden wöchentlich. Bei einem Bruttostundensatz von 25 €: 500 Euro pro Woche, 26.000 Euro jährlich, und das bei einem System, das nach Jahr eins läuft und skaliert, ohne dass der Stundensatz steigt.
Typische Einstiegsfehler
1. Die Förderrichtlinie ins System laden und hoffen.
Das häufigste Missverständnis: Ein PDF der Förderrichtlinie in ChatGPT hochladen und davon ausgehen, das System „versteht” jetzt das Programm. In der Praxis ist das ein schlechter Start. Förderrichtlinien sind für Menschen geschrieben, nicht für Maschinen: Sie enthalten Querverweise auf andere Rechtsvorschriften, implizite Ausnahmen und Formulierungen, die Ermessen suggerieren, ohne es explizit zu nennen. Wer eine Richtlinie unverarbeitet einlädt, bekommt sicherere Antworten als ohne, aber auch regelmäßig falsche. Lösung: Vor dem Einsatz eine strukturierte Prüfliste der Förderfähigkeitskriterien anlegen. Jedes Kriterium als klare, prüfbare Frage formulieren. Das ist der eigentliche Aufwand, und er lohnt sich.
2. Das System mit Ermessenssituationen allein lassen.
Die Versuchung ist real: Das System liefert schnelle Antworten, auch auf komplexe Grenzfälle. Sachbearbeitende beginnen, die KI-Ausgabe unhinterfragt zu übernehmen, auch dort, wo Ermessen gefragt ist. Das ist falsch und rechtlich problematisch. Lösung: Systemseitig Kategorien einbauen, die Ermessensfragen als solche markieren. Die Ausgabe für Grenzfälle sollte nie eine Empfehlung sein, sondern eine Darstellung der relevanten Paragraph-Stellen, und die explizite Kennzeichnung: „Hier ist eine Sachentscheidung erforderlich.”
3. Das Regelwerk einmal aufsetzen und nie wieder anfassen.
Förderrichtlinien ändern sich. Jede Haushaltsgesetzgebung, jede EU-Beihilferechtsänderung, jede Programmverlängerung bringt neue Kriterien. Ein System, dessen Regelwerk auf der Fassung vom Vorjahr basiert, gibt selbstsicher falsche Einschätzungen aus, und das fällt oft erst auf, wenn ein Bescheid angefochten wird. Lösung: Eine namentlich benannte Person ist für die Pflege des Regelwerks zuständig. Jede Änderung der Förderrichtlinie löst einen Updateprozess aus. Das ist kein technisches Feature, das ist eine organisatorische Verantwortlichkeit.
4. Die Ausgabe nicht dokumentieren.
Wenn ein Bescheid später angefochten wird und das KI-System die Sachbearbeiterin bei der Prüfung unterstützt hat, stellt sich die Frage: Was hat das System ausgegeben, und welche Entscheidung hat die Sachbearbeiterin getroffen? Wer diese Frage nicht beantworten kann, hat ein Haftungsproblem. Lösung: Die KI-Ausgabe für jeden Antrag, auch wenn sie verworfen wurde, als Teil der Verfahrensakte speichern. Das klingt bürokratisch, ist aber die einzige Form von Revision-Readiness.
Was mit der Einführung wirklich passiert, und was nicht
Die technische Einführung ist selten das eigentliche Problem. Das eigentliche Problem ist die Regelformalisierung, und die Bereitschaft im Team, einen neuen Arbeitsschritt in den Workflow zu integrieren.
Die Regelformalisierung dauert länger als erwartet. Die typische Förderbehörde hat fünf bis zehn aktive Förderprogramme mit jeweils unterschiedlichen Richtlinien. Jede Richtlinie muss in prüfbare Kriterien übersetzt werden. Das macht niemand nebenbei, es braucht Fachkenntnisse, Zeit und jemanden, der entscheidet, welche Grenzfälle explizit und welche dem Ermessen überlassen bleiben. Realistischer Aufwand: zwei bis vier Wochen pro Förderprogramm, bei guter Beteiligung der Sachbearbeitenden.
Die erfahrenen Sachbearbeitenden haben die meiste Kenntnis, und die meisten Fragen. Wer seit Jahren dasselbe Förderprogramm prüft, kennt Grenzfälle, Ausnahmen und informelle Auslegungshinweise, die nirgendwo dokumentiert sind. Wenn ein KI-System eine andere Einschätzung liefert, entsteht sofort die Frage: Vertraue ich dem System oder meiner Erfahrung? Die Antwort sollte immer sein: der eigenen Erfahrung, das System unterstützt, entscheidet nicht. Diese Haltung muss von der Behördenleitung klar kommuniziert werden, sonst entstehen zwei parallele Prüflogiken.
Die erste Fehleinschätzung des Systems zerstört Vertrauen. Wenn das System in einem frühen Antrag etwas als förderfähig markiert, was die Sachbearbeiterin als nicht förderfähig einschätzt, und sie hat recht, dann dauert es Wochen, das Vertrauen zurückzugewinnen. Lösung: Vor dem Rollout intensive Testphase mit historischen Anträgen. Das System sollte an bereits entschiedenen Fällen gemessen werden, bevor es bei neuen eingesetzt wird. Ziel ist keine Perfektion, aber eine Fehlerrate, die das Team als akzeptabel einschätzt.
Was hilft:
- Sachbearbeitende in die Formulierung der Prüfkriterien einbeziehen, nicht als nachträgliche Abnahme, sondern als aktive Mitgestaltung
- Die erste Testphase auf ein einzelnes Förderprogramm beschränken, nicht alle auf einmal
- Eine explizite Feedbackrunde nach vier Wochen: Welche Einschätzungen waren hilfreich? Welche lagen daneben? Was fehlt?
- Den Mehrwert sichtbar machen: Wenn das System eine übersehene Inkonsistenz in einem Antrag findet, die händisch übersehen worden wäre, wird das zum Argument für das System
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Förderprogramm auswählen und Richtlinie analysieren | Woche 1–2 | Ein Förderprogramm auswählen, Förderrichtlinie systematisch durcharbeiten, Förderfähigkeitskriterien inventarisieren | Mehr Ermessenstatbestände als erwartet, manche Kriterien lassen sich nicht binär formulieren |
| Prüfkriterien formalisieren | Woche 2–4 | Jedes Kriterium als prüfbare Frage formulieren, Grenzfälle kategorisieren, Ermessenspunkte kennzeichnen | Sachbearbeitende haben unterschiedliche Auslegungen, Klärungsbedarf höher als erwartet |
| System konfigurieren und testen | Woche 5–8 | Technisches Setup, Prompts entwickeln, historische Anträge testweise prüfen lassen | Systemausgabe deckt sich in 15–25 % der Fälle nicht mit Erfahrungswissen, Regelformulierung nachschärfen |
| Interne Pilotphase | Woche 9–12 | System läuft parallel zur manuellen Prüfung, Sachbearbeitende vergleichen Ausgaben, Feedback systematisch erfassen | Nutzungsrate bleibt niedrig, wenn kein klarer Integrationsschritt in den Workflow existiert |
| Rollout im Produktivbetrieb | Woche 13–16 | System als Pflicht-Prüfschritt im Workflow, Ausgaben werden in Akte dokumentiert | Erste Regeländerung in der Förderrichtlinie, Updateprozess muss sofort funktionieren |
Häufige Einwände, und was dahintersteckt
„KI darf bei Verwaltungsentscheidungen nicht eingesetzt werden.”
Dieser Einwand verwechselt Entscheidungsunterstützung mit Entscheidungsautomatisierung. §35a VwVfG reguliert vollständig automatisierte Verwaltungsakte, nicht den Einsatz von KI als Assistenz. Eine Sachbearbeiterin, die eine KI-generierte Prüfliste als einen von mehreren Inputs verwendet und dann selbst entscheidet, bewegt sich vollständig im rechtlichen Rahmen. Die Unterscheidung ist entscheidend: Das System entscheidet nicht, es bereitet vor. Wie jedes andere Hilfsmittel auch.
„Unsere Förderrichtlinien sind zu komplex für ein KI-System.”
Komplexität ist kein Ausschlussgrund, sie ist ein Kalibrierungsproblem. Ein System muss nicht jeden Grenzfall richtig bewerten; es muss die eindeutigen Fälle verlässlich erkennen und die Grenzfälle als solche markieren. Wenn 60 Prozent der Anträge klar förderfähig oder klar ausgeschlossen sind, spart das System schon bei diesen 60 Prozent signifikant Zeit, und die Sachbearbeiterin wendet ihre Expertise auf die verbleibenden 40 Prozent an.
„Was, wenn das System einen Antrag fälschlicherweise als nicht förderfähig einstuft?”
Das ist das richtige Risikodenken, aber die Antwort liegt im System-Design, nicht im Verzicht. Die KI-Ausgabe ist kein Ablehnungsbescheid. Sie ist eine Prüfliste mit Quellenverweisen. Wenn das System „potentieller Ausschlussgrund in §8 Abs. 2” markiert, prüft die Sachbearbeiterin §8 Abs. 2, und entscheidet. Das Risiko einer fehlerhaften automatischen Ablehnung entsteht nur, wenn man den menschlichen Überprüfungsschritt weglässt. Das ist der Fehler, nicht die KI.
Rechtliche Besonderheiten: Was vor dem Produktivbetrieb geklärt sein muss
Diese Punkte sind kein bürokratisches Anhängsel, sie sind Voraussetzungen:
Datenschutz-Folgenabschätzung (DSFA) nach Art. 35 DSGVO
Sobald ein KI-System systematisch personenbezogene Daten aus Förderanträgen verarbeitet, ist eine DSFA erforderlich. Das gilt unabhängig vom eingesetzten Anbieter. Die DSFA dokumentiert die Risiken für Antragsteller und die technisch-organisatorischen Schutzmaßnahmen, sie muss vor dem Produktivbetrieb abgeschlossen sein.
EU AI Act Hochrisiko-Einstufung
KI-Systeme, die für die Bewertung von Personen oder Unternehmen im Kontext staatlicher Leistungen eingesetzt werden, fallen unter Anhang III des EU AI Act (Hochrisiko-KI). Die Anforderungen umfassen technische Dokumentation, Transparenzpflichten gegenüber Antragstellern und ein laufendes Monitoring auf Diskriminierungsrisiken. Zeitplanung: EU AI Act ist seit August 2024 in Kraft, die Hochrisiko-Anforderungen gelten ab August 2026.
Dienstanweisung zur KI-Nutzung
Ohne eine behördeninterne Dienstanweisung, wer darf das System nutzen, wie ist die Ausgabe in der Akte zu dokumentieren, welche Entscheidungen bedürfen Vier-Augen-Prüfung, fehlt der rechtliche Rahmen für die individuelle Sachbearbeitende. Das schützt sie und die Behörde.
Personalrat frühzeitig einbinden
KI-Systeme, die Arbeitsergebnisse von Mitarbeitenden bewerten oder dokumentieren könnten, sind mitbestimmungspflichtig. Wer den Personalrat erst nach der Beschaffung einbezieht, riskiert einen Stopp des Rollouts. Frühe Einbindung, schon in der Bedarfsanalyse, spart Zeit und verhindert Konflikte.
Woran du merkst, dass das zu dir passt
- Ihr bearbeitet mehr als 200 Förderanträge pro Jahr in einem einzelnen Förderprogramm, darunter lohnt der Regelformalisierungsaufwand kaum
- Die Förderrichtlinie enthält klare, prüfbare Kriterien, Umsatzschwellen, Beschäftigtenzahlen, Branchenzuordnungen, neben Ermessenstatbeständen
- Sachbearbeitende verbringen regelmäßig 45 Minuten oder mehr mit der reinen Prüfung von Vollständigkeit und Grundförderfähigkeit, bevor die inhaltliche Prüfung beginnt
- Ihr habt bereits einen digitalen Einreichungsweg oder scannt Papiereingänge ein, papierbasierte Antragsverarbeitung ohne Digitalisierungsschritt setzt dem System eine harte Grenze
- Vertretungsregelungen sind ein tatsächliches Problem, wenn Urlaub oder Krankheit zu inkonsistenten Prüfergebnissen führt, adressiert KI-Unterstützung genau das
Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:
-
Unter ca. 200 Anträge pro Jahr je Förderprogramm. Dann ist die Amortisation des Regelformalisierungsaufwands unrealistisch. Für kleine Antragszahlen ist ein gut gepflegtes Prüfschema in Papierform oder Excel effizienter, und ehrlicher.
-
Förderrichtlinie mit überwiegendem Ermessensanteil. Wenn die meisten Prüfschritte genuinen Beurteilungsspielraum erfordern, Förderpriorität, strategische Passung, gesamtwirtschaftliche Auswirkungen, ist das System vor allem für den kleinen Anteil gebundener Entscheidungen hilfreich. Das Verhältnis von Aufwand zu Nutzen stimmt dann kaum.
-
Kein digitaler Eingangskanal und keine Scan-Infrastruktur. Solange Anträge nur als Papierpost eingehen und nicht digitalisiert werden, fehlt dem System der Input. Erst digitalisieren, dann automatisieren, nie umgekehrt.
Das kannst du heute noch tun
Lade die aktuelle Förderrichtlinie deines Hauptprogramms in Claude oder ChatGPT hoch. Nimm dann einen bereits entschiedenen Antrag aus den letzten Monaten, bewilligt oder abgelehnt, und stelle dem System die Frage: „Prüfe diesen Antrag auf Vollständigkeit und Grundförderfähigkeit nach der Förderrichtlinie. Markiere, welche Kriterien erfüllt, welche nicht erfüllt und welche unklar sind.”
Das dauert 20 Minuten. Was du danach weißt: Wie gut das System die Richtlinie versteht, wo es an Grenzen stößt, und ob der Ansatz für dein Programm grundsätzlich funktioniert, bevor du einen Euro investierst.
Für den strukturierten Einsatz mit echter Antragsprüfung brauchst du einen konfigurierten Prompt. Hier ist ein Startpunkt:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Bundesagentur für Arbeit, Pressemitteilung Deutscher Digitaltag 2024: Beschreibt KI-Klassifikationsmodell zur Echtheitsprüfung von über 150.000 Studienbescheinigungen jährlich, trainiert mit Dokumenten aller 422 akkreditierten deutschen Hochschulen. Quelle: arbeitsagentur.de
- NIH NIGMS / Federal Data Strategy (USA, 2019): NLP-System für Grant-Application-Routing reduzierte Bearbeitungszeit von 2–3 Wochen auf unter einen Tag; 80–92 % Routing-Genauigkeit; über 2.000 Anträge automatisch verarbeitet. Analogiequelle für behördliche Antragsverarbeitung. Quelle: strategy.data.gov
- IÖB Innovationsplattform, KI-gestützte Förderungsprüfung (2024): Österreichisches Bundesministerium für Inneres schreibt Challenge für KI-Lösung zur Vollständigkeitsprüfung von Förderabrechnungsunterlagen aus; 7 Lösungen in Expertenbewertung. Quelle: ioeb-innovationsplattform.at
- §35a Verwaltungsverfahrensgesetz (VwVfG): Rechtsgrundlage für vollständig automatisierte Verwaltungsakte. Analyse bei LTO Legal Tribune Online: lto.de
- EU AI Act (Verordnung 2024/1689): Klassifiziert KI-Systeme für staatliche Leistungsentscheidungen als Hochrisiko-KI (Anhang III); Hochrisiko-Anforderungen gelten ab August 2026.
- Bearbeitungszeitanteile (35–40 % für formale Prüfschritte): Erfahrungswert aus Verwaltungsprojekten im deutschen Förderwesen und Beobachtungen aus Digitalisierungsvorhaben; kein repräsentativer Studienwert. Für ähnliche Schätzwerte im europäischen Förderwesen vgl. IÖB-Challenge-Beschreibung (2024).
- Preis- und Kostenangaben: Azure Document Intelligence, Azure OpenAI Service, Microsoft 365 Copilot, Power Automate, veröffentlichte Tarife der jeweiligen Anbieter (Stand April 2026).
Du willst prüfen, ob dein Förderprogramm für KI-gestützte Antragsprüfung geeignet ist, und welche rechtlichen Anforderungen dabei zu beachten sind? Meld dich, wir klären das in einem kurzen Gespräch.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Bürger-Chatbot für häufige Anfragen
Ein KI-gestützter Chatbot beantwortet häufige Bürgeranfragen rund um die Uhr, von Öffnungszeiten über Formulare bis hin zu Zuständigkeiten und Fristen.
Mehr erfahrenKI-gestützte Antragsprüfung in der Verwaltung
KI prüft eingereichte Anträge auf Vollständigkeit und Plausibilität, erkennt häufige Fehler und unterstützt Sachbearbeitende bei der Bearbeitung, schneller und konsistenter.
Mehr erfahrenAutomatische Dokumentenklassifizierung in der Verwaltung
KI klassifiziert eingehende Dokumente automatisch, ordnet sie den richtigen Vorgängen zu und leitet sie an die zuständige Stelle weiter, ohne manuelle Sichtung.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.