Zum Inhalt springen

KI in der Verwaltung löst nicht das Effizienzproblem — sie löscht das Ermessen

Anfang 2025 waren laut IW Köln nur 196 von 575 OZG-Leistungen flächendeckend digital. Die Debatte dreht sich um Tempo, das Kernproblem ist juristisch: KI verschiebt Ermessen in eine Black Box, die § 35a VwVfG eigentlich ausschließt.

D
Daniel Sonnet
· · 6 Min. Lesezeit
KI in der Verwaltung löst nicht das Effizienzproblem — sie löscht das Ermessen

Von 575 OZG-Leistungen, die bis Ende 2022 bundesweit verfügbar sein sollten, standen laut Behörden-Digimeter 2025 des Instituts der deutschen Wirtschaft Anfang 2025 nur 196 flächendeckend online. Weniger als 34 Prozent. Bei aktueller Umsetzungsgeschwindigkeit dauert die vollständige Digitalisierung der Verwaltung noch über 19 Jahre. Anfang 2026 waren erst 823 von 7.509 erfassten Einzelleistungen bundesweit umgesetzt.

Diese Zahlen haben eine politische Antwort produziert: KI soll den Stau lösen. Schneller, günstiger, vorurteilsfreier als das überlastete Personal. Die Erzählung klingt sauber. Sie ist trotzdem falsch konstruiert.

Denn der Engpass in der deutschen Verwaltung ist nicht Rechengeschwindigkeit. Er ist juristisch. Und genau dort, wo Verwaltung schwierig wird, hilft KI nicht. Sie macht das Schwierige unsichtbar.

Was ein Verwaltungsakt eigentlich ist

Ein Bescheid ist kein Datenpunkt. Er ist eine Entscheidung, die zwei Eigenschaften haben muss: ein gesetzlich vorgegebenes Ermessen und eine nachvollziehbare Begründung. Beides ist nicht Stilfrage, sondern Verfassungsrecht. Wer einen Antrag ablehnt, muss erklären können, warum genau dieser Antrag mit genau dieser Lage so beschieden wurde.

Der deutsche Gesetzgeber hat das anerkannt. § 35a VwVfG, eingefügt 2016 durch das Steuermodernisierungsgesetz (BGBl I S. 1679), erlaubt vollautomatisierte Verwaltungsakte ausdrücklich nur dort, wo “weder ein Ermessen noch ein Beurteilungsspielraum besteht”. Die Norm ist ein Nebenprodukt einer Steuerreform, nicht eines Digitalisierungsgesetzes. Aber sie zieht die saubere Linie: Automatisierung ja, wenn die Entscheidung gebunden ist. Sobald gewogen, gewertet, abgewogen werden muss, ist ein Mensch zuständig.

Probabilistische KI-Ausgaben fallen logisch auf die andere Seite dieser Linie. Wer sagt “wahrscheinlich aus Syrien” oder “vermutlich erwerbsfähig”, übt Beurteilungsspielraum aus, auch wenn das Modell ihn ausübt. Eine Wahrscheinlichkeit ist eine Wertung. Und eine Wertung ist nach § 35a VwVfG nicht automatisierbar, egal wie elegant das Modell sie produziert.

Wie das in der Praxis aussieht: das BAMF

Das Bundesamt für Migration und Flüchtlinge nutzt seit 2017 eine Sprachsoftware zur Dialekterkennung in Asylverfahren. Über vier Millionen Euro Steuergeld sind hineingeflossen. Die Software hört in den ersten zwei Minuten einer Anhörung zu und schätzt, aus welchem Sprachraum die antragstellende Person stammt. Diese Schätzung fließt in die Glaubwürdigkeitsbewertung ein.

Brüchig ist das Fundament. Dari-Persisch erkennt das System nach Trainingsangaben des BAMF mit 73,07 Prozent, auf Basis von 614 Trainingsaudiodateien. Bei Antragstellenden aus dem Sudan stimmten in 70,6 Prozent der Fälle die maschinellen Angaben nicht mit den Selbstauskünften überein — laut Recherche von netzpolitik.org auf Basis parlamentarischer Anfragen vom Juli 2022. Auf die Frage nach differenzierten Fehlerquoten antwortete das BAMF in der parlamentarischen Anfrage: “Eine Fehlerquote im Sinne der Fragestellung liegt nicht vor.”

Juristisch ist das der interessanteste Satz der ganzen Akte. Eine Fehlerquote liegt nicht vor, weil das BAMF die Software nicht als Entscheidungsinstanz definiert, sondern als Indiz unter mehreren. Damit ist sie formal kein Verwaltungsakt nach § 35a VwVfG. Praktisch fließt ihre Aussage trotzdem in eine Entscheidung ein, deren Begründung später lautet: “Die Angaben zum Herkunftsland erschienen nicht glaubhaft.”

Hier verschiebt sich Ermessen in eine Black Box — nicht durch einen automatisierten Bescheid, sondern durch ein Indiz, das niemand prüfen, niemand erklären, niemand vor Gericht zerlegen kann, weil das Amt selbst keine Fehlerquote ausweist.

Was am 2. August 2026 passiert

Ab dem 2. August 2026 greifen für Verwaltungs-KI in Anhang III des EU AI Acts die vollen Hochrisiko-Pflichten. Migration, Asyl, Strafverfolgung, Zugang zu öffentlichen Diensten fallen darunter. Behörden als Betreiber müssen nach Artikel 26 und 27 eine Grundrechts-Folgenabschätzung durchführen, bevor sie ein solches System einsetzen.

Das ist neu, und es ist unbequem. Eine Grundrechts-Folgenabschätzung ist kein Datenschutzformular. Sie verlangt eine systematische Antwort darauf, welche Grundrechte das System berührt, welche Fehlerklassen es produziert, wie Betroffene Auskunft und Korrektur durchsetzen können. Eine Behörde, die ihrer Software keine Fehlerquote attestieren kann, hat dieses Dokument noch nicht einmal angefangen.

Für deutsche Behörden bedeutet das eine Doppelhürde. § 35a VwVfG begrenzt schon heute, was vollautomatisiert entschieden werden darf. Der EU AI Act ergänzt ab August 2026 strenge Transparenz- und Dokumentationspflichten für alles, was unterhalb dieser Schwelle als “unterstützendes” KI-System läuft. Beide Normen zielen auf denselben Punkt: Wer Verwaltungsentscheidungen mit Algorithmen anreichert, muss sie erklären können.

Das Effizienz-Argument, ehrlich gewogen

Im öffentlichen Dienst fehlen laut dbb-Monitor 2025 rund 550.000 Vollzeitstellen. Eine McKinsey-Analyse vom Juli 2024 schätzt, dass generative KI bis zu 165.000 Vollzeitäquivalente in Verwaltungsprozessen ersetzen oder entlasten könnte. Das ist kein triviales Argument. Wer es wegwischt, ignoriert, dass die Alternative zu KI-gestützter Bearbeitung in vielen Ämtern keine bessere menschliche Entscheidung ist, sondern gar keine. Akten bleiben liegen, Anträge werden nach 14 Monaten beschieden.

Trotzdem trägt das Argument nur, wenn es bei der richtigen Frage angesetzt wird. Effizienz und Rechtmäßigkeit sind keine Alternativen. Ein rechtswidriger Bescheid ist kein schnellerer Bescheid. Er ist anfechtbar, reversibel, verursacht Folgekosten in Widerspruchs- und Klageverfahren, und produziert genau das, was die Verwaltung nicht aushält: Vertrauensverlust.

KI in der Verwaltung ist richtig, solange sie Assistenzsystem bleibt. Recherche in Aktenbergen, Vorbereitung von Schriftsätzen, Vorschläge für Textbausteine, Übersetzung, Plausibilitätsprüfung. Genau dort, wo am Ende ein Mensch unterschreibt und für die Entscheidung haftet, ist KI ein Produktivitätshebel. Falsch wird sie, sobald sie zur Entscheidungsinstanz wird oder zum Indiz, dem niemand mehr widerspricht, weil “der Algorithmus es gesagt hat”.

Worum die Debatte eigentlich gehen müsste

Wenn deutsche Behörden über KI sprechen, sprechen sie meist über Tempo. Wie viele OZG-Leistungen sind online, wie viele Anträge automatisierbar, wie viele Stellen entlastbar. Das ist die einfache Frage, weil sie zählbar ist.

Die schwerere Frage lautet: An welcher Stelle einer Entscheidung darf ein Algorithmus mitwirken, und wo muss seine Mitwirkung dokumentiert sein, prüfbar, vor Gericht angreifbar? § 35a VwVfG hat darauf eine 2016 formulierte Antwort. Der EU AI Act ab August 2026 verschärft sie. Das BAMF hat in der Praxis eine andere Antwort gegeben: lieber kein Automat, aber ein Indiz, dessen Fehlerquote niemand kennt.

Das ist die Konstruktion, die weh tut. Nicht weil sie offen rechtswidrig wäre, sondern weil sie genau die Begründungspflicht aushöhlt, die der Verwaltungsakt eigentlich schützt. Bürgerinnen und Bürger merken nicht, dass ein Algorithmus mitentschieden hat. Und Beamte merken es nur, wenn sie die Software hinterfragen. Was sie selten tun, weil das Amt sie als Werkzeug definiert hat, nicht als Entscheider.

Eine tragfähige KI-Verwaltungsstrategie sieht anders aus. Sie benennt die gebundenen Entscheidungen, die vollautomatisiert werden: Kfz-Zulassung, Wohngeld bei klarer Lage, Anwohnerparkausweis. Sie benennt die unterstützenden Systeme, die eingesetzt werden, mit dokumentierter Fehlerquote und nachvollziehbarem Eingriff in die Sachbearbeitung. Und sie zieht eine rote Linie: Bei Asyl, Strafverfolgung, Sozialleistungen mit Ermessen entscheidet ein Mensch, und der Algorithmus ist allenfalls Lieferant von Material, das benannt, beziffert und anfechtbar ist.

Solange die Debatte stattdessen “schneller digitalisieren” heißt, optimiert sie eine Größe, die nicht das Problem ist. Das Problem ist, dass eine Verwaltung, die nicht erklären kann, warum sie entschieden hat, ihre demokratische Funktion nicht erfüllt. Auch nicht, wenn sie zwölfmal so viele Bescheide pro Woche produziert.


Wer den Schritt von OZG-Tempo zu juristisch tragfähiger KI-Verwaltung sortieren will, findet im KI-Syndikat-Newsletter regelmäßig Einordnungen, die Effizienzargumente gegen Begründungspflicht gegenrechnen.

Diesen Artikel teilen:

Kommentare

Kommentare werden in Kürze freigeschaltet. Bis dahin freuen wir uns über dein Feedback per E-Mail an info@gerabo.de.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar