Zum Inhalt springen
Öffentliche Verwaltung vergabevertragsmanagementbeschaffung

KI-gestützte Vertragsprüfung und Vergabeunterstützung

KI analysiert Vergabeunterlagen und Dienstleistungsverträge auf Vollständigkeit, Regelkonformität und vergaberechtliche Anforderungen — und reduziert den Prüfaufwand je Verfahren deutlich.

⚡ Auf einen Blick
Problem
Vergabeverfahren und Vertragsprüfungen binden erhebliche Kapazitäten in Rechts- und Vergabeabteilungen. Fehler bei der Vergabe führen zu Nachprüfungsverfahren, Schadensersatz und persönlicher Haftung der Vergabebeauftragten.
KI-Lösung
KI prüft Vergabeunterlagen auf formale Vollständigkeit und vergaberechtliche Anforderungen (GWB, VgV, UVgO), vergleicht Vertragsentwürfe gegen Musterklauseln (EVB-IT, AVV nach DSGVO) und erstellt Entwürfe für Vergabevermerke als Entscheidungsvorlage.
Typischer Nutzen
Prüfaufwand je Vergabeverfahren um 40–60% reduzieren, Fehlerquote bei Vergabevermerken senken, Vergabeverfahren um 2–4 Wochen beschleunigen — bei unveränderter Entscheidungsverantwortung des zuständigen Personals.
Setup-Zeit
4–12 Wochen bis Pilotbetrieb; Regelwerke müssen strukturiert vorliegen
Kosteneinschätzung
Nachprüfungsverfahren kosten 50.000–250.000 €
LLM-Dokumentenprüfung gegen strukturierte Regelwerke, Abgleich mit Musterklauseln, automatische Vergabevermerk-Entwürfe, spezialisierte Vergabe-KI-Tools.
Worum geht's?

Es ist Donnerstag, 14:47 Uhr. Vergabebeauftragte Katharina Müller schaut auf den Stapel vor ihr: drei neue IT-Dienstleistungsverträge, die bis Freitagmittag gezeichnet werden sollen. Alle drei kamen vom externen Dienstleister mit eigenem Vertragsformular. Alle drei weichen vom EVB-IT-Standard ab — das sieht man schon auf den ersten Seiten.

Was Katharina nicht auf Anhieb sieht: Ob die Datenschutzklauseln Art. 28 DSGVO vollständig umsetzen. Ob die Klausel zur Unterauftragsvergabe mit § 36 VgV vereinbar ist. Ob die Laufzeitregelung mit dem Haushaltsrecht kollidiert. Sie wird Paragraph für Paragraph durcharbeiten, Randnotizen machen, die zuständige Juristin anrufen. Das dauert mindestens drei Stunden — pro Vertrag.

Das Absurde: Die meisten dieser Prüfschritte sind mechanisch. Man vergleicht Klausel A gegen Mustertext B und fragt: stimmt das überein, ja oder nein? Beim nächsten Vertrag fängt man von vorne an.

KI kann diesen Vergleich in Sekunden durchführen. Nicht um Katharina zu ersetzen — sie trägt die Amtsverantwortung, unterschreibt persönlich, haftet persönlich. Aber um ihr die 80 Prozent mechanischer Vorarbeit abzunehmen, damit sie die 20 Prozent echte Abwägung erledigen kann, für die Urteilsvermögen tatsächlich nötig ist.

Das echte Ausmaß des Problems

Öffentliche Vergabe ist in Deutschland eines der komplexesten Rechtsgebiete der täglichen Verwaltungspraxis. Wer für eine Behörde beschafft, bewegt sich gleichzeitig in GWB, VgV, UVgO, VOB/A, Haushaltsrecht und — sobald IT-Leistungen im Spiel sind — in den EVB-IT-Vertragstypen mit zugehörigen BSI-Grundschutz- und BSI-C5-Anforderungen. Dazu kommen DSGVO-Pflichten: Jeder Vertrag mit Datenverarbeitung braucht eine Auftragsverarbeitungsvereinbarung (AVV) nach Art. 28 DSGVO, die vollständige Pflichtangaben enthält.

Das Problem ist nicht, dass Vergabebeauftragte die Regeln nicht kennen würden. Das Problem ist der schiere Wiederholungsaufwand: Dieselben Checklisten, dieselben Klauselvergleiche, dieselben Vollständigkeitsprüfungen — bei jedem neuen Verfahren, jedem neuen Dienstleistervertrag von vorne.

Was das kostet, wenn es schiefläuft, ist klar bezifferbar: Ein förmliches Vergabenachprüfungsverfahren vor der Vergabekammer kostet die Vergabestelle erfahrungsgemäß 50.000 bis 250.000 Euro — direkte Anwalts- und Verfahrenskosten, nicht eingerechnet der interne Aufwand und die Verzögerung des Vorhabens um Monate. Das Statistische Bundesamt verweist in seinem Bericht über Verwaltungseffizienz auf durchschnittliche Bearbeitungszeiten von 6–14 Wochen je Vergabeverfahren. Jede Fehlerkorrektur verlängert das — und damit auch die Investition oder Dienstleistung, die am Ende stehen soll.

Konkret an Fehlerquellen häufen sich in der Praxis:

  • Fehlende oder unvollständige AVV-Klauseln — der häufigste Mangel bei IT-Verträgen laut Praxisberichten aus Vergabeprüfungen
  • Abweichungen von EVB-IT-Standardbedingungen ohne dokumentierte Begründung
  • Widersprüche zwischen Vertragstext und Leistungsbeschreibung (z. B. Reaktionszeiten an zwei Stellen unterschiedlich definiert)
  • Fehlende Klauseln zur Unterauftragsvergabe (§ 36 VgV) bei Verträgen, bei denen der Auftragnehmer erkennbar Subunternehmer einsetzen wird
  • Laufzeiten, die haushaltsrechtliche Genehmigungsschwellen überschreiten, ohne entsprechenden Vermerk
  • Unvollständige Vergabevermerke, die bei einer Nachprüfung nicht standhalten

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit KI-Unterstützung
Prüfzeit je Vertragsposition (Standardvertrag)2–4 Stunden45–90 Minuten ¹
Vollständigkeitsprüfung AVV-PflichtangabenManuell, Checkliste auf PapierAutomatisch, mit konkreter Fundstelle
Vergabevermerk-Ersterstellung2–5 StundenEntwurf in 15–30 Minuten ¹
Abgleich gegen EVB-IT-MusterklauselnTabelle-gegen-Tabelle, fehleranfälligStrukturierter Abgleich mit Abweichungsmarkierung
Widerspruchserkennung (z. B. Laufzeit vs. Haushaltsrecht)Nur wenn Bearbeiter es bemerktRegelbasiert zuverlässig markiert
Persönliche AmtsverantwortungBeim VergabebeauftragtenBleibt beim Vergabebeauftragten — unveränderlich

¹ Erfahrungswerte aus Pilotimplementierungen und Anbieterzahlen (z. B. GovRadar, Legartis). Tatsächliche Einsparung hängt vom Vertragstyp, der Regelwerkstiefe und der Qualität der hinterlegten Vergleichsvorlagen ab.

Einschätzung auf einen Blick

Zeitersparnis — hoch (4/5) 40–60 Prozent weniger Prüfzeit je Verfahren ist realistisch, wenn Regelwerke strukturiert vorliegen und das System gegen ein vollständiges Klausel-Playbook arbeitet. Das ist mehr als die meisten Verwaltungsanwendungen erzielen — deshalb 4 statt der für diese Kategorie typischen 3. Der Unterschied zur vollen 5: Komplexe Vergaben mit Verhandlungsverfahren oder ungewöhnlichen Vertragsstrukturen lassen sich nicht vollautomatisch prüfen; dort bleibt der Juristenaufwand hoch.

Kosteneinsparung — hoch (4/5) Nachprüfungsverfahren sind die sichtbaren Kosten — 50.000 bis 250.000 Euro pro Fall. Aber auch ohne Nachprüfung sind die internen Aufwände erheblich: Eine Vergabestelle mit 120 Verfahren pro Jahr bindet allein für Prüfung und Dokumentation mehrere Vollzeitstellen. KI-Assistent für Sachbearbeiter, Dokumentenklassifizierung und Vergabeunterstützung kombiniert ergeben realistische Effizienzgewinne, die Personalkapazitäten freisetzen.

Schnelle Umsetzung — niedrig (2/5) Das ist die ehrlichste Bewertung. Vergaberechtliche KI-Tools brauchen strukturierte Regelwerke als Input — und in den meisten Behörden liegen diese in unterschiedlichsten Formaten vor: alte Word-Vorlagen, interne Handreichungen, E-Mails mit Ausnahmegenehmigungen. Bevor das KI-System arbeiten kann, muss das Regelwerk aufgeräumt und strukturiert sein. Zudem braucht der Piloteinsatz DSGVO-Prüfung und haushaltsrechtliche Freigabe. Sechs bis zwölf Wochen bis zum Pilotbetrieb sind realistisch — kürzer als bei einem echten Softwareprojekt, aber kein Tages-Setup. In der Branche ist 2 typisch für komplexe, rechtssensible Systeme.

ROI-Sicherheit — mittel (3/5) Eingesparte Prüfstunden sind messbar. Verhinderte Nachprüfungsverfahren sind schwerer zu attributieren — du weißt nicht, welche Fehler das System gefunden hat, die du sonst übersehen hättest. Deshalb 3 und nicht 4: Der Nutzen ist real, aber der prospektive Fehler-Verhütungsanteil bleibt unsicher.

Skalierbarkeit — hoch (4/5) Das stärkste Argument für diesen Anwendungsfall: Ein Vergabejahr mit 80 Verfahren kostet ungefähr genauso viel Systemlaufzeit wie eines mit 200. Keine proportionale Personalaufstockung, keine parallele Schulung. Behörden, die im Zuge von Digitalisierung und Stellenabbau mehr mit weniger schaffen müssen, finden hier einen der skalierbarsten Hebel.

Richtwerte — stark abhängig von Behördengröße, Verfahrensvolumen und Qualität der hinterlegten Regelwerke.

Was das System konkret macht

Das Grundprinzip ist NLP-gestützte Regelprüfung gegen ein strukturiertes Klausel-Playbook. Kein Generalmodell, das “irgendwie” Verträge analysiert — sondern ein System, das gegen eine vorher definierte Liste von Anforderungen prüft:

Schritt 1 — Dokumenteinlesen: Der Vertragsentwurf oder die Vergabeunterlagen werden hochgeladen. Das System erkennt Struktur, Abschnitte, Klauseln.

Schritt 2 — Abgleich gegen Regelwerk: Das System vergleicht jede relevante Klausel gegen das hinterlegte Regelwerk — EVB-IT-Musterklauseln, AVV-Pflichtangaben nach Art. 28 DSGVO, hausinterne Vertragsstandards, VgV/UVgO-Anforderungen.

Schritt 3 — Abweichungsbericht: Das Ergebnis ist kein Freitext-Urteil (“dieser Vertrag ist problematisch”), sondern ein strukturierter Bericht: Klausel X entspricht dem Standard, Klausel Y weicht ab (konkretes Zitat + Fundstelle im Muster), Klausel Z fehlt vollständig.

Schritt 4 — Vergabevermerk-Entwurf: Für das Vergabeverfahren erstellt das System einen strukturierten Entwurf des Vergabevermerks nach § 8 VgV / § 6 UVgO — mit den dokumentierten Prüfschritten, bewerteten Angeboten und der Entscheidungsbegründung. Dieser Entwurf ist ausdrücklich kein fertiger Verwaltungsakt, sondern Arbeitsvorlage für den Vergabebeauftragten.

Der entscheidende Unterschied zu einem generischen LLM: Das System erfindet keine Regeln. Es prüft ausschließlich gegen das, was vorher als Regelwerk hinterlegt wurde. Das macht die Ausgaben nachvollziehbar und die Verantwortlichkeit klar — das System hat geprüft, der Mensch hat entschieden.

Persönliche Haftung und die Grenzen des KI-Einsatzes

Das ist der wichtigste Abschnitt dieses Use Cases — und er hat keine Entsprechung in privatwirtschaftlichen Vertragsprüfungsanwendungen.

Wer für eine Behörde ein Vergabeverfahren durchführt und dabei einen Vertrag zeichnet, der gegen Vergaberecht verstößt, haftet persönlich. Das gilt für Vergabebeauftragte, aber auch für Juristinnen und Juristen, die Vertragsunterlagen freigeben. § 75 BHO und landesrechtliche Parallelvorschriften sehen persönliche Schadensersatzpflicht für grob fahrlässige Fehler bei der Haushaltsführung vor.

Das hat für den KI-Einsatz eine klare Konsequenz, die häufig unterschätzt wird:

KI-generierte Prüfergebnisse sind Arbeitsmittel, keine Entlastungsgründe.

Wer ein KI-System ein Vertragsdokument prüfen lässt und das Ergebnis ungeprüft übernimmt, hat im Zweifelsfall seine Sorgfaltspflicht verletzt — nicht erfüllt. Die einzige Möglichkeit, wie KI die persönliche Haftung tatsächlich reduziert, ist, wenn sie dabei hilft, mehr zu prüfen als ohne KI: mehr Klauseln, mehr Abgleiche, weniger Übersehen durch Zeitdruck. Dann ist die KI-Nutzung ein Qualitätssicherungsschritt, nicht eine Abkürzung.

Praktisch bedeutet das: Jede KI-Ausgabe muss vom Vergabebeauftragten inhaltlich geprüft und im Vergabevermerk als “geprüfte KI-Vorlage vom [Datum]” dokumentiert werden. Die Verantwortung bleibt — sie wird nur besser unterstützt.

Das Bundes-Ministerium für Digitales und Staatsmodernisierung hat in seiner KI-Handreichung für die Bundesverwaltung (2025) klar formuliert: Externe Unterstützung in Vergabeverfahren — einschließlich KI — ist zulässig, die Entscheidungshoheit liegt unverändert beim öffentlichen Auftraggeber.

Konkrete Werkzeuge — was wann passt

GovRadar — Das aktuell am stärksten verbreitete spezialisierte Tool für die öffentliche Vergabe in Deutschland. Arbeitet mit einer Datenbank realer Vergabeunterlagen, generiert erste Entwürfe von Leistungsbeschreibungen und Ausschreibungsunterlagen. Über 600 öffentliche Auftraggeber nutzen die Plattform. NRW-Kommunen erhalten Zugang über die Landeslizenz des MHKBD (ab Juli 2025 für alle 429 NRW-Kommunen). Für die Vertragsprüfung im engeren Sinne — Klauselabgleich gegen EVB-IT oder AVV — deckt GovRadar aktuell weniger ab als für die Ausschreibungserstellung.

Legartis — Schweizer Legal-AI-Workspace mit EU-Hosting und ISO 27001-Zertifizierung. Spezialisiert auf Klauselabgleich und Abweichungsmarkierung: Du hinterlegst dein Regelwerk (EVB-IT-Klauseln, AVV-Muster, interne Vertragsstandards) und Legartis prüft eingehende Entwürfe dagegen. Besonders stark bei DPAs und NDA-Prüfung. Monatliche Abonnements; Enterprise auf Anfrage. Für öffentliche Verwaltungen relevant, die Dienstleisterverträge regelmäßig und standardisiert prüfen.

Claude oder ChatGPT mit strukturiertem Prompt — Für den Einstieg ohne Zusatztool: Ein gut formulierter Prompt mit dem vollständigen Mustertext der EVB-IT-Klauseln und dem zu prüfenden Vertrag als Input liefert überraschend strukturierte Abweichungsberichte. Die entscheidende Einschränkung: Diese Modelle haben kein eingebautes Regelwerk und keinen institutionellen Gedächtnis. Jede Prüfung muss den vollen Kontext neu laden. Für gelegentliche Einzelprüfungen ausreichend; für ein ganzes Vergabejahr unpraktisch. Außerdem: Keine der Consumer-Varianten ist datenschutztechnisch für echte Vertragsunterlagen geeignet — dafür braucht es entweder eine On-Premise-Variante oder Claude/ChatGPT über Business-API mit AVV.

Microsoft 365 Copilot — Für Behörden, die bereits Microsoft 365 nutzen, ist Copilot die niedrigschwelligste Integration: Vertragsunterlagen liegen in SharePoint, Copilot prüft sie auf Anfrage gegen eine hinterlegte Checkliste. Kein Sonderaufbau, keine Parallelsystem-Einführung. Funktioniert gut für strukturierte Checklisten-Prüfungen; für tiefes Klauselrecht ist eine spezialisierte Legal-AI besser geeignet. Microsoft 365 Copilot ist über das EU Data Boundary-Programm DSGVO-konform betreibbar — relevant für Behörden mit BSI-Grundschutz-Anforderung.

Zusammenfassung: Wann welcher Ansatz

  • Regelmäßige öffentliche Vergabe, viel Volumen → GovRadar (spezialisiert, vergaberechtsnah)
  • IT-Verträge auf EVB-IT/AVV-Konformität prüfen → Legartis (Klauselabgleich)
  • M365-Umgebung vorhanden, gelegentliche Prüfungen → Microsoft 365 Copilot
  • Erstversuch ohne Budget, Einzelvertrag → Claude oder ChatGPT mit Prompt-Vorlage

Datenschutz und Datenhaltung

Vergabeunterlagen und Vertragswerke enthalten personenbezogene Daten (Mitarbeitende als Ansprechpartner, Bieterdaten, Vertragspartner) und häufig auch vergaberechtlich schutzwürdige Informationen (Angebotspreise, Kalkulationsgrundlagen). Der Einsatz von KI in diesem Bereich unterliegt sowohl der DSGVO als auch besonderen Anforderungen des Vergabe- und Haushaltsrechts:

  • AVV nach Art. 28 DSGVO ist zwingend vor jeder produktiven Nutzung eines Cloud-KI-Systems. Keine der genannten Lösungen darf ohne unterzeichneten AVV eingesetzt werden.
  • BSI Grundschutz und BSI C5 sind für IT-Systeme im Bundesbereich verbindlich; viele Länder haben vergleichbare Anforderungen. GovRadar und Legartis bieten EU-Hosting; die BSI-C5-Zertifizierung muss im Einzelfall geprüft werden — ContractHero ist das einzige der hier genannten Tools mit explizitem BSI-C5-Nachweis.
  • EVB-IT Cloud (2022) — für IT-Leistungsbeschaffungen der Bundesverwaltung ist die Nutzung von Cloud-Diensten ohne EVB-IT-Cloud-konformen Vertrag nicht zulässig. Wenn die Behörde selbst ein KI-Tool als Cloud-Dienst beschafft, muss dieses EVB-IT Cloud-Konformität vorweisen.
  • Geheimhaltungspflichten bei laufenden Vergabeverfahren: Angebotsdaten dürfen grundsätzlich nicht an Drittanbieter weitergegeben werden. KI-gestützte Auswertung von Angebotsinhalten setzt eine datenschutzrechtliche Unbedenklichkeitsprüfung und eine klare Sicherheitsarchitektur voraus — idealerweise On-Premise oder Deutsche Cloud ohne Weiterverarbeitung durch den Anbieter.
  • On-Premise-Option: Für hochsensible Vergabeverfahren (Verteidigung, Polizei, kritische Infrastruktur) ist ein On-Premise-Betrieb der einzig vertretbare Ansatz. Claude ist über AWS Bedrock (Frankfurt) abrufbar; für eine vollständig lokal betriebene Variante sind Open-Source-Modelle wie Mistral oder LLaMA in Eigenregie die einzige Option.

Was es kostet — realistisch gerechnet

Einmalige Einrichtungskosten Der größte Aufwandsblock ist nicht die Software, sondern die Aufbereitung des Regelwerks:

  • Regelwerke sichten, strukturieren und als Klausel-Playbook aufbereiten: 4–8 Wochen interner Aufwand, typischerweise durch juristische Fachkraft
  • Externe Unterstützung (falls kein internes Legal-Know-how): 5.000–20.000 Euro, je nach Tiefe des Klausel-Playbooks
  • Setup der Softwarelösung selbst: 1–4 Wochen, bei Plattform-Tools (GovRadar, Legartis) kein IT-Projekt
  • Schulung: 1–2 Tage für Vergabebeauftragte

Laufende Kosten (monatlich)

  • GovRadar: keine öffentlichen Preise; NRW-Kommunen kostenfrei über Landeslizenz
  • Legartis: Monatliche Abonnements (kein öffentliches Pricing); Einstiegspakete ab einem hohen dreistelligen Betrag
  • ContractHero: ab 390 Euro/Monat (Essential-Plan, 5 Nutzer, 500 Verträge), deutsches Hosting, BSI-C5-zertifiziert
  • Microsoft 365 Copilot: ca. 30 Euro/Person/Monat on top zur bestehenden M365-Lizenz

Realistisches ROI-Szenario Eine Vergabestelle mit 4 Vollzeitstellen, 150 Verfahren pro Jahr und durchschnittlich 6 Stunden Prüfaufwand pro Verfahren bindet rechnerisch 900 Stunden/Jahr nur für Prüftätigkeiten. Bei einem Stellenkostensatz von 45–60 Euro/Stunde (brutto inkl. Arbeitgeberanteil, Vollzeit TVöD EG 11–12) entspricht das 40.500 bis 54.000 Euro pro Jahr allein für Prüfzeit.

Eine 40-prozentige Reduktion spart 16.000 bis 22.000 Euro jährlich — und das ist die konservative Variante, ohne verhinderte Nachprüfungsverfahren einzurechnen. Bereits ein vermiedenes Verfahren vor der Vergabekammer (Minimalkosten: 50.000 Euro) macht mehrere Jahre Tooling-Investition wett.

Wie du den Nutzen tatsächlich misst Einfachste Methode: Durchschnittliche Prüfzeit je Vertragsposition vor Pilotstart messen (Stoppuhr, Stichprobe von 10 Verfahren). Nach 90 Tagen Pilotbetrieb dasselbe. Die Differenz ist dein Einstiegsbeweis — sauber, ohne Modellannahmen.

Drei typische Einstiegsfehler

1. Regelwerk nicht aufbereitet — aber schon das Tool eingeschaltet. Der häufigste Fehler: Man beschafft das KI-Tool, lädt einen Vertrag hoch — und das System prüft gegen nichts. Ein LLM ohne hinterlegtes Regelwerk gibt allgemeine Plausibilitätshinweise, keine vergaberechtlichen Abweichungsberichte. Das fühlt sich wie “schlechte KI” an, ist aber ein Setup-Fehler: Zuerst Klausel-Playbook, dann Tool. Wer diesen Schritt überspringt, bekommt ein System, das selbstbewusst Allgemeinplätze produziert.

2. KI-Output ohne Prüfung in den Vergabevermerk übernehmen. Wie im Haftungsabschnitt beschrieben: Das ist rechtlich riskant und sorgfaltspflichtwidrig. Wer KI-Output als Arbeitsergebnis ausgibt, ohne ihn zu prüfen, hat den Mehrwert nicht genutzt — und das Risiko nicht eliminiert, sondern nur verlagert. Konkret: Jede KI-Vorlage muss vom Vergabebeauftragten gelesen, korrigiert und mit eigenem Kürzel und Datum freigegeben werden. Das schafft die Transparenz, die bei einer Prüfung standhalten muss.

3. Vergessen, dass Angebotsunterlagen besonders schutzbedürftig sind. In der Praxis verschwimmt schnell, was in das KI-System eingespielt wird. Wettbewerbssensible Angebotsdaten (Einzelpreise, Kalkulation, Bieterliste) dürfen grundsätzlich nicht ungesichert in ein Cloud-System hochgeladen werden. Vor dem Pilotstart muss klar sein, welche Dokumenttypen das System bearbeiten darf — und welche nicht.

4. Das System einführen, aber die Regelwerk-Pflege vernachlässigen. EVB-IT-Klauseln ändern sich. DSGVO-Anforderungen entwickeln sich weiter. Landesrechtliche Vergabevorschriften werden angepasst. Ein Klausel-Playbook vom Aufbau 2024 ist 2027 teilweise veraltet — und das System prüft dann unbemerkt gegen falsche Maßstäbe. Mindestens einmal jährlich muss jemand überprüfen, ob das Regelwerk noch dem aktuellen Rechtsstand entspricht. Das ist kein technischer Aufwand, sondern eine juristische Aufgabe — und sie muss jemand besitzen.

Was mit der Einführung wirklich passiert — und was nicht

Vergabestellen sind keine homogene Zielgruppe. Je nach Behörde treffen KI-Werkzeuge auf sehr unterschiedliche Ausgangsbedingungen:

Die überbelasteten Verfahrenskundigen — die zwei, drei Personen, die seit Jahren alle schwierigen Fälle bearbeiten und das eigentliche Rechtswissen tragen. Sie sind oft skeptisch: Warum soll die KI das besser können als ich? Die ehrliche Antwort: In Sonderfällen kann sie das nicht. Aber in den 80 Prozent Standardverfahren nimmt sie ihnen Prüfzeit ab, die sie für die echten Fälle brauchen. Wer diese Personen früh einbindet — und ihr Klausel-Know-how ins Regelwerk einfließen lässt — gewonnen. Wer sie übergeht, verliert.

Die rechtlich weniger erfahrenen Sachbearbeitenden — in kleineren Vergabestellen führen Verwaltungsfachleute ohne Juristenausbildung viele Standardverfahren durch. Für sie ist KI-Unterstützung potenziell der größte Hebel: Sie erhalten eine strukturierte Prüfhilfe, die sie sonst nicht hätten. Das Risiko: Sie könnten KI-Output als “juristisches Urteil” fehlinterpretieren. Klare Kommunikation über den Charakter der Ausgaben ist hier entscheidend.

Was konkret hilft:

  • Vor dem Rollout eine Liste der 10 häufigsten Vertragstypen erstellen und das Regelwerk dafür priorisiert aufbauen
  • Einen kleinen Pilotbereich definieren: z. B. alle IT-Dienstleistungsverträge unter 100.000 Euro
  • Klar kommunizieren, was das System leistet und was nicht — schriftlich, einmalig, bevor jemand es zum ersten Mal benutzt
  • Den ersten Pilotmonat mit intensivem Feedback begleiten: Welche Hinweise waren richtig? Welche waren unbrauchbar? Das ist das wertvollste Feintuning des Regelwerks

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Bestandsaufnahme & AnforderungsanalyseWoche 1–2Vertragsvolumen und -typen inventarisieren, Regelwerk-Quellen sammeln, Datenschutzanforderungen klärenRegelwerke in unterschiedlichsten Formaten — kein konsolidierter Stand vorhanden
Klausel-Playbook aufbauenWoche 2–6EVB-IT-Klauseln, AVV-Pflichtangaben, Hausstandards strukturiert aufbereitenZeitaufwand massiv unterschätzt — juristische Fachkraft gebunden
Tool auswählen, AVV schließenWoche 4–6Toolauswahl, Datenschutz-Folgenabschätzung, AVV unterzeichnen, ggf. IT-SicherheitsfreigabeAVV-Verhandlung dauert länger als geplant; BSI-Anforderungen erfordern zusätzliche Klärung
PilotbetriebWoche 6–10Echte Verfahren prüfen, Ergebnisse gegen Manualergebnis vergleichen, Regelwerk nachschärfenKI findet andere Abweichungen als erwartet — Regelwerk muss angepasst werden
RolloutWoche 10–14Erweiterung auf alle Vergabeverfahren, Schulung weiterer MitarbeitenderNutzungsrate niedrig, wenn Kommunikation unzureichend war

Wichtig: Sechs Wochen für den Pilotbetrieb sind keine Verschwendung — sie sind die Investition in ein System, das tatsächlich vergaberechtlich korrekt prüft.

Häufige Einwände — und was dahintersteckt

„Wir haben zu wenig Vergaben — das rechnet sich nicht.” Genau das stimmt für viele kleine Kommunen, die nur zehn bis zwanzig Vergaben im Jahr durchführen. Unterhalb eines gewissen Volumens und einer gewissen Vertragswertkomplexität ist der Aufwand für Regelwerk-Aufbau und Toolpflege kaum amortisierbar. Ehrliche Antwort: Für Kleinstbehörden unter 30 Vergabeverfahren pro Jahr ist KI-Unterstützung wahrscheinlich überdimensioniert. Hier wäre eine kommunale Zusammenarbeit über eine zentrale Vergabestelle der sinnvollere erste Schritt.

„Das Vergaberecht ist zu komplex für KI.” Das stimmt für die Abwägungsentscheidungen — Zuschlagskriterien gewichten, Angebotsqualität bewerten, Ausnahmen begründen. Aber der weit überwiegende Teil der Prüfarbeit ist eben keine Abwägung, sondern ein mechanischer Abgleich: Ist Klausel X vorhanden, lautet sie wie Muster Y, stimmen die Zahlen überein? Für diesen Teil ist KI gut genug — und dieser Teil macht real mehr als die Hälfte des Zeitaufwands aus.

„Was, wenn die KI etwas übersieht und wir es nicht merken?” Das ist der richtige Einwand — und er beantwortet sich durch den Prozess: KI-Output wird geprüft, nicht übernommen. Die Frage ist nicht, ob die KI fehlerlos ist (sie ist es nicht), sondern ob das System mit KI-Unterstützung weniger Fehler produziert als ohne. Wenn das System 95 Prozent der Standardklauseln zuverlässig erkennt und der Vergabebeauftragte die markierten Abweichungen prüft, ist der Gesamtfehler niedriger als bei reiner Handprüfung unter Zeitdruck. Das Risiko liegt im blinden Vertrauen, nicht im Einsatz an sich.

Woran du merkst, dass das zu dir passt

Du bist eine gute Kandidatin oder ein guter Kandidat für KI-gestützte Vergabeunterstützung, wenn:

  • Deine Vergabestelle bearbeitet mehr als 30 Verfahren pro Jahr — unterhalb dieser Schwelle lohnt der Aufbau des Regelwerks selten
  • Du regelmäßig IT-Dienstleistungsverträge prüfst, bei denen EVB-IT, AVV und BSI-Anforderungen zusammenkommen
  • Deine Prüfprozesse bisher auf Papierchecklisten oder persönlichem Erfahrungswissen basieren — und du willst das standardisieren
  • Du Kapazitätsprobleme in der Vergabestelle hast, aber keine Stelle nachbesetzen kannst
  • Deine Behörde bereits Microsoft 365 nutzt — dann ist der Einstieg über Microsoft 365 Copilot ohne Zusatztool möglich

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Unter 30 Vergabeverfahren pro Jahr. Der Aufwand für den Aufbau und die Pflege des Regelwerks überwiegt den Nutzen. Eine kommunale Zusammenarbeit über eine zentrale Vergabestelle ist sinnvoller.

  2. Keine strukturierten Musterunterlagen vorhanden und keine Kapazität für deren Erstellung. Ein KI-System ohne Klausel-Playbook prüft gegen nichts. Wenn die Behörde nicht mindestens 4–6 Wochen Aufbauzeit in das Regelwerk investieren kann, ist der Pilotbetrieb zum Scheitern verurteilt.

  3. Überwiegend Vergaben mit Besonderheiten (Verhandlungsverfahren, komplexe Zuschlagskriterien, ungewöhnliche Vertragsstrukturen) — diese profitieren kaum von standardisierter Klauselprüfung. KI-Unterstützung bei Vergaben zahlt vor allem bei wiederkehrenden Standardverfahren.

Das kannst du heute noch tun

Ohne Toolbeschaffung, ohne Budget: Nimm den letzten IT-Dienstleistungsvertrag, den du geprüft hast, und den vollständigen Text des EVB-IT Cloud-Vertrags (kostenlos vom BMI als PDF). Lade beides in Claude oder ChatGPT hoch und nutze folgenden Prompt:

Prompt für Vertragsklausel-Abgleich (Erstprüfung)
Du bist ein Assistent für die rechtliche Vorab-Prüfung von Vertragsunterlagen in der öffentlichen Verwaltung. Ich gebe dir: 1. Einen Musterkatalog von Klauseln / Pflichtangaben (im ersten Dokumentblock) 2. Einen zu prüfenden Vertragsentwurf (im zweiten Dokumentblock) Deine Aufgabe: - Prüfe, ob jede Klausel aus dem Musterkatalog im Vertragsentwurf vorhanden ist - Prüfe, ob vorhandene Klauseln inhaltlich vom Muster abweichen - Erstelle einen strukturierten Bericht mit drei Spalten: Klausel / Status (vorhanden / abweichend / fehlend) / Fundstelle oder Abweichungsbeschreibung Wichtiger Hinweis im Bericht: "Dieses Ergebnis ist eine vorläufige Prüfhilfe auf Basis der hinterlegten Musterklauseln. Es ersetzt keine juristische Prüfung und keine Entscheidung des zuständigen Vergabebeauftragten. Abweichungen müssen inhaltlich bewertet werden." [HIER MUSTERKATALOG EINFÜGEN — z. B. EVB-IT Cloud-Klauseln, AVV-Pflichtangaben nach Art. 28 DSGVO] [HIER ZU PRÜFENDEN VERTRAGSENTWURF EINFÜGEN]
Funktioniert mit Claude, ChatGPT (Business-Tarif mit AVV)
Beispiel-Ausgabe

Mitarbeiter:in

Musterkatalog: AVV-Pflichtangaben nach Art. 28 DSGVO (Gegenstand der Verarbeitung, Dauer, Art und Zweck, Kategorien personenbezogener Daten, Rechte und Pflichten des Verantwortlichen). Zu prüfender Vertrag: IT-Dienstleistungsvertrag, Abschnitt 7 'Datenschutz'.

KI-Assistent

Klausel-Abgleich AVV-Pflichtangaben (Art. 28 DSGVO): | Pflichtangabe | Status | Fundstelle / Abweichung | |---|---|---| | Gegenstand der Verarbeitung | Vorhanden | § 7 Abs. 1, Satz 2 | | Dauer der Verarbeitung | Fehlend | Nicht im Vertrag aufgeführt | | Art und Zweck der Verarbeitung | Abweichend | § 7 Abs. 1 nennt nur "IT-Wartung", ohne konkreten Zweck der Datenverarbeitung zu definieren | | Kategorien personenbezogener Daten | Abweichend | "Nutzerdaten" zu unbestimmt — Art. 28 Abs. 3 lit. a DSGVO verlangt explizite Kategorienangabe | | Rechte und Pflichten des Verantwortlichen | Vorhanden | § 7 Abs. 3–5 | Prüfbedarf: Zwei Pflichtangaben fehlen oder sind unzureichend bestimmt. Vor Zeichnung muss der Vertragstext angepasst werden. Hinweis: Dieses Ergebnis ist eine vorläufige Prüfhilfe auf Basis der hinterlegten Musterklauseln. Es ersetzt keine juristische Prüfung und keine Entscheidung des zuständigen Vergabebeauftragten.

Nach diesem ersten Versuch weißt du: Funktioniert der Ansatz für euren Vertragstyp? Welche Klauseln erkennt das Modell zuverlässig, welche nicht? Das ist der kostengünstigste Proof-of-Concept, den es gibt — bevor du über spezialisierte Vergabe-KI-Tools nachdenken musst.

Quellen & Methodik

  • GovRadar, 600+ Auftraggeber, NRW-Kommunallizenz: Ministerium für Heimat, Kommunales, Bau und Digitalisierung NRW (MHKBD), Pressemitteilungen Juli 2025 (mhkbd.nrw); KI-gestützte Vergabe für alle NRW-Kommunen ab Juli 2025.
  • Persönliche Haftung beim KI-Einsatz in der Vergabe: Hoffmann Liebs, „Persönliche Haftung von Rechtsabteilungsmitgliedern beim Einsatz von KI in der Vertrags- und AGB-Prüfung bzw. Erstellung” (2025); DeutscherAnwaltSpiegel, „Persönliche Haftung von Rechtsabteilungsmitgliedern beim Einsatz von KI” (2025).
  • Entscheidungshoheit beim öffentlichen Auftraggeber: DTVP/Vergabeblog, „Von null auf KI: Wie Vergabestellen KI-Tools verantwortungsvoll einführen können” (2024/2025).
  • EVB-IT Cloud (2022): Bundesministerium des Innern, BMI: Veröffentlichung der EVB-IT Cloud-Bedingungen, März 2022 — mit expliziten BSI-C5-Anforderungen.
  • Kosteneinsparung ContractHero: ContractHero GmbH, veröffentlichte Preisliste, Stand Mai 2026 (Essential ab 390 €/Monat).
  • Praxisaufwand und ROI-Schätzwerte: Erfahrungswerte aus Vergabepraxis und verfügbaren Pilotberichten zu KI in der öffentlichen Beschaffung. Keine repräsentative Studie; Zahlen als Orientierungsrahmen, nicht als Prüfstandard.
  • § 75 BHO (persönliche Haftung): Bundeshaushaltsordnung in der gültigen Fassung.

Du willst wissen, ob das für eure Vergabestelle praktikabel ist — und wie ein erster Pilotversuch konkret aussehen würde? Melde dich — das klären wir gemeinsam.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar