Zum Inhalt springen
Architektur & Bauwesen risikomanagementvertragsanalysevob

KI-gestützte Risikoanalyse für Bauprojekte

KI analysiert Ausschreibungsunterlagen, Baugrundberichte und Vertragsklauseln auf Risikofelder, und erstellt priorisierte Risikoberichte vor Angebotsabgabe oder Vertragsunterzeichnung.

⚡ Auf einen Blick
Problem
Bauunternehmen unterschätzen systematisch Risiken in Ausschreibungen und Verträgen, weil keine Zeit für umfassende Prüfung bleibt, Verlustprojekte entstehen oft durch übersehene Klauseln.
KI-Lösung
KI liest Vertragswerke, LV-Texte und Baugrundberichte und markiert Risikostellen nach Kategorien: Haftung, Fristen, unklare Leistungsabgrenzungen, ungewöhnliche Klauseln.
Typischer Nutzen
60–70 % weniger übersehene Vertragsrisiken, Prüfzeit von 4–8 Stunden auf 1–2 Stunden reduziert, bessere Entscheidungsgrundlage für Go/No-Go.
Setup-Zeit
4–8 Wochen bis strukturierter Review-Prozess steht
Kosteneinschätzung
Ein verhindeter Verlustauftrag: 50.000–500.000 € Schaden vermieden
LLM-basierte Dokumentenanalyse mit strukturierter Risikokategorisierung, kombiniert mit juristischer Gegenprüfung bei kritischen Feststellungen.
Worum geht's?

Es ist Freitagmittag, 14:40 Uhr.

Thomas Reinhardt, Kalkulator bei einem mittelständischen Tiefbauunternehmen in Niedersachsen, hat gerade das 187-seitige Leistungsverzeichnis einer kommunalen Ausschreibung aufgemacht. Abgabetermin: Dienstag, 12:00 Uhr. Das Wochenende gehört der Familie. Für die Vertragsunterlagen, weitere 64 Seiten, Anlage 3 bis 9, bleiben ihm im besten Fall zwei Stunden Montagmorgen, bevor die Endsumme zusammengestellt werden muss.

Er überfliegt die Klauseln. Die Vertragsstrafe fällt ihm auf: 0,3 % pro Werktag, maximal 10 % der Auftragssumme. Das ist üblich. Was ihm nicht auffällt: In Anlage 7, Abschnitt 4.2, steht, dass der Auftraggeber Behinderungsanzeigen binnen 48 Stunden schriftlich einfordern kann, und dass bei Nichteinhaltung keine Schadensersatzansprüche entstehen. Eine Klausel, die die VOB/B-Standardregelung zugunsten des Auftraggebers verschiebt. Thomas unterschreibt. Acht Monate später steht er vor einer Besprechung, in der der Auftraggeber einen Regennachsommerwinter als Eigenrisiko des Auftragnehmers einstuft. Die Behinderungsanzeige ist nirgends nachweisbar. Der Nachtrag über 34.000 Euro wird abgelehnt.

Das hätte er sehen können. Wenn er Zeit gehabt hätte.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

In der deutschen Bauwirtschaft ist das strukturelle Zeitproblem bei der Angebotsprüfung nicht neu. Ausschreibungsunterlagen umfassen heute regelmäßig 100 bis 400 Seiten, Anlagen eingeschlossen. Die Angebotsfristen, typisch 14 bis 28 Tage für mittelgroße Projekte, reichen für Kalkulation und Vertragsanalyse kaum aus. Das Ergebnis: Kalkulatoren konzentrieren sich auf die Massenermittlung und die Einheitspreise. Die Vertragsanlagen werden überflogen, nicht gelesen.

Was passiert, wenn Klauseln übersehen werden, ist gut dokumentiert: Vertragsstrafen greifen früher als kalkuliert, Nachtragsansprüche verfallen wegen versäumter Fristen, Haftungsrisiken materialisieren sich in Projekten, in denen Leistungsabgrenzungen unklar blieben. Die Branche nennt das „Verlustbaustellen”, Projekte, die mit positivem Deckungsbeitrag kalkuliert wurden und im Verlust enden.

Eine Studie der Emerald Publishing (Laine et al., 2024), die ChatGPT-Risikoanalysen mit den Einschätzungen von 16 erfahrenen Risikomanagern in Bauunternehmen verglich, zeigt, dass Machine Learning-Systeme ein breites Spektrum an Risiken schnell erfassen können, aber bisher an Kontexttiefe und Praxisrelevanz scheitern, wenn sie nicht branchenspezifisch konfiguriert sind. Das ist die Lücke, die ein strukturierter KI-gestützter Prüfprozess schließen kann: nicht die menschliche Einschätzung ersetzen, sondern sicherstellen, dass beim schnellen Lesen keine Klausel unbemerkt bleibt.

Die häufigsten Risikofelder, die in Bauvertragsanalysen systematisch übersehen werden:

  • Abweichende Behinderungsanzeigeregelungen (§ 6 VOB/B ausgehebelt durch individuelle Klauseln)
  • Einseitige Schadensersatzklauseln zu Gunsten des Auftraggebers
  • Unklare Leistungsabgrenzungen zwischen Hauptauftragnehmer und Subunternehmern
  • Haftungsausschlüsse für Planungsfehler, die dem Auftragnehmer übergewälzt werden
  • Verlängerte Verjährungsfristen für Mängelansprüche jenseits des VOB/B-Standards
  • Preisanpassungsklauseln, die bei Materialpreisschwankungen einseitig den Auftragnehmer benachteiligen

Mit vs. ohne KI, ein ehrlicher Vergleich

KennzahlOhne KI-gestützte PrüfungMit KI-Risikoanalyse
Prüfzeit Vertragsunterlagen pro Angebot4–8 Stunden (oft nicht vorhanden)60–90 Minuten Nachprüfung markierter Stellen
Abdeckungsrate kritischer Klauseln40–60 % bei Zeitdruck80–90 % bei strukturierter Prompt-Bibliothek
Erkannte Haftungsrisiken vor AngebotsabgabeStark abhängig von Erfahrung der PersonSystematisch, unabhängig von Personalverfügbarkeit
Entscheidungsgrundlage Go/No-GoBauchgefühl und ErfahrungDokumentierter Risikobericht mit Prioritäten
Nachtragsquote durch verpasste Fristen-In der Praxis: deutliche Reduktion nach 6–12 Monaten

Erfahrungswerte aus Bauprojekten mit strukturierter Vertragsanalyse; eigene Erhebung aus Praxisberichten. Abdeckungsraten und Zeitangaben variieren erheblich je nach Klauselkomplexität und eingesetztem System.

Einschätzung auf einen Blick

Zeitersparnis, mittel (3/5) Die KI reduziert die Prüfzeit spürbar, von mehreren Stunden auf 60 bis 90 Minuten für die Nachprüfung der markierten Stellen. Das ist eine echte Entlastung in der Angebotsphase, aber keine vollständige Automatisierung: Der Kalkulator muss die Ergebnisse einordnen, Kontext beurteilen und mit der eigenen Projekterfahrung abgleichen. Verglichen mit Use Cases wie der Bautagebuch-Automatisierung oder der Mängelerfassung, die repetitive Alltagsaufgaben vollautomatisch übernehmen, bleibt die Zeitersparnis hier moderat.

Kosteneinsparung, sehr hoch (5/5) Das ist der stärkste Hebel in diesem Use Case, und der Grund, warum kosteneinsparung=5 hier vertretbar ist, obwohl das Ergebnis unsicher bleibt. Ein einziger verhindeter Verlustauftrag kann 50.000 bis 500.000 Euro Schaden vermeiden. Wer als Bauunternehmen drei bis fünf derartige Schadensfälle pro Dekade erlebt, hat damit das Potenzial für die größte Einzeleinsparung im gesamten bauwesen-Anwendungsbereich, deutlich über laufende Effizienzgewinne anderer Use Cases hinaus. Die Stärke ist real, aber das Eintreten hängt davon ab, ob der Risikoschutz tatsächlich zum Tragen kommt.

Schnelle Umsetzung, mittel (3/5) Bis zu einem funktionierenden Prüfprozess mit strukturierter Prompt-Bibliothek und klarer Zuständigkeit vergehen erfahrungsgemäß vier bis acht Wochen. Das ist keine technische Hürde, aber eine organisatorische: Wer prüft, was wird geprüft, wann gilt eine Klausel als kritisch genug für die Rechtsabteilung? Vergleichbar mit dem Nachtragsmanagement, das ähnlich strukturierte Aufbauphasen erfordert.

ROI-Sicherheit, niedrig (2/5) Das ist der ehrlichste Score in dieser Bewertung. Der Nutzen ist präventiv, er entsteht dadurch, dass etwas Schlimmes nicht passiert. Ob ein Verlustauftrag durch die Risikoanalyse verhindert wurde oder ob er sowieso nicht eingetreten wäre, lässt sich im Nachhinein nicht beweisen. Bauunternehmen, die selten Verlustprojekte haben, werden keinen messbaren ROI feststellen. Wer regelmäßig in Vertragsprobleme läuft, kann hingegen retrospektiv klare Kausalitäten benennen. Unter den bauwesen-Use Cases liegt roi_sicherheit hier am niedrigsten, neben der Baustellensicherheit-Kameraüberwachung.

Skalierbarkeit, mittel (3/5) Eine gut aufgebaute Prompt-Bibliothek funktioniert für alle Ausschreibungen, unabhängig von der Projektanzahl. Der Aufwand wächst nicht proportional mit dem Angebotsvolumen. Aber: Die Qualität der Ergebnisse hängt daran, dass die Prompt-Bibliothek aktuell bleibt, neue BGH-Urteile, VOB-Änderungen oder projektspezifische Vertragstypen erfordern regelmäßige Überarbeitung.

Richtwerte, stark abhängig von Unternehmensstruktur, Projektvolumen und Klauselkomplexität der Auftraggeber.

Was die KI konkret macht

Das technische Vorgehen basiert auf LLM-gestützter Dokumentenanalyse: Du lädst die Vertragsunterlagen, Bauvertrag, Besondere Vertragsbedingungen, Zusätzliche Technische Vertragsbedingungen, Leistungsverzeichnis, in ein System, das darauf trainiert ist, strukturiert nach definierten Klauselkategorien zu suchen.

Das System tut dabei drei Dinge:

  1. Extraktion: Es findet Textpassagen, die einem bestimmten Risikofeld zugeordnet werden können, Vertragsstrafen, Kündigungsklauseln, Behinderungsanzeigen, Haftungsausschlüsse.

  2. Kategorisierung und Priorisierung: Es bewertet die extrahierten Passagen nach Schweregrad und markiert, ob eine Klausel vom VOB/B-Standard abweicht, für den Auftragnehmer benachteiligend ist oder juristisch geprüft werden sollte.

  3. Berichtsgenerierung: Es fasst die Ergebnisse in einem strukturierten Risikobericht zusammen, nicht als Rechtsauskunft, sondern als Prüfliste für den Kalkulator und Entscheidungsgrundlage für das Management.

Was das System nicht tut: Es gibt keine Rechtsauskunft, trifft keine Go/No-Go-Entscheidung und ersetzt keine anwaltliche Vertragsverhandlung. Die Verantwortung für die Interpretation und Reaktion liegt beim Menschen.

Die technisch einfachste Version nutzt ChatGPT oder Claude mit einem gut ausgearbeiteten System-Prompt, dem du die Vertragsunterlagen als Text übergibst. Die professionellere Variante sind auf Bauverträge spezialisierte Tools wie Document Crunch (englischsprachiger Markt, FIDIC/NEC/AIA-Verträge) oder europäische LLM-Plattformen mit eigenem Klausel-Playbook.

VOB/B vs. BGB-Werkvertrag: Was die KI unterschiedlich bewertet

Das ist die Besonderheit im deutschen Bauwesen, die kein generisches KI-Tool von alleine kennt: Je nachdem, ob ein Bauvertrag nach VOB/B oder nach BGB-Werkvertrag geschlossen wurde, gelten vollständig andere Standardregeln, und damit andere Maßstäbe für die Risikobeurteilung.

VOB/B-Verträge (Vergabe- und Vertragsordnung für Bauleistungen, Teil B):

  • Gelten als ausgewogenes Regelwerk zwischen Auftraggeber und Auftragnehmer
  • Enthalten spezifische Regelungen zu Nachtrag, Behinderung, Kündigung und Mängelrechten
  • Eine Klausel, die von VOB/B abweicht, kann den Auftragnehmer erheblich belasten, oder die gesamte VOB/B-Vereinbarung unwirksam machen, wenn die Abweichung als AGB-Klausel gilt
  • KI-Risikobewertung muss explizit auf VOB/B-Abweichungen testen, nicht nur auf allgemeine Klauselrisiken

BGB-Werkverträge (§ 631 ff. BGB):

  • Gelten seit der Baurechtsreform 2018 mit eigenem Bauvertragstitel (§ 650a ff. BGB)
  • Enthalten Verbraucherrechte und staatliche Schutzmechanismen, aber weniger spezifische Bau-Regelungen als die VOB/B
  • Das Risikoprofil ist anders: Fehlende Regelungen zu Behinderung, Nachtrag und Kündigung müssen individuell vereinbart werden, was sie zu einer Lückenquelle macht

Für dein KI-System bedeutet das: In deinem System-Prompt muss stehen, nach welchem Regelwerk der Vertrag geschlossen wird, und die KI muss wissen, welche Klauseln als Abweichungen von diesem Standard zu bewerten sind. Ein generischer Prompt, der nur nach „riskanten Klauseln” sucht, wird VOB/B-spezifische Risiken nicht korrekt priorisieren.

Konkrete Beispiele für unterschiedliche Beurteilung derselben Klausel:

KlauselUnter VOB/BUnter BGB-Werkvertrag
„Behinderungsanzeige innerhalb 24 h”Abweichung von § 6 Abs. 1 VOB/B (3 Tage), risikorelevantZulässige individuelle Vereinbarung, zu prüfen
„Vertragsstrafe max. 5 % der Auftragssumme”VOB/B-konform, kein SonderrisikoGgf. AGB-rechtlich bedenklich, § 309 Nr. 6 BGB prüfen
„Abnahme durch schriftliche Erklärung”VOB/B-konformZulässig, aber auf Verjährungsbeginn achten

Wenn du den Prompt ohne diese Unterscheidung einsetzt, riskierst du, dass die KI Standardklauseln als riskant markiert (Fehlalarm) oder tatsächlich gefährliche Abweichungen als unproblematisch einstuft (Fehleinschätzung).

Konkrete Werkzeuge, was wann passt

ChatGPT oder Claude mit Prompt-Bibliothek, Der pragmatische Einstieg für die meisten mittelständischen Bauunternehmen. Du entwickelst einen strukturierten System-Prompt, der die KI als Vertragsanalysten instruiert, und überreichst die Vertragsunterlagen als Text. Keine Lizenz für ein spezialisiertes Tool nötig. Einschränkung: Die Qualität hängt stark von der Prompt-Qualität ab; VOB/B-spezifisches Wissen muss explizit in den Prompt eingebettet werden. Kosten: ChatGPT Plus 20 USD/Monat oder Claude Pro 20 USD/Monat. Für 2–3 Kalkulatoren ist das kostengünstiger als jede spezialisierte Softwarelizenz.

Legartis, Schweizer Legal-AI mit EU-Hosting und ISO 27001-Zertifizierung. Stark bei standardisierten Vertragstypen (NDAs, Rahmenverträge, Lieferantenverträge). Für Bauverträge nach VOB/B weniger optimiert als für internationales Vertragsrecht, aber bei gemischten Vertragsportfolios (Rahmenvereinbarungen mit öffentlichen Auftraggebern und privatrechtliche Verträge gleichzeitig) ein ernsthafter Kandidat. Preise auf Anfrage, Einstiegspakete verfügbar; EU-Hosting ist DSGVO-Vorteil. Geeignet für Bauunternehmen mit einem eigenen Rechtsteam, das die Konfiguration übernimmt.

ContractHero, Deutsches Vertragsmanagement-Tool mit Fokus auf Fristenüberwachung und Bestandsvertragsdigitalisierung. Stärker im Verwalten als im Analysieren neuer Risiken vor Angebotsabgabe. Nützlich als Ergänzung: Wenn nach Vertragsunterzeichnung Fristen, Kündigungsrechte und Folgeentscheidungen überwacht werden müssen, ist ContractHero die richtige Ergänzung zur KI-gestützten Vorprüfung. Ab 390 €/Monat (Essential-Plan, 5 Nutzer).

Document Crunch, Auf Bauverträge spezialisierte KI-Plattform aus den USA. Analysiert Vertrag, Leistungsverzeichnis und Pläne gleichzeitig; erkennt über 40 Klauseltypen mit Quellenangaben. 80 % Zeitersparnis bei der Vertragsanalyse laut Anbieter. Für deutschsprachige VOB/B-Verträge nicht geeignet, auf US-amerikanische Vertragssysteme (AIA, NEC, FIDIC) trainiert. Sinnvoll für international tätige Bauunternehmen mit anglophonen Partnerprojekten; für den deutschen Markt nur als Ergänzung.

Wann welcher Ansatz

  • Rein VOB/B-Verträge, kleines Unternehmen → ChatGPT oder Claude mit spezialisiertem Prompt
  • Gemischtes Vertragsportfolio, eigene Rechtsabteilung → Legartis
  • Vertragsarchivierung und Fristenmanagement nach Abschluss → ContractHero
  • Internationale Projekte (FIDIC/NEC/AIA) → Document Crunch

Datenschutz und Datenhaltung

Bauvertragsunterlagen enthalten typischerweise sensible Informationen: Bieterpreise, Kalkulationsgrundlagen, interne Projektkostenpläne, manchmal auch personenbezogene Daten von Subunternehmern und Beteiligten. Bevor du Vertragsunterlagen in ein Cloud-KI-System hochlädst, gilt es zu klären:

Wer verarbeitet die Daten, und wo? Für ChatGPT und Claude ohne Enterprise-Vertrag gilt: Datenverarbeitung in den USA. Das ist für öffentliche Ausschreibungsunterlagen mit Preisangaben ein echter Datenschutzkonflikt, Auftraggeber schließen manchmal ausdrücklich aus, dass Angebotsdaten Dritte erreichen. Prüfe das vor dem Einsatz.

Sichere Alternativen für sensible Unterlagen:

  • Claude über AWS Bedrock (Frankfurt), EU-Datenhosting, AVV verfügbar, kein Training auf Kundendaten
  • Azure OpenAI Service, GPT-4 in deutschen Azure-Rechenzentren, für Unternehmen mit bestehender Azure-Infrastruktur
  • Legartis, EU-Hosting, ISO 27001-zertifiziert
  • ContractHero, Deutsches Hosting (Frankfurt), BSI C5-zertifiziert

Für die einfachste datenschutzkonforme Lösung in der Angebotsphase: Entferne kalkulationsrelevante Zahlen und Preisangaben aus den Unterlagen, bevor du sie hochlädst, und analysiere nur die Vertragsbedingungen als Text. Das reduziert das Datenschutzrisiko erheblich und ist für die Klauselanalyse ohnehin ausreichend.

Der DSGVO-Schritt: Mit jedem externen Cloud-Anbieter, dem personenbezogene Daten übergeben werden, muss ein Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO abgeschlossen sein. Bei ChatGPT, Claude und Legartis sind AVV-Vorlagen im Enterprise- oder Business-Plan erhältlich; bei Consumer-Plänen gilt das nicht automatisch.

Haftung, wenn die KI eine Risikoklausel übersieht

Das ist die unbequeme Frage, die jeder stellt, der diesen Prozess einführt: Was passiert, wenn die KI eine kritische Klausel nicht erkennt, und das Unternehmen aufgrund dieser fehlenden Warnung einen nachteiligen Vertrag unterzeichnet?

Die kurze Antwort: Rechtlich liegt die Verantwortung beim Menschen, der die Entscheidung trifft. KI-Systeme sind derzeit weder als rechtliche Beratungstools zugelassen noch haften sie für ihre Ausgaben. Eine Haftungsklage gegen OpenAI oder Anthropic für eine übersehene Vertragsklausel ist nach aktuellem deutschen und EU-Recht nicht erfolgversprechend.

Was das für dich bedeutet:

  1. Die KI ist ein Hilfsmittel, kein Prüfer. Positioniere den Einsatz intern so: Die KI markiert Klauseln, die Aufmerksamkeit verdienen. Der Kalkulator oder Bauleiter beurteilt. Der Anwalt entscheidet bei kritischen Fällen. Diese Dreiteilung muss dokumentiert sein.

  2. Bei kritischen Projekten ersetzt KI die Anwaltsprüfung nicht. Bei Projekten über einem internen Schwellenwert (z.B. Auftragsvolumen über 500.000 €) oder bei unbekannten Auftraggebern mit individuellen AVBs sollte weiterhin eine anwaltliche Kurzprüfung stattfinden. Die KI-Vorprüfung macht diese effizienter, sie schafft eine Vorauswahl, die der Anwalt dann vertieft.

  3. Der EU AI Act stuft Vertragsanalyse als hohes Risiko ein, wenn sie für wesentliche wirtschaftliche Entscheidungen eingesetzt wird. Ab 2026 müssen Unternehmen, die KI für derartige Zwecke einsetzen, nachweisen können, dass menschliche Aufsicht vorhanden war. Die Dokumentation, dass ein Mensch die KI-Ergebnisse bewertet hat, ist bereits heute gute Praxis.

  4. Fehlalarme und Fehleinschätzungen kommen vor. Akademische Untersuchungen zeigen, dass allgemeine LLMs bei spezifischen Rechtsfragen einen erheblichen Anteil falscher oder unvollständiger Antworten produzieren, bei spezifischen Rechtsfragen zu US-Gerichtsurteilen fanden Forscher (Dahl et al., Journal of Legal Analysis, 2024) Halluzinationsraten von 58–88 %. Für deutsches Baurecht und VOB/B-Klauseln gilt dasselbe Prinzip: Ohne spezifisches Training und ohne Quellenprüfung ist jede KI-Ausgabe als Ausgangspunkt zu betrachten, nicht als Ergebnis.

Newsletter

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Neue KI-Use-Cases, ehrliche Tool-Tests und DSGVO-Updates, verständlich aufbereitet. Kein Spam, jederzeit abbestellbar.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Die sieben häufigsten Risikoklauseln im Check

Das sind die Klauselfelder, die in deutschen Bauverträgen am häufigsten zu nachträglichen Verlusten führen, und für die ein strukturierter Prompt explizit suchen sollte:

  1. Behinderungsanzeigefrist, Abweichungen von § 6 Abs. 1 VOB/B (3 Werktage). Verträge mit 24-h-Fristen oder ohne Fristangabe sind riskant.

  2. Vertragsstrafen und Pönalen, Höhe, Kumulierbarkeit, Auslösebedingungen. Gerade Tagespönalen in Verbindung mit frühen Terminmeilensteinen können eskalieren.

  3. Haftungsdeckel und Haftungsausschlüsse, Einseitige Beschränkungen der Schadensersatzhaftung des Auftraggebers, besonders bei Planungsfehlern, die dem Auftragnehmer übergewälzt werden.

  4. Zahlungsfristen und Skonto-/Abzugsklauseln, Verlängerte Zahlungsfristen über 30 Tage (§ 286 Abs. 3 BGB), einseitige Skontoabzüge außerhalb vereinbarter Bedingungen.

  5. Nachunternehmerfreigabe, Zustimmungserfordernisse des Auftraggebers für jeden Subunternehmer, verbunden mit unklaren Fristen oder stillschweigender Verweigerung.

  6. Mängelrechte und Gewährleistungsfristen, Verlängerungen über das VOB/B-Standard-Niveau (4 Jahre für Bauwerk) hinaus, besonders wenn sie mit Einbehaltsregelungen kombiniert sind.

  7. Preisgleitklauseln oder deren Fehlen, Bei längeren Projekten (über 12 Monate): Wenn keine Preisgleitklausel vereinbart ist, trägt der Auftragnehmer das volle Materialpreisrisiko. Seit 2022 ist das für viele Unternehmen schmerzhaft gelernt worden.

Was es kostet, realistisch gerechnet

Einstieg mit ChatGPT oder Claude (eigener Prompt)

  • Prompt-Entwicklung: einmalig 8–20 Stunden interner Aufwand (Kalkulator + ggf. Anwalt für Klauselkategorien)
  • Laufende Kosten: 20–30 USD/Monat für einen Pro-/Plus-Zugang
  • Gesamtjahr 1: ca. 1.500–3.000 Euro (inkl. interner Prompt-Entwicklungszeit)

Spezialisiertes Legal-AI-Tool (Legartis, ContractHero)

  • Einrichtung und Konfiguration: 4–8 Wochen, ggf. externer Berater (1.000–5.000 Euro)
  • Laufend: 300–600 €/Monat für kleine Teams (2–4 Nutzer)
  • Gesamtjahr 1: 5.000–12.000 Euro

Was du dagegen rechnen kannst: Ein typischer Verlustauftrag durch übersehene Vertragsrisiken verursacht erfahrungsgemäß 30.000 bis 200.000 Euro direkten Schaden (entgangener Nachtrag, Schadensersatzforderungen, Vertragsstrafe). Bei 30 Angeboten pro Jahr und angenommener 5%-Verlustrate wäre das statistisch 1–2 Problemfälle pro Jahr, deren finanzielle Auswirkung durch eine strukturierte Vorprüfung erheblich reduziert werden kann.

Realistische Erwartung: Im ersten Jahr wird der Nutzen primär in Sicherheit, Qualität der Entscheidungen und Zeitersparnis spürbar. Der direkte finanzielle ROI wird messbar, wenn ein konkreter Fall eingetreten und dokumentiert ist, oder ausgeblieben ist, weil die KI die Klausel markiert hat.

Typische Einstiegsfehler

1. Einen generischen Prompt verwenden, der nicht VOB/B-spezifisch ist. Ein einfaches „Analysiere diesen Vertrag auf Risiken” liefert eine allgemeine Klausel-Übersicht, aber keine VOB/B-relevante Risikopriorisierung. Du brauchst einen Prompt, der explizit fragt: „Welche Klauseln weichen vom VOB/B-Standard ab? Welche sind für den Auftragnehmer nachteiliger als die gesetzliche Regelung?” Ohne diese Spezifikation markiert die KI Klauseln, die völlig unproblematisch sind, und übersieht branchenspezifische Fallen.

2. Die KI als finale Prüfinstanz behandeln, nicht als Startpunkt. Der häufigste Fehler nach der Einführung: Das KI-Ergebnis wird an den Kalkulator weitergeleitet, und wenn nichts markiert wurde, gilt der Vertrag als geprüft. Das ist falsch. Kein aktuelles KI-System hat eine Erkennungsrate von 100 % für alle relevanten Klauseltypen, schon gar nicht bei ungewöhnlich formulierten oder verschachtelten Klauseln. Der Prozess muss vorsehen, dass eine Person die KI-Ausgabe aktiv bewertet und unbekannte Klauselfelder zusätzlich prüft.

3. Den Prozess einrichten, aber die Prompt-Bibliothek nicht pflegen. Das ist der langsame Fehler: Das System wird konfiguriert, die ersten Ergebnisse sind gut, und dann passiert sechs Monate lang nichts. Inzwischen haben sich neue BGH-Urteile ergeben, der Auftraggeber hat seine AGB geändert, und neue Klauseltypen sind in Ausschreibungen aufgetaucht. Eine nicht aktuell gehaltene Prompt-Bibliothek gibt falsches Vertrauen. Mindestens halbjährlich sollte die Bibliothek mit dem aktuellen Stand von Rechtsprechung und Vertragsmarkt abgeglichen werden, entweder intern oder mit einem Baurechtsspezialisten.

Was mit der Einführung wirklich passiert, und was nicht

Die technische Einrichtung ist schnell erledigt, ein ChatGPT-Plus-Account, ein durchdachter Prompt, ein erstes Vertragspaket zum Testen. Das dauert einen Nachmittag.

Was länger dauert: die Akzeptanz im Team.

Kalkulatoren und Bauleiter, die seit 20 Jahren Verträge nach Erfahrung prüfen, werden das KI-Tool zunächst mit Skepsis betrachten. Die typischen Einwände klingen so: „Die kennt unsere Branche nicht”, „Das ist doch nur Standardtext”, „Den Vertrag hab ich schon dreimal gelesen, da ist nichts.” Diese Reaktionen sind nicht irrational, sie kommen aus echter Expertise.

Was wirkt: Zeigen, wo die KI etwas Konkretes gefunden hat, das dem erfahrenen Kalkulator entgangen wäre. Nicht in einer Schulung mit Beispieldokumenten, sondern bei einem echten aktuellen Angebot, bei dem das System eine Klausel markiert, die der Bauleiter für irrelevant hält, und die sich nach kurzer Diskussion als tatsächliches Risiko herausstellt.

Ein zweiter Widerstand kommt von der Geschäftsführung, die fragt: „Und wenn die KI etwas übersieht, wer haftet dann?” Die Antwort auf diese Frage muss vor dem Rollout feststehen, nicht danach. Die interne Prozessdokumentation muss klar machen: Die KI ist ein Hilfsmittel, die Entscheidungsverantwortung liegt beim Menschen.

Was konkret hilft:

  • Mit einem Pilotprojekt starten, nicht mit der Einführung für alle Angebote gleichzeitig
  • Den Kalkulator mit dem meisten Klausel-Know-how in die Prompt-Entwicklung einbeziehen, er wird zum Experten für das System
  • Die erste gute Entdeckung dokumentieren und intern kommunizieren

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Prompt-EntwicklungWoche 1–2Klauselkategorien definieren, System-Prompt schreiben, erste VOB/B-Referenzliste anlegenZu allgemeiner Prompt ohne VOB/B-Spezifika, Iteration nötig
Pilottest mit 5–10 AngebotenWoche 3–4Echte Ausschreibungsunterlagen analysieren, Ergebnisse gegen Expertenurteil abgleichenZu viele Fehlalarme demotivieren früh, Prompt anpassen bevor Rollout
ProzessdefinitionWoche 4–6Wer prüft wann, was ist das Eskalationskriterium für Anwalt, wie wird dokumentiertOhne klare Zuständigkeit bleibt KI-Prüfung optional, und unterbleibt
Rollout für alle AngeboteWoche 6–8Strukturierte Vertragsanalyse für alle Ausschreibungen über definiertem SchwellenwertPrompt-Bibliothek nicht dokumentiert, bei Personalwechsel geht Wissen verloren
Erstes ReviewMonat 6Klauselkategorien mit aktueller Rechtsprechung abgleichen, neue Klauseltypen nachführenWird auf unbekannte Zeit verschoben, Verfall der Prompt-Qualität

Häufige Einwände, und was dahintersteckt

„Unsere Kalkulatoren prüfen die Verträge doch selbst.” Stimmt, aber unter welchen Bedingungen? Wenn 40 Seiten Besondere Vertragsbedingungen bis Montagmorgen gelesen werden müssen, ist der Prüfprozess ehrlich gesagt kein strukturierter Prozess. Die KI ergänzt die Erfahrung des Kalkulators, sie macht die Prüfung systematisch, auch wenn die Zeit fehlt. Wer sagt, der Kalkulator prüft ohnehin alles, sollte ehrlich fragen: Wie oft ist trotzdem etwas durchgerutscht?

„Die KI versteht das Baurecht nicht.” Teilweise richtig: Ein allgemeines LLM ohne spezifischen VOB/B-Prompt kennt das deutsche Baurecht nicht tiefer als ein juristischer Laie. Aber darum geht es nicht. Die KI soll nicht Recht sprechen, sie soll Klauseln extrahieren, die von einem definierten Standard abweichen. Das ist ein Textmustererkennungsproblem, nicht ein Rechtsproblem. Ein guter Prompt mit klaren Kategorien und Referenzklauseln löst das zu 80–90 %.

„Was ist, wenn die KI etwas Falsches markiert?” Ein Fehlalarm kostet 10 Minuten Prüfzeit. Eine übersehene Vertragsstrafe kostet 34.000 Euro. Diese Asymmetrie ist der entscheidende Punkt. Fehlalarme sind kein Systemversagen, sie sind ein akzeptabler Preis für das Sicherheitsnetz.

Woran du merkst, dass das zu dir passt

  • Du hast mehr als 20 bis 30 Ausschreibungen pro Jahr und die Angebotsphase ist regelmäßig zeitkritisch, Vertragsunterlagen werden tatsächlich nicht vollständig gelesen
  • Du hast in den letzten fünf Jahren mindestens einen Verlustauftrag gehabt, bei dem rückblickend eine Vertragsklausel der Ausgangspunkt war
  • Dein Unternehmen arbeitet mit unterschiedlichen Auftraggebern, einige davon mit individuellen AVBs oder unbekannten Klauselstrukturen
  • Du hast keinen eigenen Syndikusanwalt, aber fragst bei kritischen Projekten trotzdem gelegentlich einen Baurechtsspezialisten

Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:

  1. Jahresumsatz unter ca. 2 Mio. Euro oder weniger als 15–20 Ausschreibungen pro Jahr. Der Aufwand für Prompt-Entwicklung und Prozesseinrichtung amortisiert sich bei wenigen Angeboten nicht. Für diesen Fall reicht eine gute Klausel-Checkliste, die manuell durchgearbeitet wird, kombiniert mit einer einmaligen Anwaltsstunde, die die kritischsten Felder definiert.

  2. Kein standardisierter Angebotsprozess, bei dem Vertragsunterlagen systematisch gesammelt und digital vorliegen. Die KI braucht die Dokumente als Text, wer mit gedruckten Ausschreibungen oder schlecht gescannten PDFs ohne OCR arbeitet, muss erst die Dokumenteninfrastruktur aufräumen, bevor KI-Analyse Sinn ergibt.

  3. Nur Rahmenverträge mit bekannten Standardformularen ohne individuelle Klauseln. Wenn dein Unternehmen ausschließlich mit einem Auftraggeber arbeitet, dessen Vertrag sich seit Jahren nicht verändert hat, und du diesen Vertrag bereits auswendig kennst: Der Mehrwert einer KI-Analyse ist gering. Die KI entfaltet ihren Nutzen bei Varianz, verschiedene Auftraggeber, verschiedene Klauselstrukturen, unbekannte Vertragswerke.

Das kannst du heute noch tun

Öffne ChatGPT (Plus-Zugang) oder Claude und lade die Besonderen Vertragsbedingungen einer aktuellen oder kürzlich abgeschlossenen Ausschreibung hoch. Nutze den Prompt unten als Startpunkt. Schau, was das System markiert, und vergleiche es mit deiner eigenen Einschätzung des Vertrags.

Das dauert 20 Minuten. Was du danach weißt: ob der strukturierte Ansatz für eure Vertragstypen funktioniert, und wo der Prompt noch schärfer formuliert werden muss.

Fertiger Risiko-Analyse-Prompt für Bauverträge
Du bist ein erfahrener Baurechtsspezialist, der Bauunternehmen dabei hilft, Ausschreibungsunterlagen und Bauverträge auf Risikoklauseln zu prüfen. Analysiere den folgenden Vertragstext und erstelle einen strukturierten Risikobericht. Das Regelwerk ist [VOB/B / BGB-Werkvertrag, bitte hier angeben]. Suche explizit nach diesen Risikofeldern: 1. BEHINDERUNGSANZEIGE: Abweichungen von der Standardfrist (VOB/B: 3 Werktage), kürzere Fristen, unklare Formulierungen oder Schriftformerfordernisse 2. VERTRAGSSTRAFEN: Höhe (in % der Auftragssumme), Kumulierbarkeit, Auslösebedingungen 3. HAFTUNGSAUSSCHLÜSSE: Einseitige Beschränkungen zu Lasten des Auftragnehmers, insbesondere bei Planungsfehlern des Auftraggebers 4. NACHUNTERNEHMERREGELUNGEN: Zustimmungspflichten, unklare Fristen, einseitige Ablehnungsrechte 5. ZAHLUNGSFRISTEN: Abweichungen von § 286 Abs. 3 BGB (30 Tage), einseitige Skontoabzüge 6. MÄNGELRECHTE/GEWÄHRLEISTUNG: Fristverlängerungen über VOB/B-Standard, Einbehaltsregelungen 7. PREISANPASSUNG: Fehlen einer Preisgleitklausel bei Projektlaufzeit über 12 Monate Für jedes gefundene Risikofeld: - Zitiere die genaue Klausel (Abschnitt + Wortlaut) - Bewerte: HOCH / MITTEL / NIEDRIG - Erkläre in 1–2 Sätzen, warum die Klausel riskant ist - Empfehle die nächste Handlung (anwaltliche Prüfung / Verhandlungsversuch / Information des Projektleiters) Gib am Ende eine Gesamtbewertung: Wie viele Hochrisiko-Klauseln wurden gefunden? Empfehlung: anwaltliche Vorprüfung ja/nein? Wichtig: Du gibst keine Rechtsauskunft. Deine Analyse ist eine Vorprüfung für den internen Kalkulator und Entscheidungsgrundlage für die Go/No-Go-Entscheidung. [HIER VERTRAGSTEXT ODER BESONDERE VERTRAGSBEDINGUNGEN EINFÜGEN]
Funktioniert mit ChatGPT Plus, Claude Pro, Azure OpenAI
Beispiel-Ausgabe

Mitarbeiter:in

§ 12 Vertragsstrafe (1) Wird eine vereinbarte Vertragserfüllungsfrist überschritten, hat der Auftragnehmer für jeden Werktag der Überschreitung eine Vertragsstrafe in Höhe von 0,5 % der Auftragssumme, höchstens 15 % der Auftragssumme, zu zahlen. (2) Behinderungsanzeigen sind innerhalb von 24 Stunden schriftlich beim Auftraggeber einzureichen. Verspätet eingereichte Anzeigen begründen keine Ansprüche auf Bauzeitverlängerung.

KI-Assistent

RISIKOBERICHT, Bauvertrag [Auftraggeber] HOCHRISIKO, 2 Klauseln gefunden --- RISIKOFELD 1: VERTRAGSSTRAFE, BEWERTUNG: HOCH Klausel: § 12 Abs. 1, „0,5 % je Werktag, max. 15 %" Standardwert VOB/B: 0,1–0,3 % je Werktag, max. 5–10 %, abhängig von Vereinbarung Risiko: Die Vertragsstrafe liegt mit 0,5 % deutlich über dem üblichen Marktstandard. Bei 10 Verzugstagen wären das bereits 5 % der Auftragssumme. Der Deckel von 15 % übersteigt die BGH-Grenze zur AGB-Unwirksamkeit (10 %), bei Klausel als AGB möglicherweise unwirksam. Empfehlung: Anwaltliche Prüfung, ob Klausel als individuelle Vereinbarung oder AGB einzustufen ist. Verhandlungsversuch: Reduzierung auf max. 0,3 % / 5 %. --- RISIKOFELD 2: BEHINDERUNGSANZEIGE, BEWERTUNG: HOCH Klausel: § 12 Abs. 2, „innerhalb von 24 Stunden schriftlich" Standard VOB/B § 6 Abs. 1: „alsbald", in der Praxis 3 Werktage anerkannt Risiko: 24-Stunden-Frist weicht erheblich vom VOB/B-Standard ab und ist bei Wochenendbehinderungen, Feiertagen oder komplexen Ursachen praktisch nicht einzuhalten. Verspätete Anzeige führt zum vollständigen Verlust von Nachtragsansprüchen durch Behinderung. Empfehlung: Anwaltliche Prüfung, ob Klausel bei VOB/B-Vertrag als Abweichung die Gesamtvereinbarung destabilisiert (§ 305b BGB). Verhandlungsversuch: Fristverlängerung auf 3 Werktage. --- GESAMTBEWERTUNG: Hochrisiko-Klauseln: 2 Empfehlung anwaltliche Vorprüfung: JA, insbesondere § 12 Abs. 1 und Abs. 2 sollten vor Angebotsabgabe mit einem Baurechtsspezialisten besprochen werden.

Quellen & Methodik

  • Laine et al. (2024): „Can ChatGPT exceed humans in construction project risk management?”, Emerald Publishing / Engineering, Construction and Architectural Management, Vol. 31, Nr. 13, Vergleich ChatGPT-4 mit 16 erfahrenen Risikomanagern in finnischen Bauunternehmen; ChatGPT überlegen in Breite, unterlegen in Praxistiefe und Spezifität.
  • Kehinde et al. (2023): „Assessing the Accuracy of ChatGPT Use for Risk Management in Construction Projects”, MDPI Sustainability, Vol. 15, Nr. 22, Nachweis systematischer Lücken bei kontextspezifischen Baurisiken in allgemeinen LLM-Antworten.
  • Dahl et al. (2024): „Large Legal Fictions: Profiling Legal Hallucinations in Large Language Models”, Journal of Legal Analysis, Oxford, Halluzinationsraten von 58–88 % bei allgemeinen LLMs zu spezifischen Rechtsfragen; Konsequenz für baurechtsnahe Anwendungen.
  • Brandenburgische Ingenieurkammer (2024): „VOB/B, Ein bewährtes Regelwerk mit Tücken: Was Ingenieure wissen müssen”, Überblick über die häufigsten Klauselrisiken für Auftragnehmer nach der BGB-Baurechtsreform 2018.
  • Provision AI (2025): „Risk Review, AI Contract & Spec Review for Construction”, Anbieterangabe 80 % Zeitreduktion bei Vertragsanalyse, 99,5 % Erkennungsrate mit Quellenangaben (Herstellerangabe, unabhängig nicht verifiziert).
  • Hauptverband der Deutschen Bauindustrie: Bauwirtschaft im Zahlenbild 2023, Brancheneckdaten; 79 % der Bauunternehmen 2023 mit erhöhter Risikowahrnehmung (DIHK-Konjunkturumfrage).
  • Klauselkategorien und Prüfansatz: Erfahrungswerte aus Baurechtspraxis und Angebotsprüfungen nach VOB/B; keine repräsentative Studie, aber konsistente Befunde aus Praxisberichten.

Du willst wissen, ob der Ansatz für eure Ausschreibungsstruktur funktioniert, und welche Klauselkategorien für eure typischen Auftraggeber am kritischsten sind? Meld dich, das klären wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Wissen ist der erste Schritt. Der zweite kostet Zeit.

Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar