Sachverständige & Gutachter beweiswürdigungbetrugforensik

KI-Assistent zur Beweiswürdigung bei komplexen Schadensfällen

KI analysiert alle vorliegenden Beweise eines Schadenfalls, Fotos, Zeugenaussagen, technische Berichte, Vorschäden, auf Widersprüche, Plausibilitätslücken und mögliche Manipulationshinweise.

⚡ Auf einen Blick

Problem: Bei betrugsverdächtigen oder streitigen Schadensfällen müssen Gutachter umfangreiche Beweismaterialien manuell auf Widersprüche prüfen, ein zeitaufwändiger Prozess, der forensische Erfahrung erfordert.
KI-Lösung: Ein LLM mit großem Kontextfenster vergleicht alle Beweismittel gleichzeitig, identifiziert Zeitstempel-Inkonsistenzen, Widersprüche zwischen Aussagen und technischen Befunden sowie statistische Auffälligkeiten im Schadensmuster, und gibt einen strukturierten Bericht mit Quellenangaben aus.
Typischer Nutzen: Beweiswürdigungs-Aufwand bei komplexen Fällen um 30–50 % reduzieren und Manipulationshinweise zuverlässiger erkennen als bei manueller Einzelprüfung.
Setup-Zeit: 6–10 Wochen, Datenstruktur, Falltypen, Offenlegungsprotokoll aufwändig
Kosteneinschätzung: Einrichtung 1.000–8.000 €, laufend 20–100 €/Person/Monat (Claude/ChatGPT Enterprise oder Vaarhaft)

Claude oder GPT-4o für manuelle KonsistenzprüfungMultimodales LLM mit Cross-Referenz-AnalyseForensik-Tool (Vaarhaft) + LLM-Berichtslayer

Worum geht's?

Es ist Donnerstag, 14:17 Uhr.

Gutachterin Sandra Liebwein legt drei Dokumente nebeneinander: die Schadenmeldung, das Lichtbildgutachten des Kunden und den Werkstattbericht. Dann holt sie die Polizeiprotokolle dazu. Und die WhatsApp-Fotos, die der Versicherer nachgereicht hat. Fünf Quellen. Neun Seiten. Mindestens zwei Zeitangaben, die nicht stimmen können.

Sie hat heute noch vier andere Fälle auf dem Schreibtisch.

Dieser hier riecht nach Betrug, aber riechen reicht vor dem Versicherer nicht. Sie braucht eine saubere Dokumentation der Widersprüche, mit Quellenangaben und möglichst ohne Lücken. Das dauert. Nicht weil Sandra Liebwein langsam ist. Sondern weil das menschliche Gehirn beim Cross-Check über fünf Dokumente in zwei parallelen Zeitsträngen an seine Grenzen kommt.

Das ist kein Einzelfall. Das ist jeder Betrugsverdachtsfall, in jedem größeren Gutachterbüro, jeden zweiten Tag.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Versicherungsbetrug ist kein Randphänomen. Laut Gesamtverband der Deutschen Versicherungswirtschaft (GDV) entstehen der deutschen Versicherungswirtschaft jährlich Schäden von mehreren Milliarden Euro durch betrügerische oder überhöhte Schadensmeldungen. Bei Kfz-Haftpflicht schätzt der GDV den Anteil betrügerischer Schäden auf 10–15 Prozent aller regulierten Fälle, das sind nicht Einzelfälle, das ist Grundrauschen.

Das Problem für den Gutachter: Betrug wird selten plump. Moderne Schadenmanipulation arbeitet mit Details. Ein Unfallhergang, der physikalisch knapp möglich ist. Fotos, die nachträglich bearbeitet wurden, aber auf den ersten Blick plausibel wirken. Zeugenaussagen, die sich mit dem Unfallbericht decken, bis auf einen Zeitstempel. Vorschäden, die im aktuellen Gutachten auftauchen, aber im vorherigen nicht erwähnt wurden.

Für den prüfenden Gutachter bedeutet das: stundenlange manuelle Arbeit. Ein einziger komplexer Betrugsverdachtsfall kann 4–6 Stunden reiner Analyseleistung erfordern, Dokumente gegenlesen, Zeitstränge rekonstruieren, Fotometadaten prüfen, Zeugenaussagen vergleichen. Fehler passieren nicht aus Nachlässigkeit, sondern weil das Gehirn beim Jonglieren mit fünf parallelen Quellen schlicht Kapazitätsgrenzen hat.

Ein Kfz-Versicherer, der in einer Visionet-Fallstudie (2024) KI-gestützte Beweisanalyse einführte, berichtete eine um 35 Prozent verkürzte Untersuchungsdauer bei Verdachtsfällen und eine um 25 Prozent verbesserte Erkennungsrate für Diskrepanzen. Das sind keine Labor-Ergebnisse, das ist der Betrieb unter Alltagsbedingungen mit durchschnittlichen Fallvolumina.

Was bleibt, wenn man diesen Aufwand nicht reduziert: Verdachtsfälle werden unter Zeitdruck abgezeichnet, weil die vollständige Prüfung schlicht nicht machbar ist. Berechtigte Auszahlungen werden blockiert, weil echte Unstimmigkeiten nicht von Schreibfehlern unterschieden werden. Streitfälle eskalieren, weil die Beweisdokumentation lückenhaft ist.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI	Mit KI-Beweiswürdigungs-Assistent
Analyse eines komplexen Verdachtsfalls	4–6 Stunden manuell	1,5–2,5 Stunden (KI + Gutachter)
Erfassung von Zeitstempel-Inkonsistenzen	Manuelle Parallellektüre, fehleranfällig	Automatischer Abgleich über alle Dokumente
Fotometadaten-Prüfung	Selten routinemäßig durchgeführt	Automatisch bei jedem Foto
Widerspruchs-Dokumentation	Freitext, keine einheitliche Struktur	Strukturierter Bericht mit Quellverweisen
Reproduzierbarkeit der Prüfung	Stark personenabhängig	Auditierbar und konsistent dokumentiert

Die Zeitangaben sind Erfahrungswerte aus vergleichbaren Dokumentenanalyse-Workflows. Der Abstand zwischen KI-gestützter und manueller Analyse wächst mit der Dokumentenmenge, ab acht Quellen pro Fall wird der Unterschied besonders spürbar.

Einschätzung auf einen Blick

Zeitersparnis, niedrig (2/5) Der Beweiswürdigungs-Assistent spart bei den betroffenen Fällen erheblich Zeit, 2–4 Stunden pro komplexem Verdachtsfall ist ein echter Hebel. Das Problem ist die Breite: Dieser Workflow betrifft typischerweise 5–15 Prozent des Gesamtfallvolumens. Für das Büro als Ganzes ist die Zeitersparnis deshalb deutlich geringer als bei Workflows, die alle Fälle betreffen, wie die automatisierte Gutachtenerstellung oder die Vor-Ort-Erfassung. Score 2 ist ehrlich: realer Nutzen, begrenzte Reichweite.

Kosteneinsparung, stark (4/5) Das ist der eigentliche Hebel. Ein erkannter Betrugsfall kann eine Fehlauszahlung von 5.000 bis 50.000 Euro verhindern. Selbst wenn der Assistent pro Monat nur zwei bis drei Fälle auffällig einordnet, die dann manuell vertieft geprüft und als betrügerisch bestätigt werden, übersteigt der verhinderte Schaden die Einrichtungs- und Betriebskosten des Systems schnell um ein Vielfaches. Unter den Anwendungsfällen im Gutachterbereich gehört dieser zu den wirtschaftlich stärksten, wenn die Fallbasis stimmt.

Schnelle Umsetzung, niedrig (2/5) Die technische Implementierung ist in 1–2 Wochen machbar. Die eigentlichen Zeitfresser sind die Vorstufen: Welche Falltypen werden einbezogen? Wie sind die Dokumente strukturiert und abgelegt? Welches Protokoll gilt für die Offenlegung des KI-Einsatzes gegenüber Auftraggeber und Gericht? Diese Fragen brauchen Zeit, und wenn sie schlecht beantwortet werden, entsteht ein rechtliches Risiko. Realistische Anlaufzeit bis zum stabilen Pilotbetrieb: 6–10 Wochen.

ROI-Sicherheit, niedrig (2/5) Der ROI ist stark von der Falllast abhängig. Ein Büro mit zehn oder mehr Betrugsverdachtsfällen pro Monat hat eine solide Basis für eine positive Wirtschaftlichkeitsrechnung. Wer im Schnitt zwei bis drei solche Fälle monatlich bearbeitet, wird den Aufwand nicht refinanzieren, zumindest nicht direkt. Der indirekte Nutzen (besser dokumentierte Berichte, höhere Glaubwürdigkeit in Streitverfahren) ist real, aber schwer zu beziffern.

Skalierbarkeit, sehr gering (1/5) Das ist das strukturelle Limit dieses Anwendungsfalls. Betrugsvolumen wächst proportional mit dem Fallvolumen, nicht überproportional. Ein System, das heute 12 Verdachtsfälle pro Monat prüft, prüft bei doppeltem Gesamtvolumen 24 Verdachtsfälle, aber es entsteht kein Hebel wie bei einem System, das denselben Aufwand für alle Fälle reduziert. Für Versicherungen mit hunderttausend Fällen pro Jahr ist das anders, für ein Gutachterbüro ist der Beweiswürdigungs-Assistent der am wenigsten skalierbare Anwendungsfall in dieser Kategorie.

Richtwerte, stark abhängig von Fallvolumen, Betrugsquote im eigenen Portfolio und rechtlichen Rahmenbedingungen.

Was der Assistent konkret macht

Der technische Kern ist ein LLM mit großem Kontextfenster, das alle fallrelevanten Dokumente gleichzeitig einliest und systematisch auf Inkonsistenzen prüft. Das klingt nach einem Schlagwort, lässt sich aber konkret beschreiben:

Zeitstrang-Rekonstruktion. Das System extrahiert aus allen Dokumenten alle Zeitangaben, Unfallzeitpunkt laut Meldung, Foto-Zeitstempel, GPS-Zeitstempel, Uhrzeit der Zeugenaussage, Einlieferungszeitpunkt in die Werkstatt, und legt sie übereinander. Widersprüche zwischen diesen Zeitangaben (z. B. „Fotos wurden 40 Minuten vor dem gemeldeten Unfall aufgenommen”) werden markiert und quellengenau benannt.

Metadaten-Analyse. Bilder tragen eingebettete Daten: Kameratyp, GPS-Koordinaten, Aufnahmedatum, Software-Version des Bearbeitungsprogramms. Ein System wie Vaarhaft analysiert diese Metadaten automatisch auf Plausibilitätslücken, fehlende Kameradaten (typisch für Screenshots), GPS-Koordinaten, die nicht mit dem gemeldeten Unfallort übereinstimmen, oder Anzeichen nachträglicher Bildbearbeitung.

Aussagen-Abgleich. Wenn eine Zeugenaussage besagt, dass das Fahrzeug von links nach rechts fuhr, und die Unfallskizze das Gegenteil zeigt, findet ein Mensch das, sofern er beide Dokumente gründlich liest. Das System findet es zuverlässig, auch wenn es auf Seite 3 eines Protokolls und Anhang B einer Tabelle versteckt ist.

Vorschaden-Vergleich. Wenn historische Gutachten vorliegen, prüft das System, ob im aktuellen Schadenbild Positionen auftauchen, die im letzten Gutachten nicht erwähnt wurden, oder umgekehrt. Das ist eine der häufigsten Betrugsmethoden im Kfz-Bereich: Vorschäden im aktuellen Unfall mitabrechnen.

Strukturierter Bericht. Am Ende steht kein Freitext, sondern ein strukturiertes Dokument: Widersprüche nach Kategorie geordnet, mit konkretem Quellennachweis pro Widerspruch. Das ist verwertbar, für die interne Entscheidung, für die Kommunikation mit dem Versicherer und, wenn nötig, für das Gericht.

Was das System nicht macht: Es entscheidet nicht, ob Betrug vorliegt. Das ist und bleibt Aufgabe des Gutachters. Das System liefert eine strukturierte Grundlage für diese Entscheidung, keine Antwort, sondern eine bessere Frage.

Was Gerichte dazu sagen, Offenlegungspflicht und Verwertbarkeit

Das ist die wichtigste Frage, die die meisten Einführungskonzepte ignorieren: Was passiert mit einem KI-gestützten Beweiswürdigungs-Bericht vor Gericht?

Die kurze Antwort: Er ist nur verwertbar, wenn der Gutachter transparent macht, wie er entstanden ist.

Das Landgericht Darmstadt hat in einem aufsehenerregenden Beschluss (Az. 19 O 527/16, bekannt geworden 2024/2025) einem gerichtlich bestellten Sachverständigen die Vergütung vollständig versagt, exakt 0,00 Euro, weil er ein KI-generiertes Gutachten eingereicht hatte, ohne das gegenüber dem Gericht offenzulegen. Das Gericht erkannte den Einsatz an sprachlichen Mustern und bat um Auskunft. Der Sachverständige war nicht ausreichend transparent. Ergebnis: Das Gutachten war unverwertbar, die Vergütung fiel vollständig weg.

Das ist keine juristische Randnotiz, das ist Betriebsrealität für jeden gerichtlich tätigen Gutachter.

Was konkret gilt: Nach § 407a ZPO muss ein Sachverständiger das Gutachten persönlich erstatten. Wenn KI-Werkzeuge eingesetzt werden, muss offengelegt werden, in welchem Umfang und für welche Aufgaben das geschehen ist. Das gilt nicht nur für die Textformulierung, sondern auch für Analyse-Tools, die zu Schlussfolgerungen im Gutachten beigetragen haben.

Für den Beweiswürdigungs-Assistenten bedeutet das:

Der Gutachter muss im Bericht kenntlich machen, dass eine KI-gestützte Analyse eingesetzt wurde
Die Schlussfolgerungen müssen vom Gutachter persönlich überprüft und verantwortet werden
Widersprüche, die das System identifiziert hat, müssen vom Gutachter inhaltlich bewertet sein, nicht nur übernommen
Auf Nachfrage muss der Gutachter erklären können, welche Dokumente eingespeist wurden und welche Analyseschritte das System durchgeführt hat

Wer das als Formalität behandelt, riskiert, dass ein Gericht den gesamten Bericht als unverwertbar verwirft, mit allen Konsequenzen für das Büro und den Auftraggeber.

Was das für die Einführung bedeutet: Noch vor der technischen Implementierung muss ein Offenlegungsprotokoll stehen. Ein Standard-Absatz, der in jeden Bericht eingefügt wird, der KI-gestützte Analysen enthält. Dieser Absatz sollte vor dem ersten Einsatz mit einem Fachanwalt für Prozessrecht abgestimmt werden.

Welche Beweismittel sich eignen, und welche Grenzen gelten

Nicht jede Beweisart lässt sich gleich gut von einem KI-System auswerten. Das zu kennen, verhindert falsche Erwartungen.

Gut geeignet:

Schriftliche Zeugenaussagen und Protokolle, das System kann Widersprüche zwischen Aussagen zuverlässig identifizieren
Digitale Fotos mit eingebetteten Metadaten, Zeitstempel, GPS, Kameradaten sind prüfbar
Technische Gutachten und Kalkulationsberichte, Zahlenkonsistenz, Positionsvergleiche
E-Mail-Ketten und schriftliche Kommunikation, Zeitverläufe, inhaltliche Widersprüche
Historische Gutachten zum gleichen Fahrzeug oder Objekt, Vorschadenvergleich

Eingeschränkt geeignet:

Gescannte Papierdokumente ohne OCR-Aufbereitung, das System braucht lesbaren Text; schlechte Scans liefern schlechte Ergebnisse
Fotos ohne Metadaten (z. B. Screenshots oder aus Messenger-Apps exportierte Bilder), die Metadaten-Prüfung entfällt, nur die visuelle Analyse bleibt
Handschriftliche Notizen, je nach Qualität stark eingeschränkt

Nicht geeignet:

Mündliche Aussagen, die nicht schriftlich protokolliert sind, das System kann nur analysieren, was digitalisiert vorliegt
Video- und Audiomaterial, je nach System sehr eingeschränkt; Transkription vorab erforderlich, verliert dabei Kontext
Physische Beweismittel (Fahrzeugteile, Bausubstanz), hier ist technische Expertise des Gutachters vor Ort unersetzbar

Der wichtigste Grundsatz: Garbage in, garbage out. Ein System, das auf unvollständiger oder schlecht aufbereiteter Dokumentenbasis arbeitet, produziert unvollständige Ergebnisse. Die Qualität der Eingangsunterlagen entscheidet über die Qualität des Outputs, nicht nur die Qualität des KI-Systems.

Konkrete Werkzeuge, was wann passt

Der richtige Ansatz hängt vom Beweistyp und dem rechtlichen Verwertungsrahmen ab.

Claude oder ChatGPT mit großem Kontextfenster, Der pragmatischste Einstieg für Büros, die gelegentlich komplexe Fälle bearbeiten. Alle Dokumente werden als Text in den Chat-Kontext geladen, der Prompt gibt die Prüfkategorien vor. Stärke: kein Setup, sofort nutzbar, hoch flexibel. Schwäche: keine persistente Fallakte, keine automatisierte Metadaten-Prüfung von Bildern, Datenschutz muss bei Cloud-Varianten aktiv verwaltet werden. Für DSGVO-konformen Einsatz: Claude über AWS Bedrock (Frankfurt) oder den Enterprise-Vertrag mit AVV.

NotebookLM, Sinnvoll für die initiale Exploration und für Büros, die erst verstehen wollen, wie KI-gestützte Dokumentenanalyse für ihre Fälle funktioniert. Dokumente werden hochgeladen, das System beantwortet Fragen auf Basis des Inhalts. Vorteil: kostenlos, einfach, quellengenau. Nachteil: keine Bildmetadaten-Analyse, keine strukturierten Prüfprotokolle, US-Datenhaltung (Google).

Vaarhaft, Spezialisiert auf die Echtheitsprüfung von Schadensfotos. Prüft Bildmetadaten auf Auffälligkeiten, erkennt KI-generierte Fälschungen und Bearbeitungsspuren. Sinnvoll als Ergänzung zur Textanalyse, wenn Fotos ein wesentlicher Beweismitteltyp sind. Berliner Startup, EU-Datenhaltung, Abrechnung per Bild. Für Büros mit regelmäßigem Bilddurchsatz bei Verdachtsfällen.

Tractable, Kfz-spezialisiert, Enterprise-orientiert. Analysiert Schadensfotos auf Reparaturkostenplausibilität und erkennt Bildmanipulationen im Kfz-Kontext. Wirtschaftlich erst ab deutlich höheren Fallvolumina (10.000+ Fälle/Jahr). Für ein mittelständisches Gutachterbüro meist überdimensioniert, eher relevant für Versicherer, die Gutachter als Teil einer größeren Prozesskette einbinden.

Custom-Workflow mit Microsoft 365 Copilot, Wenn die Dokumentenablage bereits in SharePoint liegt: Copilot kann direkt auf vorhandene Fallakten zugreifen und Dokumente vergleichen. Vorteil: bestehende IT-Infrastruktur, EU-Datenhaltung über EU Data Boundary, kein separates Tool. Nachteil: weniger spezialisiert auf Forensik als dedizierte Systeme, Konfigurationsaufwand.

Zusammenfassung: Wann welcher Ansatz

Pilot, erste Erfahrungen sammeln → NotebookLM oder Claude/ChatGPT im Einzelfall
Regelmäßige Verdachtsfälle mit Fotobeweisen → Vaarhaft (Bilder) + Claude/ChatGPT (Text)
Kfz-Großversicherer oder Kooperationspartner mit hohem Volumen → Tractable
Microsoft-365-Umgebung bereits vorhanden → M365 Copilot als Einstieg

Datenschutz und Datenhaltung

Schadensfall-Dokumente enthalten personenbezogene Daten: Name und Adresse des Geschädigten, Kennzeichen, Zeugenaussagen, Unfallhergang, Gesundheitsinformationen bei Personenschäden. Damit gelten die strengen Anforderungen der DSGVO, und für besondere Kategorien personenbezogener Daten (§ 9 DSGVO) gelten noch strengere Regeln.

Was das für die Tool-Auswahl bedeutet:

Cloudbasierte Werkzeuge wie die Standard-Version von Claude oder ChatGPT verarbeiten die eingesendeten Daten auf US-Servern. Für Schadensfall-Dokumente, die personenbezogene Daten enthalten, ist das ohne AVV und ohne EU-Datenhosting problematisch. Die Lösung ist nicht, auf KI zu verzichten, sondern die richtigen Verarbeitungswege zu wählen:

Claude über AWS Bedrock in Frankfurt, EU-Region, AVV verfügbar, Daten verlassen die EU nicht
ChatGPT über Azure OpenAI Service in der EU, gleiche Logik, Microsoft-Ökosystem
Vaarhaft, deutsches Unternehmen, EU-Datenhaltung, ideal für sensible Bilddaten
Lokale Lösung auf eigener Infrastruktur, maximale Kontrolle, erfordert Entwickler-Know-how

Vor dem ersten Produktiveinsatz: AVV mit dem jeweiligen Anbieter abschließen. Das schreibt Art. 28 DSGVO vor und ist bei allen genannten Anbietern über Self-Service-Portale oder Sales-Kontakt erhältlich.

Besondere Vorsicht bei Personenschäden: Gesundheitsdaten fallen unter Art. 9 DSGVO und dürfen nur mit ausdrücklicher Rechtsgrundlage (in der Regel: Erfüllung eines Vertrags oder berechtigtes Interesse) und besonderen technischen und organisatorischen Schutzmaßnahmen verarbeitet werden. Wenn Arztberichte oder Krankenakten Teil des Falls sind, sollte vor dem Einsatz ein Datenschutzbeauftragter konsultiert werden.

Was es kostet, realistisch gerechnet

Einmalige Einrichtungskosten

Konzeptarbeit (Falltypen, Prüfkategorien, Offenlegungsprotokoll): 3–6 Wochen intern, Beratungsanteil optional 1.000–3.000 Euro
Technische Integration (bei Custom-Workflow oder API-Anbindung): 2.000–8.000 Euro, abhängig von Systemlandschaft
Bei reinem Claude/ChatGPT-Ansatz ohne API: fast null, nur Konzept und Prompt-Entwicklung

Laufende Kosten (monatlich)

Claude Pro oder ChatGPT Plus: 20 USD/Person/Monat (für gelegentliche Einzelfälle ausreichend)
Claude Enterprise oder Azure OpenAI (DSGVO-konform): 40–100 Euro/Person/Monat je nach Volumen
Vaarhaft: volumenbasiert, auf Anfrage, typisch 0,10–0,50 Euro pro analysiertem Bild (Schätzwert; keine veröffentlichte Preisliste)
M365 Copilot: 30 Euro/Person/Monat (wenn Microsoft-365-Umgebung vorhanden)

Was du dagegenrechnen kannst Eine verhinderte Fehlregulierung von 15.000 Euro rechtfertigt die gesamten Jahreskosten des Systems, für die meisten Büros gleich mehrfach. Die Rechnung ist simpel, aber die Voraussetzung ist, dass das System tatsächlich zur Identifikation solcher Fälle beiträgt, und nicht nur Widersprüche dokumentiert, die der Gutachter ohnehin gefunden hätte.

Die ehrliche Rechnung: Wenn dein Büro drei bis fünf Betrugsverdachtsfälle pro Monat bearbeitet und das System davon monatlich einen Fall aufdeckt, der ohne es nicht eskaliert wäre, hat es sich in drei Monaten amortisiert. Ob das realistisch ist, hängt von deiner aktuellen Erkennungsrate ab, die du nur kennst, wenn du deine historischen Fälle ausgewertet hast.

Wie du den ROI tatsächlich misst Nicht durch Schätzung. Durch Vergleich: Führe für sechs Monate parallele Prüfungen durch, einmal manuell, einmal mit KI-Unterstützung. Zähle, wie oft das System Widersprüche findet, die manuell nicht aufgefallen wären. Multipliziere mit dem durchschnittlichen Schadenswert der betroffenen Fälle. Das ist dein realer Mehrwert, nicht das, was ein Anbieter verspricht.

Typische Einstiegsfehler

1. Mit dem falschen Falltyp beginnen. Nicht jeder Betrugsverdacht taugt für den ersten Test. Ein Fall mit sechs handschriftlichen Zeugenaussagen und schlecht eingescannten Dokumenten ist kein geeigneter Pilotfall. Starte mit einem Fall, der bereits gut digitalisiert ist, klaren Widersprüchen, die du bereits kennst, so kannst du prüfen, ob das System sie findet, bevor du von unbekannten Fällen abhängig bist.

2. Kein Offenlegungsprotokoll vor dem ersten Einsatz. Das ist der riskanteste Fehler, weil er still bleibt, bis das erste Gericht nachfragt. Bevor der erste KI-gestützte Bericht an einen Versicherer oder ein Gericht geht, muss ein Standard-Offenlegungs-Absatz stehen. Dieser Satz muss vor Verwendung rechtlich abgestimmt sein. Kein Tool der Welt kompensiert diesen fehlenden Schritt.

3. KI-Ergebnisse ungeprüft übernehmen. Das System meldet einen Widerspruch zwischen Zeitstempel und Unfallbericht. Das klingt eindeutig. Aber: Manchmal sind Zeitstempel falsch eingestellt, weil die Kamerauhrzeit nach einem Batteriewechsel zurückgesetzt wurde. Manchmal sind Zeugenaussagen absichtlich vage, ohne betrügerische Absicht. Das System liefert einen Hinweis, der Gutachter liefert die Bewertung. Wer diese Grenze verwischt, übernimmt Haftung für eine Entscheidung, die nicht durch fachliche Prüfung gedeckt ist.

4. Keine Rückkopplungsschleife aufgebaut. Nach sechs Monaten weißt du: Das System meldet 30 Verdachtsfälle, von denen sich 8 als echte Widersprüche bestätigen, 22 als erklärbar eingestuft werden. Das ist wertvolles Wissen, für die Kalibrierung der Prüfkategorien. Wer diese Daten nicht systematisch erfasst, verbessert das System nie.

5. Keine Trennung zwischen Beweiswürdigung und Gutachten-Erstellung. Der Beweiswürdigungs-Assistent analysiert vorhandene Beweise. Er ist kein Schreibassistent für das Gutachten. Beides zu vermischen, KI-Analyse als Basis für KI-generierte Formulierungen im Gutachten, erhöht das Haftungsrisiko und die Transparenzpflicht erheblich. Klare Trennung: KI analysiert, Gutachter bewertet und formuliert.

Was mit der Einführung wirklich passiert, und was nicht

Die Technik funktioniert schneller, als erwartet. Schon nach ein, zwei Testläufen ist klar, was das System leisten kann.

Das Herausforderungsfeld liegt woanders:

Die Erwartungskorrektur. Viele Gutachter erwarten nach den ersten Tests, dass das System ihnen die Entscheidung abnimmt. Das tut es nicht. Es zeigt, wo Fragen sind, nicht, was die Antworten sind. Wer mit dieser Erwartung startet, wird in den ersten Wochen frustriert sein. Wer es als strukturierten Prüf-Assistenten versteht, der die eigene Analyse systematisiert, wird schnell einen Rhythmus finden.

Die Kollegendiskussion. In manchen Büros gibt es Widerstand gegen den Einsatz, nicht aus technischen Gründen, sondern aus berechtigter Skepsis: „Was passiert, wenn das System einen Widerspruch meldet und wir ihn übersehen?” Die ehrliche Antwort ist: Die Verantwortung liegt weiterhin beim Gutachter, genau wie ohne System. Das System ist ein Werkzeug, kein Mitgutachter. Diese Diskussion muss offen geführt werden, bevor der erste Fall läuft.

Die Dokumentations-Mehrarbeit in der Anfangsphase. Die ersten fünf bis zehn Fälle brauchen mehr Zeit als normal, weil du gleichzeitig das System kennenlernst, Prüfprotokolle entwickelst und das Offenlegungsformat feinjustierst. Das ist Investition, nicht Verschwendung, danach läuft es.

Was konkret hilft:

Einen Pilotfall auswählen, dessen Ergebnis du bereits kennst, und schauen, ob das System zum gleichen Bild kommt
Das Offenlegungsprotokoll schriftlich festhalten, bevor der erste Bericht rausgeht
Eine interne Kalibrierungs-Session nach vier Wochen einplanen: Was meldet das System, was bestätigt sich, was nicht?
Nicht mit dem sensibelsten Fall starten

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Konzept & Rechtsklärung	Woche 1–2	Falltypen definieren, Offenlegungsprotokoll entwickeln, Rechtsberatung einholen	Offenlegungstext zu vage, Nacharbeit nötig
Tool-Auswahl & Datenschutz	Woche 2–3	AVV abschließen, DSGVO-konformen Verarbeitungsweg festlegen	Falscher Tool-Ansatz für vorhandene Dokumentenstruktur gewählt
Pilotphase (3 bekannte Fälle)	Woche 3–5	System mit bereits abgeschlossenen Fällen testen, Ergebnisse mit bekannter Realität vergleichen	System meldet keine der bekannten Widersprüche → Prompt-Überarbeitung nötig
Kalibrierung & Protokoll	Woche 5–7	Prüfkategorien feinjustieren, strukturierten Berichtsformat entwickeln	Zu viele Fehlalarme → Schwellenwerte anpassen
Produktiveinsatz	Ab Woche 7–10	Erste echte Fälle, parallele Qualitätskontrolle	Erster Einsatz vor Gericht ohne ausreichende Dokumentation des KI-Einsatzes

Wichtig: Der Produktiveinsatz vor Gericht sollte erst nach dem ersten rechtlich abgestimmten Einsatz in einer internen oder versicherergestützten Analyse erfolgen. Der erste Schritt ist nicht der komplizierteste Schritt, der erste Schritt vor Gericht ist es.

Häufige Einwände, und was dahintersteckt

„Ich erkenne Betrug sowieso, das brauche ich nicht.” Stimmt in vielen Fällen. Erfahrene Gutachter entwickeln ein Gespür, das schwer in Algorithmen zu fassen ist. Was das System bietet, ist nicht Erkennung, die über deine Expertise hinausgeht, sondern Dokumentation, die gerichtsfest und auditierbar ist. Der Unterschied zwischen „ich weiß, dass hier etwas nicht stimmt” und „ich kann zeigen, was konkret nicht stimmt, mit Quellenangabe” ist rechtlich relevant.

„Das verlangsamt meinen Prozess.” In der Einführungsphase: ja. Nach vier bis sechs Wochen Routine: nein. Die Zeitersparnis bei der eigentlichen Analyse ist real, der Setup-Aufwand am Anfang ist investierbar.

„Was, wenn das System einen echten Fall fälschlicherweise als Betrug markiert?” Das System markiert Widersprüche, nicht Betrug. Die Bewertung liegt beim Gutachter. Wenn ein explizit benannter Widerspruch eine erklärbare Ursache hat (Uhr nicht umgestellt, Protokollfehler), hält der Gutachter das fest und erklärt, warum der Widerspruch nicht auf Betrug hindeutet. Das ist forensisch sauberer als der Zustand ohne System, weil es zeigt, dass die Inkonsistenz bekannt war und geprüft wurde.

„Das ist doch nichts für mein kleines Büro.” Wenn du weniger als fünf bis zehn Betrugsverdachtsfälle pro Monat hast: Stimmt wahrscheinlich. Der Aufwand für Einführung und Protokoll lohnt sich nicht. Aber für den gelegentlichen hochkomplexen Fall kann auch ein einfacher Claude-Prompt mit allen Dokumenten kurzfristig helfen, ohne Systemeinführung, ohne formale Protokolle, als internes Analyse-Werkzeug.

Woran du merkst, dass das zu dir passt

Du bearbeitest regelmäßig Fälle, bei denen du das Gefühl hast, dass etwas nicht stimmt, aber der Nachweis schwer fällt, weil die Widersprüche über viele Dokumente verteilt sind
Du hast eine messbare Betrugsquote in deinem Portfolio: Mindestens 10 Betrugsverdachtsfälle pro Monat, um die Einführung wirtschaftlich zu rechtfertigen
Deine Fallakten sind bereits digital und strukturiert abgelegt, oder du bist bereit, das parallel zur Einführung zu normalisieren
Du oder dein Büro treten regelmäßig als gerichtliche Sachverständige auf und hast deshalb ein starkes Interesse an auditierbar dokumentierten Prüfprozessen
Du hast das Gefühl, dass du bei komplexen Fällen inhaltliche Qualität gegen Zeitdruck abwägst, und dass der Zeitdruck manchmal gewinnt

Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:

Weniger als fünf bis zehn Betrugsverdachtsfälle pro Monat. Unterhalb dieser Schwelle refinanziert sich der Einführungsaufwand (Konzept, Rechtsklärung, Protokollierung) nicht direkt. Für einzelne Ausnahmefälle bleibt ein Ad-hoc-Prompt in Claude oder ChatGPT eine realistischere Option, ohne formale Einführung.
Keine klare Vorstellung davon, was der Unterschied zwischen KI-Analyse und KI-Erstellung ist. Wer nicht erklären kann, wie KI im Gutachtenprozess eingesetzt wurde und an welchen Stellen die eigene fachliche Bewertung geleistet wurde, riskiert seine Vergütung und die Verwertbarkeit des Gutachtens vor Gericht. Die fachliche Reife in diesem Punkt muss vor dem ersten Produktiveinsatz bestehen.
Fallakten liegen nicht strukturiert digital vor. Ein System, das handschriftliche Notizen, per Fax eingehende Zeugenprotokolle und gescannte Unterlagen in schlechter Qualität analysieren soll, produziert zuverlässig schlechte Ergebnisse. Die Dokumentendigitalisierung ist Voraussetzung, nicht Begleiterscheinung.

Das kannst du heute noch tun

Öffne Claude oder ChatGPT und wähle einen abgeschlossenen Verdachtsfall aus deiner Akte, bei dem du weißt, wie er ausgegangen ist. Kopiere die wichtigsten Textstellen, Unfallbericht, Zeugenaussage, technische Einschätzung, als Text in den Chat. Dann stell die folgende Frage.

Das dauert 20 Minuten. Was du danach weißt: ob das System die Widersprüche findet, die du bereits kennst. Das ist dein Proof of Concept, bevor du irgendetwas einrichtest, bezahlst oder offenlegst.

Forensischer Konsistenz-Prompt für Beweismaterial

Du bist ein forensischer Analyse-Assistent für Sachverständige. Ich lade dir alle Dokumente zu einem Schadensfall. Deine Aufgabe: 1. Identifiziere alle Zeitangaben in allen Dokumenten und liste sie mit Quelle auf. 2. Markiere Widersprüche zwischen diesen Zeitangaben, exakt benannt mit Quelle und Textstelle. 3. Vergleiche alle Aussagen zum Unfallhergang / Schadenhergang und identifiziere inhaltliche Widersprüche. 4. Prüfe, ob in diesem Fall Positionen erwähnt werden, die in anderen Dokumenten fehlen oder anders bewertet wurden. 5. Erstelle am Ende eine strukturierte Tabelle: Widerspruch | Quelle A | Quelle B | Einschätzung (klarer Widerspruch / erklärbar / unklar). Wichtig: Ziehe keine Schlussfolgerungen darüber, ob Betrug vorliegt. Dokumentiere ausschließlich faktische Inkonsistenzen mit Quellennachweis. [HIER ALLE DOKUMENTE ALS TEXT EINFÜGEN]

Funktioniert mit Claude, ChatGPT (Enterprise oder Bedrock/Azure für DSGVO-Konformität)

Beispiel-Ausgabe

Mitarbeiter:in

Schadenmeldung: Unfall am 14.03.2025 um 16:45 Uhr. Foto-Metadaten laut Bericht: Aufnahme 14.03.2025 16:02 Uhr. Zeugenaussage: 'Ich habe das Fahrzeug gegen 17 Uhr vorgefunden.' Werkstatteinlieferung: 14.03.2025, 15:30 Uhr laut Stempel.

KI-Assistent

Zeitstrang-Analyse: | Zeitpunkt | Quelle | Angabe | |-----------|--------|--------| | 15:30 Uhr | Werkstatt-Einlieferungsstempel | Fahrzeug eingeliefert | | 16:02 Uhr | Foto-Metadaten | Aufnahme erstellt | | 16:45 Uhr | Schadenmeldung | Unfall-Zeitpunkt | | ~17:00 Uhr | Zeugenaussage | Fahrzeug vorgefunden | Identifizierte Widersprüche: **Widerspruch 1, Werkstatteinlieferung vor Unfall (klarer Widerspruch)** Quelle A: Schadenmeldung, Unfall um 16:45 Uhr Quelle B: Werkstatt-Einlieferungsstempel, 15:30 Uhr Das Fahrzeug wurde laut Werkstatt-Stempel 75 Minuten vor dem gemeldeten Unfallzeitpunkt eingeliefert. Dieser Widerspruch ist ohne weitere Erklärung nicht auflösbar. **Widerspruch 2, Fotos vor Unfall aufgenommen (klarer Widerspruch)** Quelle A: Schadenmeldung, Unfall um 16:45 Uhr Quelle B: Foto-Metadaten, Aufnahme 16:02 Uhr Schadensfotos wurden 43 Minuten vor dem gemeldeten Unfallzeitpunkt aufgenommen. Hinweis: Die identifizierten Widersprüche bedürfen fachlicher Bewertung durch den Sachverständigen. Mögliche Erklärungen (fehlerhafte Kameruhrzeit, Schreibfehler in Dokumenten) sind zu prüfen und zu dokumentieren.

Quellen & Methodik

Visionet-Fallstudie (2024): „AI-powered damage analysis, 35% faster claims investigations.” Fallstudie eines US-amerikanischen Kfz-Versicherers, der KI-gestützte Beweisanalyse einführte und 35 Prozent kürzere Untersuchungsdauern und 25 Prozent verbesserte Diskrepanzerkennung berichtete. https://www.visionet.com/case-study/ai-powered-damage-analysis-35-faster-claims-investigations
LG Darmstadt, Beschluss Az. 19 O 527/16 (bekannt geworden 2024/2025): Gerichtlicher Beschluss, der einem Sachverständigen die Vergütung vollständig versagte (0,00 Euro), weil ein KI-erstelltes Gutachten nicht als solches offengelegt wurde. Zentrales Fallrecht zur Offenlegungspflicht nach § 407a ZPO. Berichtet u. a. bei Haufe.de und LTO.de.
AI Hallucination Case Kohls v. Ellison (Minnesota 2024/2025): Bundesgericht verwarf Sachverständigenbericht wegen drei KI-halluzinierten Quellenangaben. Dokumentiert bei Esquire Deposition Solutions. https://www.esquiresolutions.com/ai-experts-report-deemed-unreliable-due-to-hallucinations-within/
GDV, Gesamtverband der Deutschen Versicherungswirtschaft: Schätzungen zu Versicherungsbetrug in Deutschland; Kfz-Haftpflicht-Betrugsquote 10–15 Prozent. Laufend aktualisierte Statistiken unter gdv.de.
§ 407a ZPO (Persönliche Gutachtenerstattung): Rechtliche Grundlage für die Offenlegungspflicht bei Drittbeteiligung, anwendbar analog auf KI-Werkzeuge. Dejure.org.
Vaarhaft-Unternehmensdarstellung (2025/2026): Produktbeschreibung zur Metadaten-Analyse und Bildmanipulationserkennung. https://www.vaarhaft.com/insurance
Bitkom-Leitfaden (2020): „Erkennung von Versicherungsbetrug mit künstlicher Intelligenz”, Grundlagentext zu KI-Einsatz in der Betrugserkennung. https://www.bitkom.org/sites/default/files/2020-08/200817_sof9_versicherungsbetrug.pdf

Du willst wissen, ob dieser Ansatz für das konkrete Fallaufkommen in deinem Büro wirtschaftlich ist, und welche Tools ohne Compliance-Risiko eingesetzt werden können? Meld dich, das klären wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Sachverständige & Gutachter vergleichen

Weitere Use Cases

Strukturierte Vor-Ort-Erfassung mit KI-App

Eine mobile KI-App führt Gutachter durch die Schadensbegutachtung: schadenstyp-gesteuerter Fragenkatalog, automatische Fotokategorisierung und direkte CRM-Übertragung, alles vor Ort, ohne Nacharbeit im Büro.

Mehr erfahren

Automatisierte Gutachtenerstellung aus CRM-Daten

KI liest strukturierte Falldaten und Fotos aus dem CRM, gleicht sie mit einer Bibliothek früherer Gutachten ab und erstellt einen vollständigen Gutachten-Entwurf, der Gutachter prüft, ergänzt und gibt frei.

Mehr erfahren

KI-Qualitätsprüfung von Gutachten vor dem Versand

KI prüft jeden Gutachten-Entwurf automatisch auf Vollständigkeit, Konsistenz und Einhaltung von Auftraggeber-Anforderungen, bevor er das Büro verlässt. Fehlende Pflichtangaben, widersprüchliche Aussagen und Formatfehler werden sofort markiert.

Mehr erfahren

Zurück zu Sachverständige & Gutachter

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

KI-Assistent zur Beweiswürdigung bei komplexen Schadensfällen

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was der Assistent konkret macht

Was Gerichte dazu sagen, Offenlegungspflicht und Verwertbarkeit

Welche Beweismittel sich eignen, und welche Grenzen gelten

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Strukturierte Vor-Ort-Erfassung mit KI-App

Automatisierte Gutachtenerstellung aus CRM-Daten

KI-Qualitätsprüfung von Gutachten vor dem Versand

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI