Klassifikationsdokumentation: KI-generierte Survey-Reports
Lloyd's, DNV und Bureau Veritas verlangen umfangreiche Berichte bei Werftaufenthalten. KI-Assistenten strukturieren Prüfergebnisse, generieren Entwürfe und reduzieren den Dokumentationsaufwand.
- Problem
- Ein Klasse-Survey produziert hunderte Einzelbefunde, die in standardisierte Report-Formate gegossen werden müssen — ein Senior-Surveyor verbringt bis zu 40% seiner Arbeitszeit mit Dokumentation statt Prüfung.
- KI-Lösung
- LLM-Assistent auf Befunddaten (strukturierte Eingaben + Freitextnotizen) generiert Survey-Report-Entwurf im Klassenformat — Surveyor korrigiert und freizeichnet, schreibt nicht mehr von Grund auf.
- Typischer Nutzen
- Dokumentationszeit je Survey um 50–70% reduzierbar. Weniger Fehler durch automatische Vollständigkeitsprüfung. Frühere Freigabe des Schiffes aus der Werft — wirtschaftlicher Vorteil für Reederei.
- Setup-Zeit
- 4–8 Monate: Template-Training + Pilotbetrieb mit Klassen-Abstimmung
- Kosteneinschätzung
- Einrichtung: 4.000–8.000 € je Klassifikationsgesellschaft; laufend: 125–250 €/Monat (Langdock) oder 50–150 €/Monat (API-basiert)
Es ist Mittwoch, 22:47 Uhr. Marcus Diedrich, leitender Besichtiger bei einer Hamburger Reederei mit sieben Bulkern, sitzt im Hotelbüro in Bremerhaven und schreibt.
Der Special Survey am MS Nordseefalke ist durch. Zwei Tage Inspektion, 340 dokumentierte Einzelbefunde, acht Inspektionsbereiche. Marcus hat Notizen auf dem Tablet, Fotos auf der Kamera, handschriftliche Ergänzungen in einem Heft und die strukturierten Prüfprotokolle aus dem digitalen Bordtagebuch. Was er jetzt braucht: einen DNV-konformen Survey-Report, der all das in das richtige Format bringt — mit den richtigen Sektionen, den richtigen Klassifizierungen, den richtigen Verweisen auf die Regelwerke, mit allen offenen Punkten als Conditions of Class markiert.
Er hat morgen früh um neun den Abschlusstermin mit DNV. Es sind noch anderthalb Tage Schreibarbeit. Die Werft wartet auf die Freigabe.
Das ist keine Ausnahme. Das ist jeder Special Survey, jeder Intermediate Survey in etwas kleinerem Maßstab, jeder Annual Survey bei komplexeren Schiffen. Die Dokumentation dauert oft länger als die Inspektion selbst.
Das echte Ausmaß des Problems
Klassifikationsgesellschaften wie DNV, Lloyd’s Register (LR) und Bureau Veritas (BV) existieren, um die Seetüchtigkeit von Schiffen unabhängig zu bestätigen. Dafür führen sie Surveys durch — jährlich, alle zweieinhalb Jahre intermediate, alle fünf Jahre als Special Survey — und verlangen von den Reedereien umfassende Berichte in streng vorgegebenen Formaten. Das ist sinnvoll und notwendig. Das Dokumentationsvolumen, das dabei entsteht, ist es nicht.
Ein typischer Special Survey eines 15.000-Tonnen-Bulkers produziert:
- 200–400 dokumentierte Einzelbefunde
- Prüfberichte zu Rumpf, Maschinenanlage, Hilfsaggregaten, Sicherheitsausrüstung, Freibord, Vermessung
- Verweise auf IACS-Unified Requirements, das jeweilige Regelwerk der Klassifikationsgesellschaft und anwendbare IMO-Konventionen
- Conditions of Class und Recommendations als formal klassifizierte Punkte
- Einen zusammenfassenden Survey Report, der bei DNV, LR oder BV eingereicht wird
Ein erfahrener Surveyor verbringt laut Erfahrungsberichten aus der Branche 2–3 volle Arbeitstage allein damit, diesen Report aus dem Rohmaterial zu erstellen — Notizen tippen, Befunde kategorisieren, Regelverweise einfügen, Vollständigkeit prüfen, Formulierungen in das Klassen-Schreibformat bringen. Das sind Stunden, die nicht für die eigentliche Inspektionsarbeit zur Verfügung stehen.
Für eine Flotte von 20 Schiffen mit je vier Surveys im Jahr (Annual + Intermediate + zwei Docking Surveys) bedeutet das nach Berechnungen des Dokumentenmanagementsystems-Anbieters agorum: rund 5.000 Stunden Verwaltungs- und Dokumentationsaufwand jährlich, bei Surveyor-Tagessätzen von 120–200 Euro/Stunde entspricht das 600.000 bis eine Million Euro — der größte Teil davon ist reine Schreibarbeit.
Hinzu kommt der Qualitätsdruck: Ein fehlendes Pflichtfeld, eine falsch klassifizierte Condition of Class oder ein veralteter Regelwerkverweis kann dazu führen, dass die Klassifikationsgesellschaft den Report zurückschickt. Nochmals ein halber Tag, nochmals Werftliegezeit.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit KI-generiertem Entwurf |
|---|---|---|
| Reporterstellungszeit je Special Survey | 2–3 Arbeitstage | 4–8 Stunden Korrektur und Freigabe |
| Fehlerquote Vollständigkeit (fehlende Pflichtfelder) | Hoch bei komplexen Surveys | Automatische Vollständigkeitsprüfung vor Freigabe |
| Wartezeit Werft auf Freigabe | 24–72 Stunden nach Inspektion | 8–16 Stunden |
| Konsistenz Formulierungen / Regelverweise | Abhängig von Erfahrung des Surveyors | Einheitlich nach trainiertem Standard |
| Aufwand Rückfragen Klassifikationsgesellschaft | 1–3 Rückläufer je Survey üblich | Reduziert durch Vollständigkeitsprüfung |
Die Vergleichswerte beruhen auf Erfahrungsberichten aus deutschen und skandinavischen Reedereien sowie auf der DNV-Fallstudie zu ihrer Machinery Maintenance Connect-Plattform, die zeigt, wie digitale Survey-Dokumentation die Durchlaufzeit drastisch reduziert.
Einschätzung auf einen Blick
Zeitersparnis — sehr hoch (5/5) Die Reduktion von 2–3 Tagen Dokumentationsarbeit auf 4–8 Stunden Revision ist das deutlichste Einspar-Signal in dieser Kategorie — und das pro Survey-Ereignis. Bei vier bis sechs Surveys pro Schiff und Jahr summiert sich das schnell auf mehrere Personenwochen, die für tatsächliche Inspektionsarbeit oder Flottenausbau verfügbar werden. Zeitersparnis ist hier der klare Spitzenwert im Vergleich zu anderen Anwendungsfällen im Schiffbau.
Kosteneinsparung — mittel (3/5) Surveyor-Tagessätze liegen bei 120–200 Euro pro Stunde, und 15–20 eingesparte Stunden je Special Survey ergeben bei großen Flotten reale fünfstellige Einsparungen pro Jahr. Dennoch bleibt dieser Wert im Mittelfeld: Das Einsparpotenzial ist real, aber kein direkter Betriebskostenhebel wie Bunkeroptimierung oder Pumpeneffizienz. Die Einsparung liegt beim Personal, nicht beim Energieverbrauch oder bei direkten Materialkosten.
Schnelle Umsetzung — mittel (3/5) 4–8 Monate für einen produktiven Pilotbetrieb sind realistisch — mit Hauptaufwand für Template-Anpassung an das jeweilige Klassenformat, Abstimmung der Befundkategorien und Validierung durch die zuständige Klassifikationsgesellschaft. Das liegt im Mittelfeld der Schiffbau-Anwendungsfälle: schneller als Predictive Maintenance oder Ballastwasser-Sensorfusion, aber aufwendiger als reine Textassistenz ohne Zulassungsdimension.
ROI-Sicherheit — mittel (3/5) Die Zeitmessung pro Survey ist transparent und direkt — jeder Report hat einen Start- und Endstempel, der Vergleich vor/nach KI-Einsatz ist einfach durchzuführen. Allerdings entstehen in der Anlaufphase oft 4–8 Wochen zusätzlicher Koordinationsaufwand mit der Klassifikationsgesellschaft (Template-Freigabe, Musterdurchsichten, ggf. formale Anfragen), der die Sparrechnung der ersten 6 Monate spürbar drückt. Der ROI-Nachweis kommt — aber nicht sofort.
Skalierbarkeit — hoch (4/5) Ein einmal trainiertes und genehmigtes Template für DNV oder Lloyd’s Register kann von allen Surveyor-Teams der Reederei genutzt werden. Neue Surveyor werden schneller produktiv; wächst die Flotte, skaliert das System ohne proportionalen Mehraufwand. Einschränkung: Jede Klassifikationsgesellschaft braucht ein eigenes Template — wer mit DNV und LR arbeitet, hat zwei parallele Systeme zu pflegen.
Richtwerte — stark abhängig von Flottengröße, Klassifikationsgesellschaft und Surveytypen.
Was das System konkret macht
Der technische Ansatz kombiniert zwei Ebenen: strukturierte Dateneingabe und Generative KI zur Texterstellung.
Ebene 1: Strukturierte Befund-Erfassung während der Inspektion
Der Surveyor erfasst Befunde während der Inspektion in einem strukturierten digitalen Formular — nicht als Freitext, sondern mit vordefinierten Kategorien: Inspektionsbereich (Rumpf/Maschinenraum/Feuerlöschanlagen etc.), Befundtyp (Observation/Condition of Class/Recommendation), Referenz-Regelwerk, Prüfmethode, Messergebnis. Photos werden direkt zugeordnet. Das dauert nicht länger als bisherige Tablet-Notizen, liefert aber strukturierten Input statt unstrukturierter Feldnotizen.
Ebene 2: KI-Entwurf auf Basis der Befunddaten
Ein LLM, das auf Klassenformaten trainiert oder entsprechend angeprompted wurde, verarbeitet die strukturierten Befunddaten und generiert einen vollständigen Survey-Report-Entwurf im Format der Klassifikationsgesellschaft: Sektionen, Formulierungsstandards, Regelverweise, korrekte Klassifizierung der offenen Punkte. Der Report liegt typischerweise innerhalb von 20–40 Minuten nach Abschluss der Inspektion als Entwurf vor.
Was der Surveyor dann noch macht
Der Surveyor prüft den Entwurf, korrigiert Missverständnisse oder fehlinterpretierte Notizen, ergänzt Kontext, der nur mündlich bekannt ist, und zeichnet frei. Das ist kein Nicken-und-Fertig: Technische Befunde mit Sicherheitsrelevanz erfordern und verdienen genaue Prüfung. Der Unterschied ist der Startpunkt — man korrigiert einen strukturierten Entwurf statt ein leeres Dokument zu befüllen.
Das Prinzip ist vergleichbar mit der KI-gestützten Survey-Vorbereitung — dort geht es um die Compliance-Prüfung vor dem Survey, hier um die Dokumentation nach dem Survey. Beide Ansätze ergänzen sich.
Die Haftungskette: Wer zeichnet nach, wer haftet?
Dieser Punkt ist in der maritimen Klassifikation nicht verhandelbar und verdient eine explizite Behandlung.
Ein Survey-Report, der bei DNV, Lloyd’s Register oder Bureau Veritas eingereicht wird, ist ein rechtliches Dokument. Er bildet die Grundlage für die Verlängerung des Klasseattests, und das Klassezeugnis ist Voraussetzung für die Betriebserlaubnis des Schiffes, für Charterverträge und für die Transportversicherung. Fehler in diesem Dokument haben direkte rechtliche und wirtschaftliche Konsequenzen.
Die Haftungskette sieht so aus:
Der Surveyor zeichnet frei — und übernimmt damit die vollständige Verantwortung für den Inhalt. Es ist rechtlich nicht möglich, die Verantwortung für einen Survey-Report auf ein KI-System zu übertragen. Der Surveyor muss jeden Befund, jede Klassifizierung, jeden Regelwerkverweis inhaltlich verstanden und verifiziert haben, bevor er unterschreibt. Das KI-System generiert einen Entwurf — keinen fertigen Report.
Klassifikationsgesellschaften akzeptieren KI-Assistenz, nicht KI-Entscheidungen. DNV und Bureau Veritas haben begonnen, digitale Assistenz-Tools in ihre Survey-Workflows zu integrieren (DNV Machinery Maintenance Connect, BV Augmented Surveyor 3D). In keinem dieser Ansätze ersetzt die KI die Freigabe durch einen qualifizierten Surveyor. Das ist kein Hemmnis — es ist eine sinnvolle Grenze.
Konsequenz für die Implementierung: Das KI-System darf ausschließlich als Entwurfs- und Strukturierungswerkzeug positioniert werden. Jede interne Kommunikation, jede Schulung, jeder Workflow muss diese Grenze explizit benennen. Systeme, die den Surveyor dazu verleiten, Entwürfe ungeprüft freizuzeichnen, sind keine Hilfe — sie schaffen Haftungsrisiken.
Empfehlung: Vor dem Produktivbetrieb die Nutzungsform mit dem Surveyor-Team schriftlich klären und die Klassifikationsgesellschaft formell informieren — nicht wegen einer Genehmigungspflicht für das Tool selbst, sondern um Transparenz über den Prozess herzustellen und eventuelle Formatanforderungen frühzeitig zu kennen.
Konkrete Werkzeuge — was wann passt
Es gibt keinen spezialisierten “Maritimer Survey Report Generator” auf dem Markt — noch nicht. Der Stand 2025/2026: Die Reedereien, die diesen Ansatz verfolgen, bauen eigene Lösungen auf Basis generischer LLM-Plattformen. Das hat Vor- und Nachteile (Flexibilität vs. Aufwand), aber es bedeutet auch: du wählst heute das Fundament.
Langdock — EU-konform, schneller Einstieg, Assistenten-Builder Berliner Enterprise-KI-Plattform mit EU-Hosting auf Azure Frankfurt. Du baust einen Survey-Report-Assistenten mit einem strukturierten System-Prompt auf Basis deiner Klassenformate. DSGVO-konform, AVV auf Knopfdruck, kein IT-Projekt. Kosten: 25 Euro/Nutzer/Monat. Besonders geeignet für Reedereien, die mit deutschen oder skandinavischen Klassifikationsgesellschaften arbeiten und keine eigene IT-Infrastruktur für KI aufbauen wollen. Einschränkung: Die Schreibqualität hängt stark von der Prompt-Qualität ab — Template-Pflege ist dein Job.
Claude via AWS Bedrock (Frankfurt) — Stärke für strukturierte Langtexte Anthropics Claude-Modelle gelten als besonders stark in strukturierter Textgenerierung auf Basis langer Input-Dokumente — genau das, was Survey Reports brauchen. Über AWS Bedrock in Frankfurt ist Claude DSGVO-konform einsetzbar. Erfordert Entwicklerunterstützung, liefert aber die beste Textqualität für technisch präzise Reports. Kosten: API-basiert, ca. 10–25 Euro je 100 generierte Reports, abhängig vom Umfang.
Azure OpenAI Service — für strukturierte Workflow-Integration GPT-4o in der Azure-EU-Region (West Europe, Netherlands) für Reedereien, die bereits im Azure-Ökosystem arbeiten. Ermöglicht die Integration in bestehende Fleet-Management-Systeme, saubere AVV, Private Endpoints für KRITIS-ähnliche Anforderungen. Developer-Level: braucht IT-Ressourcen für Anbindung und Pflege.
Microsoft 365 Copilot — wenn ihr sowieso in der M365-Welt lebt Wenn eure Surveyor-Berichte in Word entstehen und eure interne Kommunikation in Teams läuft: Copilot kann direkt in Word geöffnete Report-Templates mit generierten Inhalten befüllen, auf Basis von hochgeladenen Befund-Notizen. Keine neue Plattform, keine Umschulung. Qualität: gut für Standardberichte, Grenzen bei sehr strukturierten technischen Formaten. Kosten: 30 Euro/Nutzer/Monat zusätzlich zur M365-Lizenz.
NotebookLM — für die Recherche-Phase, nicht für den Report Nicht direkt für Report-Generierung geeignet, aber wertvoll in der Vorbereitung: Lade aktuelle IACS-Dokumente, das DNV-Regelwerk und eure internen Prüfstandards hoch und befrage sie gezielt nach aktuellen Anforderungen für bestimmte Inspektionsbereiche. Kostenlos, kein Setup. Wichtig: US-Hosting, nicht für vertrauliche Befunddaten geeignet.
Wann welcher Ansatz
- Schneller Einstieg, DSGVO-konform, keine eigene IT → Langdock
- Beste Textqualität für technisch präzise Reports → Claude via AWS Bedrock
- Azure-Infrastruktur vorhanden, Workflow-Integration gewünscht → Azure OpenAI Service
- Bereits M365-Nutzer, minimale neue Tools → Microsoft 365 Copilot
- Regelwerk-Recherche während der Inspektion → NotebookLM
Datenschutz und Datenhaltung
Survey-Reports enthalten technische Schiffsdaten und können je nach Kontext als Geschäftsgeheimnisse eingestuft werden — keine Personendaten im klassischen DSGVO-Sinne, aber sensible Betriebsdaten, die nicht über ungesicherte US-Cloud-Dienste verarbeitet werden sollten.
Die relevanten DSGVO-Punkte:
Personenbezogene Daten im Survey-Kontext. Ein Survey-Report enthält selten direkte Personenbezüge — außer wenn Besatzungsmitglieder namentlich als Zeugen von Befunden dokumentiert werden oder wenn Subunternehmer-Informationen Teil des Reports sind. In diesen Fällen gilt DSGVO-Pflicht uneingeschränkt.
Auftragsverarbeitungsvertrag (AVV). Jede Cloud-Plattform, die technische Schiffsdaten verarbeitet, braucht einen AVV nach Art. 28 DSGVO. Langdock, Azure OpenAI Service und AWS Bedrock stellen diese bereit; die Consumer-Varianten von ChatGPT oder claude.ai tun das nicht standardmäßig. Für professionellen Einsatz ausschließlich Business- oder Enterprise-Pläne mit AVV nutzen.
EU-Datenhaltung. Für Reedereien unter deutscher Flagge oder mit EU-Hauptsitz empfehlen wir EU-Hosting: Langdock (Azure Frankfurt), Azure OpenAI Service West Europe (Niederlande), AWS Bedrock Frankfurt. NotebookLM und die Consumer-Oberflächen von ChatGPT sind US-gehostet und für sensible Betriebsdaten nicht geeignet.
Was die Klassifikationsgesellschaften selbst anbieten. DNV und Bureau Veritas haben eigene digitale Plattformen (DNV My DNV, BV VeriSTAR). Wenn ihr bereits Daten in diesen Plattformen haltet, ist die naheliegendste Frage: Bieten diese Plattformen schon KI-Assistenz für die Report-Erstellung an? Stand 2026: begrenzt. DNV Machinery Maintenance Connect beschleunigt die Datenaggregation, ersetzt aber nicht die Texterstellung. BV Augmented Surveyor 3D optimiert die Inspektion selbst, nicht den abschließenden Report. Die Lücke ist real.
Was es kostet — realistisch gerechnet
Einmalige Aufbaukosten
- Template-Erstellung: Das Klassenformat je Klassifikationsgesellschaft in einen System-Prompt und eine strukturierte Eingabemaske übersetzen. Aufwand: 40–80 Stunden, typischerweise von einem internen Surveyor mit KI-Erfahrung oder einem externen Berater durchgeführt. Bei 100 Euro/Stunde: 4.000–8.000 Euro je Klassifikationsgesellschaft.
- Pilotphase mit 2–3 Surveys zur Validierung: ca. 2 Wochen Mehraufwand durch parallele Erstellung (alt + KI) für Qualitätssicherung. Zusätzlich 20–30 Stunden Surveyor-Zeit.
- Abstimmung mit Klassifikationsgesellschaft: In der Regel kein formaler Genehmigungsprozess, aber 1–2 Gespräche zur Klärung von Formaterwartungen sind zu empfehlen. Kostenfrei, aber zeitaufwendig.
Laufende Kosten (monatlich)
- Langdock Business: 25 Euro/Nutzer/Monat für 5–10 Surveyor → 125–250 Euro/Monat
- Azure OpenAI Service oder AWS Bedrock: token-basiert, bei 50–100 Reports/Monat ca. 50–150 Euro/Monat
- Microsoft 365 Copilot: 30 Euro/Nutzer/Monat zusätzlich zu bestehender M365-Lizenz
Was du dagegen rechnen kannst Ein Surveyor mit 150 Euro/Stunde Gesamtkosten (Gehalt + Overhead), der 15 Stunden pro Special Survey einspart: 2.250 Euro je Survey. Bei 20 Special Surveys pro Jahr: 45.000 Euro Einsparung jährlich — bei konservativ gerechneten 50% des theoretischen Werts (Anlaufzeit, Korrekturbedarf, nicht alle Surveys gleich komplex) sind das noch 22.000 Euro. Die Einrichtungskosten amortisieren sich bei einem mittelgroßen Betrieb im ersten Jahr.
Wie du den Nutzen tatsächlich misst Zeitstempel per Survey (Beginn Dokumentationsarbeit bis Report-Freigabe), vor und nach KI-Einführung. Das funktioniert als einfache Stoppuhr-Messung über drei bis fünf Surveys vor der Einführung und drei bis fünf danach. Kein aufwendiges Analytics-System nötig.
Typische Einstiegsfehler
1. Mit dem vollständigsten Format starten wollen. Der Reflex: Den Survey-Report-Assistenten erst produktiv einsetzen, wenn er alle 14 Sektionen des Special-Survey-Formats beherrscht. Das führt dazu, dass das System nie fertig ist. Besser: Mit einem Surveytyp und einem Rumpf-Inspektionsabschnitt starten — erst wenn der dort zuverlässig läuft, weitere Sektionen ergänzen. Drei Monate reiner Teilbetrieb sind wertvoller als acht Monate Vollkonzept-Entwicklung.
2. Den KI-Entwurf nicht als Entwurf behandeln. Das gefährlichste Muster: Surveyor sehen den generierten Report, stellen fest, dass er “gut genug” wirkt, und zeichnen mit minimaler Prüfung frei. Das funktioniert — bis es nicht mehr funktioniert. LLMs können technische Spezifikationen halluzinieren oder Regelverweise aus veralteten Normausgaben ziehen. Das ist bei einem Wartungsplan ärgerlich, bei einem Survey-Report für eine Klassifikationsgesellschaft potenziell haftungsrelevant. Faustregel: Jeder Befund, der als Condition of Class oder Recommendation klassifiziert wird, muss manuell gegen die Originalnotizen verifiziert werden. Immer.
3. Das Template nicht mit der aktuellen Regelwerksversion synchron halten. IACS-Unified Requirements und die Klassenregeln der Gesellschaften werden regelmäßig aktualisiert — DNV typischerweise im Jahresrhythmus. Ein LLM-Prompt, der auf eine veraltete Regelwerksversion trainiert ist, generiert stilistisch korrekte, inhaltlich aber überholte Verweise. Lösung: Bei jeder Regelwerksaktualisierung der Klassifikationsgesellschaft prüfen, ob der System-Prompt und die Template-Struktur aktualisiert werden müssen. Diese Verantwortung muss einer konkreten Person zugewiesen sein — keine IT-Aufgabe, sondern eine fachliche.
4. Kein Feedback-Loop vom Surveyor zur System-Verbesserung. Nach der Einführung: Wer führt eigentlich Buch über die Korrekturen, die Surveyor am generierten Entwurf vornehmen? Welche Sektionen werden am häufigsten nachgebessert? Welche Formulierungen werden immer wieder geändert? Ohne systematische Auswertung dieser Korrekturen lernt das System nicht weiter — und dieselben Fehler tauchen in jedem Report wieder auf. Mindestens quartalsweise: Die häufigsten Korrekturen durchsehen, den System-Prompt entsprechend anpassen.
Was mit der Einführung wirklich passiert — und was nicht
Die technische Einrichtung ist in diesem Fall tatsächlich nicht das Hauptproblem. Das Hauptproblem ist das professionelle Selbstverständnis von Surveyorn.
Der erfahrene Surveyor als erste Hürde. Ein Senior-Surveyor mit 20 Jahren Klassifikationserfahrung hat eine Arbeitsroutine entwickelt, die für ihn funktioniert. Das Schreiben des Reports ist für ihn nicht nur Dokumentation, sondern auch der Moment, in dem er die Befunde gedanklich abschließt, Inkonsistenzen bemerkt und abwägt, ob eine Condition of Class wirklich notwendig ist oder eine Recommendation reicht. Diese Reflexionsarbeit muss in einem KI-gestützten Workflow explizit erhalten bleiben — sie darf nicht der Effizienz geopfert werden.
Was konkret hilft: Den erfahrensten Surveyor als System-Builder einbinden, nicht als Nutzer. Lass ihn das Template entwerfen und die ersten Entwürfe im Paralleltest bewerten. Wer das System mitentwickelt hat, vertraut ihm — und korrigiert es, statt es zu umgehen.
Die “KI-macht-Fehler”-Erfahrung in den ersten Wochen. In der Anlaufphase produziert das System Entwürfe mit Fehlern — falsch kategorisierte Befunde, veraltete Regelverweise, fehlende Sektionen. Das ist normal und lösbar. Was nicht normal sein darf: dass diese Erfahrung als generelles Urteil über den Ansatz gewertet wird. Kommuniziere vorab klar: Die ersten fünf bis acht Reports sind Testläufe, keine Produktivbetriebe. Fehler werden systematisch erfasst und führen zu System-Verbesserungen.
Was typischerweise nicht passiert: Die reibungslose Einführung, bei der alle Surveyor das Tool sofort begeistert annehmen. Das passiert in keiner professionellen Umgebung, in der Qualitätsstandards hoch sind. Plane sechs Monate für eine vollständige Adoption ein.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Template-Erstellung & System-Prompt | Wochen 1–4 | Klassenformat analysieren, Befundstruktur definieren, System-Prompt erstellen, Testdaten vorbereiten | Template deckt nicht alle Sonderfälle ab — es entsteht kein Ausnahmehandling für atypische Befunde |
| Paralleltest mit echten Surveys | Wochen 5–12 | KI-Entwurf und manueller Report parallel erstellen, Abweichungen dokumentieren, System-Prompt iterativ verbessern | Parallelaufwand demotiviert Surveyor — frühes Feedback einfordern, nicht nur am Ende |
| Abstimmung Klassifikationsgesellschaft | Wochen 8–16 (parallel) | Formale Mitteilung an DNV/LR/BV über KI-Assistenz, Format-Fragen klären, ggf. Musterdurchsicht | Klassifikationsgesellschaft hat spezifische Format-Anforderungen, die im Prompt fehlen — Korrekturschleife nötig |
| Pilotproduktivbetrieb | Wochen 16–24 | Erste reale Reports ausschließlich mit KI-Unterstützung erstellt, Surveyor zeichnet nach Prüfung frei | Erste Freigabe-Verzögerung durch Rückfrage der Klasse — ruhig bleiben, System anpassen |
| Vollproduktivbetrieb | Ab Monat 6 | Alle Surveyor nutzen das System für alle Surveys, regelmäßige Template-Überprüfungen | Fluktuation im Surveyor-Team — Onboarding für neue Personen muss strukturiert sein |
Häufige Einwände — und was dahintersteckt
„Die Klassifikationsgesellschaft wird das nicht akzeptieren.” Das ist der häufigste Einwand — und er ist teilweise berechtigt. Klassifikationsgesellschaften haben Formatanforderungen, und ein Report, der erkennbar aus einer KI stammt und nicht mit diesen Anforderungen übereinstimmt, wird zurückgeschickt. Das ist aber kein Argument gegen KI-Assistenz, sondern ein Argument für sorgfältige Template-Arbeit. DNV, Bureau Veritas und Lloyd’s Register entwickeln selbst digitale Survey-Plattformen und KI-Assistenz-Tools — sie lehnen das Prinzip nicht ab. Was sie verlangen: Qualität und den freizeichnenden Surveyor.
„Wir haben zu wenige Surveys, um den Aufwand zu rechtfertigen.” Ein realer Ausschlussgrund für kleinere Betriebe (mehr dazu im nächsten Abschnitt). Für Reedereien mit unter drei Special Surveys pro Jahr ist der Aufbauaufwand nicht amortisierbar. Für Flotten ab fünf bis sechs Schiffen — also 15–20 Surveys unterschiedlicher Art pro Jahr — ist die Rechnung klar.
„Unsere Surveyor werden das nie benutzen.” Wahrscheinlich nicht von alleine — wenn man es ihnen einfach auf den Tisch legt. Wahrscheinlich schon — wenn sie in die Template-Entwicklung eingebunden werden und die ersten Entwürfe erkennbar von ihrem eigenen Fachwissen geprägt sind. Der Unterschied zwischen “hier ist ein KI-Tool” und “hier ist ein Tool, das ihr selbst gebaut habt” ist psychologisch erheblich.
Woran du merkst, dass das zu dir passt
Gute Zeichen:
- Deine Reederei hat fünf oder mehr Schiffe mit jeweils mehreren Survey-Ereignissen pro Jahr
- Die Dokumentationserstellung dauert bei euch regelmäßig zwei oder mehr Werktage je Survey
- Ihr arbeitet mit einer oder zwei Klassifikationsgesellschaften, nicht mit fünf verschiedenen
- Eure Surveyor erstellen Reports heute schon digital (Tablet/Laptop), nicht handschriftlich
- Ihr habt eine feste Person, die für das interne Qualitätsmanagement der Survey-Dokumentation zuständig ist
Drei harte Ausschlusskriterien — wann es sich (noch) nicht lohnt:
-
Weniger als drei Special Surveys pro Jahr. Der Aufbau eines funktionsfähigen Systems — Template-Erstellung, Paralleltest, Abstimmung mit der Klasse — kostet 4.000–8.000 Euro und 40–80 Stunden interner Zeit. Wer das auf einen oder zwei Surveys im Jahr amortisieren muss, wird keine positive ROI-Rechnung hinbekommen. Für Reeder mit ein bis zwei Schiffen in der Klasse lohnt sich ein externer Dokumentationsassistent (ein erfahrener Büroschreiber) mehr als ein KI-System.
-
Survey-Dokumentation erfolgt noch auf Papier oder in unstrukturierten Freitextdokumenten. Ein LLM-Assistent braucht strukturierten Input — entweder strukturierte digitale Befund-Erfassung oder zumindest halbwegs konsistente Textnotizen nach einem Schema. Wer heute Befunde als handschriftliche Listen oder formlose E-Mails erfasst, muss zuerst die Erfassungsebene digitalisieren und strukturieren. Das ist ein eigenes Projekt, das dem KI-Schritt vorausgeht.
-
Keine Person, die das System kontinuierlich pflegt. Klassenregeln ändern sich. IACS-Unified Requirements werden aktualisiert. Das System-Prompt, das heute korrekte Regelverweise generiert, ist in 18 Monaten teilweise veraltet. Wenn niemand die Verantwortung dafür hat, diese Aktualisierungen in das System einzupflegen, produziert ihr nach zwei Jahren Survey-Reports mit überholten Normverweisen — die der Surveyor merken sollte, aber vielleicht nicht immer merkt. Ohne eine verantwortliche Person mit Budget-Slot für die Systempflege ist das Ergebnis schlechter als kein System.
Das kannst du heute noch tun
Öffne Langdock (7 Tage kostenlos, keine Kreditkarte) oder Claude in einem kostenlosen Plan und teste die Report-Logik mit einem alten Survey-Bericht.
Nimm einen abgeschlossenen Survey-Report aus den letzten 12 Monaten und die entsprechenden Rohnotizen (Tablet-Protokoll, Checklisten). Füge beides in den folgenden Prompt ein — als ersten Machbarkeitstest ohne Template-Arbeit:
Mitarbeiter:in
KI-Assistent
Schau dann, was stimmt und was nicht — das ist dein erstes ehrliches Feedback über den Reife-Stand dieses Ansatzes für eure Situation. Wenn 70–80% des Entwurfs korrekt und nützlich sind, ist der Ansatz für euch tragfähig. Wenn er zu viele Lücken hat, zeigt das, wo Templates und Prompt-Arbeit fehlen.
Quellen & Methodik
-
DNV, „A fleet in a day: MMC unlocks new efficiencies in machinery maintenance and survey” (Maritime Impact, 2023): Fallstudie, in der DNV mit dem Machinery Maintenance Connect-System die Surveys von 49 Schiffen für BW Offshore in rund vier Stunden abschloss — gegenüber 49 separaten Bordbesuchen. Quelle: dnv.com
-
Bureau Veritas, Augmented Surveyor 3D (AGS 3D) Launch (2024): Bureau Veritas hat eine KI-gestützte Inspektionsplattform auf Basis von LiDAR, KI-Korrosionsdetektion und 3D-Modellierung für Schiffs- und Offshore-Inspektionen eingeführt. Zeigt den Branchentrend zu KI-Assistenz in der Klassenarbeit. Quelle: marine-offshore.bureauveritas.com
-
agorum GmbH, „Digitalisierungsmöglichkeiten mit KI für Schiffbau” (2025): Dokumentenmanagementsystem-Anbieter publiziert Kosten-Hochrechnung für Zertifikatsverwaltung im Schiffbau: 500 Zertifikate × 20 Schiffe × 20 Min = 5.000 Std/Jahr ≈ 200.000 Euro. Quelle: agorum.com
-
SafeMTS-Programm, US Bureau of Transportation Statistics (März 2026): LLM-Pilotprojekt im kommerziellen Schiffsverkehr zur automatisierten Analyse von Near-Miss-Berichten. Automatisierte Detektion erhöhte Fallaufnahme um 90%, Zeitersparnis für kritische Fallidentifikation 75%. Zeigt Reife von LLMs für strukturierte maritime Dokumentenanalyse. Quelle: bts.gov/newsroom
-
Splash247, „Most maritime AI failures will be data failures, not algorithmic” (2024): Branchenanalyse, die zeigt: Sensordrift und Datenveralterung — nicht Algorithmenversagen — sind die Hauptursache für KI-Fehler in der Schifffahrt. Direkt übertragbar auf Survey-Report-Generierung: Templates und Regelwerksverweise müssen aktiv gepflegt werden. Quelle: splash247.com
-
Preisangaben Langdock, Azure OpenAI Service, Microsoft 365 Copilot: Veröffentlichte Anbieter-Tarife, Stand April–Mai 2026.
-
Surveyor-Tagessätze und Dokumentationsaufwand: Erfahrungswerte aus deutschen und skandinavischen Reedereikreisen sowie Einschätzungen aus Fachgesprächen; keine repräsentative Studie, aber konsistente Beobachtungen aus dem Umfeld norddeutscher Werften.
Du willst wissen, ob dieser Ansatz für eure Flottengröße und eure Klassifikationsgesellschaft konkret umsetzbar ist? Meld dich — das klären wir in einem kurzen Gespräch ohne Verpflichtung.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Rumpfplatten-Umformung: Springback-Korrektur per ML
Stahlplatten federn nach dem Kaltbiegen zurück und weichen vom Soll-Radius ab. ML-Regressionsmodelle lernen aus historischen Pressdaten, wie stark überpresst werden muss — und ersetzen das schwer übertragbare Erfahrungswissen erfahrener Kesselschmiede.
Mehr erfahrenKI-gestützte technische Dokumentation für Schiffskomponenten
Technische Redakteure in Werften und Zulieferern erstellen Betriebsanleitungen und Wartungshandbücher für Schiffskomponenten oft manuell aus Konstruktionsdaten. KI halbiert den Erstellungsaufwand und erhöht Konsistenz.
Mehr erfahrenKlassifikations-Compliance: KI-Unterstützung für Survey-Vorbereitung und Zertifikatspflege
Werften und Reedereien verwalten pro Schiff Hunderte von Klassifikationszertifikaten mit unterschiedlichen Fristen und Prüfanforderungen. KI reduziert Übersehrisiken, beschleunigt Survey-Vorbereitung und hält Nachweisakte konsistent.
Mehr erfahren