Zum Inhalt springen
Schiffbau & Maritime klassifikationsgesellschaftdnvlloyds

Klassifikationsdokumentation: KI-generierte Survey-Reports

Lloyd's, DNV und Bureau Veritas verlangen umfangreiche Berichte bei Werftaufenthalten. KI-Assistenten strukturieren Prüfergebnisse, generieren Entwürfe und reduzieren den Dokumentationsaufwand.

⚡ Auf einen Blick
Problem
Ein Klasse-Survey produziert hunderte Einzelbefunde, die in standardisierte Report-Formate gegossen werden müssen — ein Senior-Surveyor verbringt bis zu 40% seiner Arbeitszeit mit Dokumentation statt Prüfung.
KI-Lösung
LLM-Assistent auf Befunddaten (strukturierte Eingaben + Freitextnotizen) generiert Survey-Report-Entwurf im Klassenformat — Surveyor korrigiert und freizeichnet, schreibt nicht mehr von Grund auf.
Typischer Nutzen
Dokumentationszeit je Survey um 50–70% reduzierbar. Weniger Fehler durch automatische Vollständigkeitsprüfung. Frühere Freigabe des Schiffes aus der Werft — wirtschaftlicher Vorteil für Reederei.
Setup-Zeit
4–8 Monate: Template-Training + Pilotbetrieb mit Klassen-Abstimmung
Kosteneinschätzung
Einrichtung: 4.000–8.000 € je Klassifikationsgesellschaft; laufend: 125–250 €/Monat (Langdock) oder 50–150 €/Monat (API-basiert)
LLM-Entwurf aus BefundnotizenStrukturierter Eingabe-WorkflowKlassen-Template-Fine-Tuning + PDF-Export
Worum geht's?

Es ist Mittwoch, 22:47 Uhr. Marcus Diedrich, leitender Besichtiger bei einer Hamburger Reederei mit sieben Bulkern, sitzt im Hotelbüro in Bremerhaven und schreibt.

Der Special Survey am MS Nordseefalke ist durch. Zwei Tage Inspektion, 340 dokumentierte Einzelbefunde, acht Inspektionsbereiche. Marcus hat Notizen auf dem Tablet, Fotos auf der Kamera, handschriftliche Ergänzungen in einem Heft und die strukturierten Prüfprotokolle aus dem digitalen Bordtagebuch. Was er jetzt braucht: einen DNV-konformen Survey-Report, der all das in das richtige Format bringt — mit den richtigen Sektionen, den richtigen Klassifizierungen, den richtigen Verweisen auf die Regelwerke, mit allen offenen Punkten als Conditions of Class markiert.

Er hat morgen früh um neun den Abschlusstermin mit DNV. Es sind noch anderthalb Tage Schreibarbeit. Die Werft wartet auf die Freigabe.

Das ist keine Ausnahme. Das ist jeder Special Survey, jeder Intermediate Survey in etwas kleinerem Maßstab, jeder Annual Survey bei komplexeren Schiffen. Die Dokumentation dauert oft länger als die Inspektion selbst.

Das echte Ausmaß des Problems

Klassifikationsgesellschaften wie DNV, Lloyd’s Register (LR) und Bureau Veritas (BV) existieren, um die Seetüchtigkeit von Schiffen unabhängig zu bestätigen. Dafür führen sie Surveys durch — jährlich, alle zweieinhalb Jahre intermediate, alle fünf Jahre als Special Survey — und verlangen von den Reedereien umfassende Berichte in streng vorgegebenen Formaten. Das ist sinnvoll und notwendig. Das Dokumentationsvolumen, das dabei entsteht, ist es nicht.

Ein typischer Special Survey eines 15.000-Tonnen-Bulkers produziert:

  • 200–400 dokumentierte Einzelbefunde
  • Prüfberichte zu Rumpf, Maschinenanlage, Hilfsaggregaten, Sicherheitsausrüstung, Freibord, Vermessung
  • Verweise auf IACS-Unified Requirements, das jeweilige Regelwerk der Klassifikationsgesellschaft und anwendbare IMO-Konventionen
  • Conditions of Class und Recommendations als formal klassifizierte Punkte
  • Einen zusammenfassenden Survey Report, der bei DNV, LR oder BV eingereicht wird

Ein erfahrener Surveyor verbringt laut Erfahrungsberichten aus der Branche 2–3 volle Arbeitstage allein damit, diesen Report aus dem Rohmaterial zu erstellen — Notizen tippen, Befunde kategorisieren, Regelverweise einfügen, Vollständigkeit prüfen, Formulierungen in das Klassen-Schreibformat bringen. Das sind Stunden, die nicht für die eigentliche Inspektionsarbeit zur Verfügung stehen.

Für eine Flotte von 20 Schiffen mit je vier Surveys im Jahr (Annual + Intermediate + zwei Docking Surveys) bedeutet das nach Berechnungen des Dokumentenmanagementsystems-Anbieters agorum: rund 5.000 Stunden Verwaltungs- und Dokumentationsaufwand jährlich, bei Surveyor-Tagessätzen von 120–200 Euro/Stunde entspricht das 600.000 bis eine Million Euro — der größte Teil davon ist reine Schreibarbeit.

Hinzu kommt der Qualitätsdruck: Ein fehlendes Pflichtfeld, eine falsch klassifizierte Condition of Class oder ein veralteter Regelwerkverweis kann dazu führen, dass die Klassifikationsgesellschaft den Report zurückschickt. Nochmals ein halber Tag, nochmals Werftliegezeit.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit KI-generiertem Entwurf
Reporterstellungszeit je Special Survey2–3 Arbeitstage4–8 Stunden Korrektur und Freigabe
Fehlerquote Vollständigkeit (fehlende Pflichtfelder)Hoch bei komplexen SurveysAutomatische Vollständigkeitsprüfung vor Freigabe
Wartezeit Werft auf Freigabe24–72 Stunden nach Inspektion8–16 Stunden
Konsistenz Formulierungen / RegelverweiseAbhängig von Erfahrung des SurveyorsEinheitlich nach trainiertem Standard
Aufwand Rückfragen Klassifikationsgesellschaft1–3 Rückläufer je Survey üblichReduziert durch Vollständigkeitsprüfung

Die Vergleichswerte beruhen auf Erfahrungsberichten aus deutschen und skandinavischen Reedereien sowie auf der DNV-Fallstudie zu ihrer Machinery Maintenance Connect-Plattform, die zeigt, wie digitale Survey-Dokumentation die Durchlaufzeit drastisch reduziert.

Einschätzung auf einen Blick

Zeitersparnis — sehr hoch (5/5) Die Reduktion von 2–3 Tagen Dokumentationsarbeit auf 4–8 Stunden Revision ist das deutlichste Einspar-Signal in dieser Kategorie — und das pro Survey-Ereignis. Bei vier bis sechs Surveys pro Schiff und Jahr summiert sich das schnell auf mehrere Personenwochen, die für tatsächliche Inspektionsarbeit oder Flottenausbau verfügbar werden. Zeitersparnis ist hier der klare Spitzenwert im Vergleich zu anderen Anwendungsfällen im Schiffbau.

Kosteneinsparung — mittel (3/5) Surveyor-Tagessätze liegen bei 120–200 Euro pro Stunde, und 15–20 eingesparte Stunden je Special Survey ergeben bei großen Flotten reale fünfstellige Einsparungen pro Jahr. Dennoch bleibt dieser Wert im Mittelfeld: Das Einsparpotenzial ist real, aber kein direkter Betriebskostenhebel wie Bunkeroptimierung oder Pumpeneffizienz. Die Einsparung liegt beim Personal, nicht beim Energieverbrauch oder bei direkten Materialkosten.

Schnelle Umsetzung — mittel (3/5) 4–8 Monate für einen produktiven Pilotbetrieb sind realistisch — mit Hauptaufwand für Template-Anpassung an das jeweilige Klassenformat, Abstimmung der Befundkategorien und Validierung durch die zuständige Klassifikationsgesellschaft. Das liegt im Mittelfeld der Schiffbau-Anwendungsfälle: schneller als Predictive Maintenance oder Ballastwasser-Sensorfusion, aber aufwendiger als reine Textassistenz ohne Zulassungsdimension.

ROI-Sicherheit — mittel (3/5) Die Zeitmessung pro Survey ist transparent und direkt — jeder Report hat einen Start- und Endstempel, der Vergleich vor/nach KI-Einsatz ist einfach durchzuführen. Allerdings entstehen in der Anlaufphase oft 4–8 Wochen zusätzlicher Koordinationsaufwand mit der Klassifikationsgesellschaft (Template-Freigabe, Musterdurchsichten, ggf. formale Anfragen), der die Sparrechnung der ersten 6 Monate spürbar drückt. Der ROI-Nachweis kommt — aber nicht sofort.

Skalierbarkeit — hoch (4/5) Ein einmal trainiertes und genehmigtes Template für DNV oder Lloyd’s Register kann von allen Surveyor-Teams der Reederei genutzt werden. Neue Surveyor werden schneller produktiv; wächst die Flotte, skaliert das System ohne proportionalen Mehraufwand. Einschränkung: Jede Klassifikationsgesellschaft braucht ein eigenes Template — wer mit DNV und LR arbeitet, hat zwei parallele Systeme zu pflegen.

Richtwerte — stark abhängig von Flottengröße, Klassifikationsgesellschaft und Surveytypen.

Was das System konkret macht

Der technische Ansatz kombiniert zwei Ebenen: strukturierte Dateneingabe und Generative KI zur Texterstellung.

Ebene 1: Strukturierte Befund-Erfassung während der Inspektion

Der Surveyor erfasst Befunde während der Inspektion in einem strukturierten digitalen Formular — nicht als Freitext, sondern mit vordefinierten Kategorien: Inspektionsbereich (Rumpf/Maschinenraum/Feuerlöschanlagen etc.), Befundtyp (Observation/Condition of Class/Recommendation), Referenz-Regelwerk, Prüfmethode, Messergebnis. Photos werden direkt zugeordnet. Das dauert nicht länger als bisherige Tablet-Notizen, liefert aber strukturierten Input statt unstrukturierter Feldnotizen.

Ebene 2: KI-Entwurf auf Basis der Befunddaten

Ein LLM, das auf Klassenformaten trainiert oder entsprechend angeprompted wurde, verarbeitet die strukturierten Befunddaten und generiert einen vollständigen Survey-Report-Entwurf im Format der Klassifikationsgesellschaft: Sektionen, Formulierungsstandards, Regelverweise, korrekte Klassifizierung der offenen Punkte. Der Report liegt typischerweise innerhalb von 20–40 Minuten nach Abschluss der Inspektion als Entwurf vor.

Was der Surveyor dann noch macht

Der Surveyor prüft den Entwurf, korrigiert Missverständnisse oder fehlinterpretierte Notizen, ergänzt Kontext, der nur mündlich bekannt ist, und zeichnet frei. Das ist kein Nicken-und-Fertig: Technische Befunde mit Sicherheitsrelevanz erfordern und verdienen genaue Prüfung. Der Unterschied ist der Startpunkt — man korrigiert einen strukturierten Entwurf statt ein leeres Dokument zu befüllen.

Das Prinzip ist vergleichbar mit der KI-gestützten Survey-Vorbereitung — dort geht es um die Compliance-Prüfung vor dem Survey, hier um die Dokumentation nach dem Survey. Beide Ansätze ergänzen sich.

Die Haftungskette: Wer zeichnet nach, wer haftet?

Dieser Punkt ist in der maritimen Klassifikation nicht verhandelbar und verdient eine explizite Behandlung.

Ein Survey-Report, der bei DNV, Lloyd’s Register oder Bureau Veritas eingereicht wird, ist ein rechtliches Dokument. Er bildet die Grundlage für die Verlängerung des Klasseattests, und das Klassezeugnis ist Voraussetzung für die Betriebserlaubnis des Schiffes, für Charterverträge und für die Transportversicherung. Fehler in diesem Dokument haben direkte rechtliche und wirtschaftliche Konsequenzen.

Die Haftungskette sieht so aus:

Der Surveyor zeichnet frei — und übernimmt damit die vollständige Verantwortung für den Inhalt. Es ist rechtlich nicht möglich, die Verantwortung für einen Survey-Report auf ein KI-System zu übertragen. Der Surveyor muss jeden Befund, jede Klassifizierung, jeden Regelwerkverweis inhaltlich verstanden und verifiziert haben, bevor er unterschreibt. Das KI-System generiert einen Entwurf — keinen fertigen Report.

Klassifikationsgesellschaften akzeptieren KI-Assistenz, nicht KI-Entscheidungen. DNV und Bureau Veritas haben begonnen, digitale Assistenz-Tools in ihre Survey-Workflows zu integrieren (DNV Machinery Maintenance Connect, BV Augmented Surveyor 3D). In keinem dieser Ansätze ersetzt die KI die Freigabe durch einen qualifizierten Surveyor. Das ist kein Hemmnis — es ist eine sinnvolle Grenze.

Konsequenz für die Implementierung: Das KI-System darf ausschließlich als Entwurfs- und Strukturierungswerkzeug positioniert werden. Jede interne Kommunikation, jede Schulung, jeder Workflow muss diese Grenze explizit benennen. Systeme, die den Surveyor dazu verleiten, Entwürfe ungeprüft freizuzeichnen, sind keine Hilfe — sie schaffen Haftungsrisiken.

Empfehlung: Vor dem Produktivbetrieb die Nutzungsform mit dem Surveyor-Team schriftlich klären und die Klassifikationsgesellschaft formell informieren — nicht wegen einer Genehmigungspflicht für das Tool selbst, sondern um Transparenz über den Prozess herzustellen und eventuelle Formatanforderungen frühzeitig zu kennen.

Konkrete Werkzeuge — was wann passt

Es gibt keinen spezialisierten “Maritimer Survey Report Generator” auf dem Markt — noch nicht. Der Stand 2025/2026: Die Reedereien, die diesen Ansatz verfolgen, bauen eigene Lösungen auf Basis generischer LLM-Plattformen. Das hat Vor- und Nachteile (Flexibilität vs. Aufwand), aber es bedeutet auch: du wählst heute das Fundament.

Langdock — EU-konform, schneller Einstieg, Assistenten-Builder Berliner Enterprise-KI-Plattform mit EU-Hosting auf Azure Frankfurt. Du baust einen Survey-Report-Assistenten mit einem strukturierten System-Prompt auf Basis deiner Klassenformate. DSGVO-konform, AVV auf Knopfdruck, kein IT-Projekt. Kosten: 25 Euro/Nutzer/Monat. Besonders geeignet für Reedereien, die mit deutschen oder skandinavischen Klassifikationsgesellschaften arbeiten und keine eigene IT-Infrastruktur für KI aufbauen wollen. Einschränkung: Die Schreibqualität hängt stark von der Prompt-Qualität ab — Template-Pflege ist dein Job.

Claude via AWS Bedrock (Frankfurt) — Stärke für strukturierte Langtexte Anthropics Claude-Modelle gelten als besonders stark in strukturierter Textgenerierung auf Basis langer Input-Dokumente — genau das, was Survey Reports brauchen. Über AWS Bedrock in Frankfurt ist Claude DSGVO-konform einsetzbar. Erfordert Entwicklerunterstützung, liefert aber die beste Textqualität für technisch präzise Reports. Kosten: API-basiert, ca. 10–25 Euro je 100 generierte Reports, abhängig vom Umfang.

Azure OpenAI Service — für strukturierte Workflow-Integration GPT-4o in der Azure-EU-Region (West Europe, Netherlands) für Reedereien, die bereits im Azure-Ökosystem arbeiten. Ermöglicht die Integration in bestehende Fleet-Management-Systeme, saubere AVV, Private Endpoints für KRITIS-ähnliche Anforderungen. Developer-Level: braucht IT-Ressourcen für Anbindung und Pflege.

Microsoft 365 Copilot — wenn ihr sowieso in der M365-Welt lebt Wenn eure Surveyor-Berichte in Word entstehen und eure interne Kommunikation in Teams läuft: Copilot kann direkt in Word geöffnete Report-Templates mit generierten Inhalten befüllen, auf Basis von hochgeladenen Befund-Notizen. Keine neue Plattform, keine Umschulung. Qualität: gut für Standardberichte, Grenzen bei sehr strukturierten technischen Formaten. Kosten: 30 Euro/Nutzer/Monat zusätzlich zur M365-Lizenz.

NotebookLM — für die Recherche-Phase, nicht für den Report Nicht direkt für Report-Generierung geeignet, aber wertvoll in der Vorbereitung: Lade aktuelle IACS-Dokumente, das DNV-Regelwerk und eure internen Prüfstandards hoch und befrage sie gezielt nach aktuellen Anforderungen für bestimmte Inspektionsbereiche. Kostenlos, kein Setup. Wichtig: US-Hosting, nicht für vertrauliche Befunddaten geeignet.

Wann welcher Ansatz

  • Schneller Einstieg, DSGVO-konform, keine eigene IT → Langdock
  • Beste Textqualität für technisch präzise Reports → Claude via AWS Bedrock
  • Azure-Infrastruktur vorhanden, Workflow-Integration gewünscht → Azure OpenAI Service
  • Bereits M365-Nutzer, minimale neue Tools → Microsoft 365 Copilot
  • Regelwerk-Recherche während der Inspektion → NotebookLM

Datenschutz und Datenhaltung

Survey-Reports enthalten technische Schiffsdaten und können je nach Kontext als Geschäftsgeheimnisse eingestuft werden — keine Personendaten im klassischen DSGVO-Sinne, aber sensible Betriebsdaten, die nicht über ungesicherte US-Cloud-Dienste verarbeitet werden sollten.

Die relevanten DSGVO-Punkte:

Personenbezogene Daten im Survey-Kontext. Ein Survey-Report enthält selten direkte Personenbezüge — außer wenn Besatzungsmitglieder namentlich als Zeugen von Befunden dokumentiert werden oder wenn Subunternehmer-Informationen Teil des Reports sind. In diesen Fällen gilt DSGVO-Pflicht uneingeschränkt.

Auftragsverarbeitungsvertrag (AVV). Jede Cloud-Plattform, die technische Schiffsdaten verarbeitet, braucht einen AVV nach Art. 28 DSGVO. Langdock, Azure OpenAI Service und AWS Bedrock stellen diese bereit; die Consumer-Varianten von ChatGPT oder claude.ai tun das nicht standardmäßig. Für professionellen Einsatz ausschließlich Business- oder Enterprise-Pläne mit AVV nutzen.

EU-Datenhaltung. Für Reedereien unter deutscher Flagge oder mit EU-Hauptsitz empfehlen wir EU-Hosting: Langdock (Azure Frankfurt), Azure OpenAI Service West Europe (Niederlande), AWS Bedrock Frankfurt. NotebookLM und die Consumer-Oberflächen von ChatGPT sind US-gehostet und für sensible Betriebsdaten nicht geeignet.

Was die Klassifikationsgesellschaften selbst anbieten. DNV und Bureau Veritas haben eigene digitale Plattformen (DNV My DNV, BV VeriSTAR). Wenn ihr bereits Daten in diesen Plattformen haltet, ist die naheliegendste Frage: Bieten diese Plattformen schon KI-Assistenz für die Report-Erstellung an? Stand 2026: begrenzt. DNV Machinery Maintenance Connect beschleunigt die Datenaggregation, ersetzt aber nicht die Texterstellung. BV Augmented Surveyor 3D optimiert die Inspektion selbst, nicht den abschließenden Report. Die Lücke ist real.

Was es kostet — realistisch gerechnet

Einmalige Aufbaukosten

  • Template-Erstellung: Das Klassenformat je Klassifikationsgesellschaft in einen System-Prompt und eine strukturierte Eingabemaske übersetzen. Aufwand: 40–80 Stunden, typischerweise von einem internen Surveyor mit KI-Erfahrung oder einem externen Berater durchgeführt. Bei 100 Euro/Stunde: 4.000–8.000 Euro je Klassifikationsgesellschaft.
  • Pilotphase mit 2–3 Surveys zur Validierung: ca. 2 Wochen Mehraufwand durch parallele Erstellung (alt + KI) für Qualitätssicherung. Zusätzlich 20–30 Stunden Surveyor-Zeit.
  • Abstimmung mit Klassifikationsgesellschaft: In der Regel kein formaler Genehmigungsprozess, aber 1–2 Gespräche zur Klärung von Formaterwartungen sind zu empfehlen. Kostenfrei, aber zeitaufwendig.

Laufende Kosten (monatlich)

  • Langdock Business: 25 Euro/Nutzer/Monat für 5–10 Surveyor → 125–250 Euro/Monat
  • Azure OpenAI Service oder AWS Bedrock: token-basiert, bei 50–100 Reports/Monat ca. 50–150 Euro/Monat
  • Microsoft 365 Copilot: 30 Euro/Nutzer/Monat zusätzlich zu bestehender M365-Lizenz

Was du dagegen rechnen kannst Ein Surveyor mit 150 Euro/Stunde Gesamtkosten (Gehalt + Overhead), der 15 Stunden pro Special Survey einspart: 2.250 Euro je Survey. Bei 20 Special Surveys pro Jahr: 45.000 Euro Einsparung jährlich — bei konservativ gerechneten 50% des theoretischen Werts (Anlaufzeit, Korrekturbedarf, nicht alle Surveys gleich komplex) sind das noch 22.000 Euro. Die Einrichtungskosten amortisieren sich bei einem mittelgroßen Betrieb im ersten Jahr.

Wie du den Nutzen tatsächlich misst Zeitstempel per Survey (Beginn Dokumentationsarbeit bis Report-Freigabe), vor und nach KI-Einführung. Das funktioniert als einfache Stoppuhr-Messung über drei bis fünf Surveys vor der Einführung und drei bis fünf danach. Kein aufwendiges Analytics-System nötig.

Typische Einstiegsfehler

1. Mit dem vollständigsten Format starten wollen. Der Reflex: Den Survey-Report-Assistenten erst produktiv einsetzen, wenn er alle 14 Sektionen des Special-Survey-Formats beherrscht. Das führt dazu, dass das System nie fertig ist. Besser: Mit einem Surveytyp und einem Rumpf-Inspektionsabschnitt starten — erst wenn der dort zuverlässig läuft, weitere Sektionen ergänzen. Drei Monate reiner Teilbetrieb sind wertvoller als acht Monate Vollkonzept-Entwicklung.

2. Den KI-Entwurf nicht als Entwurf behandeln. Das gefährlichste Muster: Surveyor sehen den generierten Report, stellen fest, dass er “gut genug” wirkt, und zeichnen mit minimaler Prüfung frei. Das funktioniert — bis es nicht mehr funktioniert. LLMs können technische Spezifikationen halluzinieren oder Regelverweise aus veralteten Normausgaben ziehen. Das ist bei einem Wartungsplan ärgerlich, bei einem Survey-Report für eine Klassifikationsgesellschaft potenziell haftungsrelevant. Faustregel: Jeder Befund, der als Condition of Class oder Recommendation klassifiziert wird, muss manuell gegen die Originalnotizen verifiziert werden. Immer.

3. Das Template nicht mit der aktuellen Regelwerksversion synchron halten. IACS-Unified Requirements und die Klassenregeln der Gesellschaften werden regelmäßig aktualisiert — DNV typischerweise im Jahresrhythmus. Ein LLM-Prompt, der auf eine veraltete Regelwerksversion trainiert ist, generiert stilistisch korrekte, inhaltlich aber überholte Verweise. Lösung: Bei jeder Regelwerksaktualisierung der Klassifikationsgesellschaft prüfen, ob der System-Prompt und die Template-Struktur aktualisiert werden müssen. Diese Verantwortung muss einer konkreten Person zugewiesen sein — keine IT-Aufgabe, sondern eine fachliche.

4. Kein Feedback-Loop vom Surveyor zur System-Verbesserung. Nach der Einführung: Wer führt eigentlich Buch über die Korrekturen, die Surveyor am generierten Entwurf vornehmen? Welche Sektionen werden am häufigsten nachgebessert? Welche Formulierungen werden immer wieder geändert? Ohne systematische Auswertung dieser Korrekturen lernt das System nicht weiter — und dieselben Fehler tauchen in jedem Report wieder auf. Mindestens quartalsweise: Die häufigsten Korrekturen durchsehen, den System-Prompt entsprechend anpassen.

Was mit der Einführung wirklich passiert — und was nicht

Die technische Einrichtung ist in diesem Fall tatsächlich nicht das Hauptproblem. Das Hauptproblem ist das professionelle Selbstverständnis von Surveyorn.

Der erfahrene Surveyor als erste Hürde. Ein Senior-Surveyor mit 20 Jahren Klassifikationserfahrung hat eine Arbeitsroutine entwickelt, die für ihn funktioniert. Das Schreiben des Reports ist für ihn nicht nur Dokumentation, sondern auch der Moment, in dem er die Befunde gedanklich abschließt, Inkonsistenzen bemerkt und abwägt, ob eine Condition of Class wirklich notwendig ist oder eine Recommendation reicht. Diese Reflexionsarbeit muss in einem KI-gestützten Workflow explizit erhalten bleiben — sie darf nicht der Effizienz geopfert werden.

Was konkret hilft: Den erfahrensten Surveyor als System-Builder einbinden, nicht als Nutzer. Lass ihn das Template entwerfen und die ersten Entwürfe im Paralleltest bewerten. Wer das System mitentwickelt hat, vertraut ihm — und korrigiert es, statt es zu umgehen.

Die “KI-macht-Fehler”-Erfahrung in den ersten Wochen. In der Anlaufphase produziert das System Entwürfe mit Fehlern — falsch kategorisierte Befunde, veraltete Regelverweise, fehlende Sektionen. Das ist normal und lösbar. Was nicht normal sein darf: dass diese Erfahrung als generelles Urteil über den Ansatz gewertet wird. Kommuniziere vorab klar: Die ersten fünf bis acht Reports sind Testläufe, keine Produktivbetriebe. Fehler werden systematisch erfasst und führen zu System-Verbesserungen.

Was typischerweise nicht passiert: Die reibungslose Einführung, bei der alle Surveyor das Tool sofort begeistert annehmen. Das passiert in keiner professionellen Umgebung, in der Qualitätsstandards hoch sind. Plane sechs Monate für eine vollständige Adoption ein.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Template-Erstellung & System-PromptWochen 1–4Klassenformat analysieren, Befundstruktur definieren, System-Prompt erstellen, Testdaten vorbereitenTemplate deckt nicht alle Sonderfälle ab — es entsteht kein Ausnahmehandling für atypische Befunde
Paralleltest mit echten SurveysWochen 5–12KI-Entwurf und manueller Report parallel erstellen, Abweichungen dokumentieren, System-Prompt iterativ verbessernParallelaufwand demotiviert Surveyor — frühes Feedback einfordern, nicht nur am Ende
Abstimmung KlassifikationsgesellschaftWochen 8–16 (parallel)Formale Mitteilung an DNV/LR/BV über KI-Assistenz, Format-Fragen klären, ggf. MusterdurchsichtKlassifikationsgesellschaft hat spezifische Format-Anforderungen, die im Prompt fehlen — Korrekturschleife nötig
PilotproduktivbetriebWochen 16–24Erste reale Reports ausschließlich mit KI-Unterstützung erstellt, Surveyor zeichnet nach Prüfung freiErste Freigabe-Verzögerung durch Rückfrage der Klasse — ruhig bleiben, System anpassen
VollproduktivbetriebAb Monat 6Alle Surveyor nutzen das System für alle Surveys, regelmäßige Template-ÜberprüfungenFluktuation im Surveyor-Team — Onboarding für neue Personen muss strukturiert sein

Häufige Einwände — und was dahintersteckt

„Die Klassifikationsgesellschaft wird das nicht akzeptieren.” Das ist der häufigste Einwand — und er ist teilweise berechtigt. Klassifikationsgesellschaften haben Formatanforderungen, und ein Report, der erkennbar aus einer KI stammt und nicht mit diesen Anforderungen übereinstimmt, wird zurückgeschickt. Das ist aber kein Argument gegen KI-Assistenz, sondern ein Argument für sorgfältige Template-Arbeit. DNV, Bureau Veritas und Lloyd’s Register entwickeln selbst digitale Survey-Plattformen und KI-Assistenz-Tools — sie lehnen das Prinzip nicht ab. Was sie verlangen: Qualität und den freizeichnenden Surveyor.

„Wir haben zu wenige Surveys, um den Aufwand zu rechtfertigen.” Ein realer Ausschlussgrund für kleinere Betriebe (mehr dazu im nächsten Abschnitt). Für Reedereien mit unter drei Special Surveys pro Jahr ist der Aufbauaufwand nicht amortisierbar. Für Flotten ab fünf bis sechs Schiffen — also 15–20 Surveys unterschiedlicher Art pro Jahr — ist die Rechnung klar.

„Unsere Surveyor werden das nie benutzen.” Wahrscheinlich nicht von alleine — wenn man es ihnen einfach auf den Tisch legt. Wahrscheinlich schon — wenn sie in die Template-Entwicklung eingebunden werden und die ersten Entwürfe erkennbar von ihrem eigenen Fachwissen geprägt sind. Der Unterschied zwischen “hier ist ein KI-Tool” und “hier ist ein Tool, das ihr selbst gebaut habt” ist psychologisch erheblich.

Woran du merkst, dass das zu dir passt

Gute Zeichen:

  • Deine Reederei hat fünf oder mehr Schiffe mit jeweils mehreren Survey-Ereignissen pro Jahr
  • Die Dokumentationserstellung dauert bei euch regelmäßig zwei oder mehr Werktage je Survey
  • Ihr arbeitet mit einer oder zwei Klassifikationsgesellschaften, nicht mit fünf verschiedenen
  • Eure Surveyor erstellen Reports heute schon digital (Tablet/Laptop), nicht handschriftlich
  • Ihr habt eine feste Person, die für das interne Qualitätsmanagement der Survey-Dokumentation zuständig ist

Drei harte Ausschlusskriterien — wann es sich (noch) nicht lohnt:

  1. Weniger als drei Special Surveys pro Jahr. Der Aufbau eines funktionsfähigen Systems — Template-Erstellung, Paralleltest, Abstimmung mit der Klasse — kostet 4.000–8.000 Euro und 40–80 Stunden interner Zeit. Wer das auf einen oder zwei Surveys im Jahr amortisieren muss, wird keine positive ROI-Rechnung hinbekommen. Für Reeder mit ein bis zwei Schiffen in der Klasse lohnt sich ein externer Dokumentationsassistent (ein erfahrener Büroschreiber) mehr als ein KI-System.

  2. Survey-Dokumentation erfolgt noch auf Papier oder in unstrukturierten Freitextdokumenten. Ein LLM-Assistent braucht strukturierten Input — entweder strukturierte digitale Befund-Erfassung oder zumindest halbwegs konsistente Textnotizen nach einem Schema. Wer heute Befunde als handschriftliche Listen oder formlose E-Mails erfasst, muss zuerst die Erfassungsebene digitalisieren und strukturieren. Das ist ein eigenes Projekt, das dem KI-Schritt vorausgeht.

  3. Keine Person, die das System kontinuierlich pflegt. Klassenregeln ändern sich. IACS-Unified Requirements werden aktualisiert. Das System-Prompt, das heute korrekte Regelverweise generiert, ist in 18 Monaten teilweise veraltet. Wenn niemand die Verantwortung dafür hat, diese Aktualisierungen in das System einzupflegen, produziert ihr nach zwei Jahren Survey-Reports mit überholten Normverweisen — die der Surveyor merken sollte, aber vielleicht nicht immer merkt. Ohne eine verantwortliche Person mit Budget-Slot für die Systempflege ist das Ergebnis schlechter als kein System.

Das kannst du heute noch tun

Öffne Langdock (7 Tage kostenlos, keine Kreditkarte) oder Claude in einem kostenlosen Plan und teste die Report-Logik mit einem alten Survey-Bericht.

Nimm einen abgeschlossenen Survey-Report aus den letzten 12 Monaten und die entsprechenden Rohnotizen (Tablet-Protokoll, Checklisten). Füge beides in den folgenden Prompt ein — als ersten Machbarkeitstest ohne Template-Arbeit:

Prompt für Survey-Report-Entwurf
Du bist ein Assistent für maritime Survey-Dokumentation. Deine Aufgabe: Erstelle einen strukturierten Entwurf eines Survey-Reports auf Basis der folgenden Rohdaten. FORMAT-ANFORDERUNGEN DER KLASSIFIKATIONSGESELLSCHAFT: [HIER EINFÜGEN: Survey-Report-Vorlage oder Sektionsübersicht deiner Klassifikationsgesellschaft, z.B. DNV Pt.7 Ch.1 oder LR entsprechend] SURVEYTYP: [Annual / Intermediate / Special / Docking Survey] SCHIFF: [Name, IMO-Nummer, Schiffstyp, Flagge, Baujahr] DATUM DER INSPEKTION: [Datum] INSPEKTIONSORT: [Werft / Hafen] ROHDATEN DER INSPEKTION: [HIER EINFÜGEN: Deine Feldnotizen, Checklisten-Ergebnisse, Fotonummern mit Beschreibung, mündliche Ergänzungen] Bitte: 1. Strukturiere die Befunde nach den vorgeschriebenen Sektionen des Report-Formats 2. Klassifiziere jeden Befund: Observation / Condition of Class / Recommendation (nur wo durch die Rohdaten eindeutig belegbar) 3. Füge die relevanten Regelwerkverweise ein (IACS, Klassenregeln) — kennzeichne explizit, wo du keinen passenden Verweis sicher benennen kannst 4. Erstelle eine Zusammenfassung offener Punkte am Ende 5. Markiere alle Stellen, die ich als Surveyor vor der Freigabe besonders sorgfältig prüfen sollte
Funktioniert mit Langdock, Claude, ChatGPT
Beispiel-Ausgabe

Mitarbeiter:in

Annual Survey, MS Nordseefalke, Bulkcarrier, Baujahr 2008. Rumpf Sektion 3: Ballasttank Nr. 4 Port — Korrosion an Spant 12–14, Stärke 8,5mm (Sollstärke 10mm laut letztem Special Survey), Fotos F-234 bis F-237. Anstrich 40% beschädigt. Pumpenraum: Leckageindikator Pumpe Nr. 2 funktioniert einwandfrei, Probenahme negativ. Feuerlöschanlage: CO2-Zylinder 18 von 20 auf Soll, Zylinder 7 und 14 zu erneuern (Wiegekarte überfällig).

KI-Assistent

## Annual Survey Report — MS Nordseefalke (Entwurf) **Schiff:** MS Nordseefalke | IMO: [einzufügen] | Bulkcarrier | Baujahr 2008 **Surveytyp:** Annual Survey **Inspektionsdatum:** [Datum einzufügen] --- ### SEKTION 3: RUMPF UND TANKINSPEKTION **Befund 3.1 — Condition of Class (empfohlen, final durch Surveyor zu bestätigen)** Ballasttank Nr. 4 Port: Messung Spant 12–14 ergibt 8,5 mm (Sollstärke nach letztem Special Survey: 10 mm). Wandstärkenabnahme 15%. Anstrichabdeckung ca. 60% intakt. Regelwerkverweis: IACS UR S1 Rev.3 (Mindeststärken Decksstruktur); zu prüfen durch Surveyor ob Class-Condition oder Recommendation angemessen. Fotos: F-234 bis F-237. ⚠ Surveyor-Prüfvermerk: Wandstärkenmessung mit Geräteprotokoll beilegen. Entscheidung Class/Recom. liegt beim Surveyor. **Befund 3.2 — Observation** Pumpenraum: Leckageindikator Pumpe Nr. 2 in Ordnung. Probenahme ohne Befund. --- ### SEKTION 5: SICHERHEITSAUSRÜSTUNG / BRANDSCHUTZ **Befund 5.1 — Condition of Class** CO2-Feuerlöschanlage: Zylinder 7 und 14 mit überfälliger Wiegekarte. Erneuerung vor nächster Abfahrt erforderlich. Regelwerkverweis: SOLAS II-2/10.5, DNV Rules Pt.4 Ch.5 (CO2-Anlagen Periodizität). ⚠ Surveyor-Prüfvermerk: Nachweisbeleg für Erneuerung muss vor Endfreigabe des Reports vorliegen. --- ### OFFENE PUNKTE (zur Prüfung durch Surveyor) 1. Wandstärkenprotokoll Ballasttank Nr. 4 Port erforderlich 2. CO2-Zylindernachweis Zylinder 7/14 vor Freigabe 3. IMO-Nummer des Schiffes im Header noch einzufügen *Dieser Entwurf wurde KI-generiert und muss vollständig durch den Surveyor geprüft und verifiziert werden, bevor er bei der Klassifikationsgesellschaft eingereicht wird.*

Schau dann, was stimmt und was nicht — das ist dein erstes ehrliches Feedback über den Reife-Stand dieses Ansatzes für eure Situation. Wenn 70–80% des Entwurfs korrekt und nützlich sind, ist der Ansatz für euch tragfähig. Wenn er zu viele Lücken hat, zeigt das, wo Templates und Prompt-Arbeit fehlen.

Quellen & Methodik

  • DNV, „A fleet in a day: MMC unlocks new efficiencies in machinery maintenance and survey” (Maritime Impact, 2023): Fallstudie, in der DNV mit dem Machinery Maintenance Connect-System die Surveys von 49 Schiffen für BW Offshore in rund vier Stunden abschloss — gegenüber 49 separaten Bordbesuchen. Quelle: dnv.com

  • Bureau Veritas, Augmented Surveyor 3D (AGS 3D) Launch (2024): Bureau Veritas hat eine KI-gestützte Inspektionsplattform auf Basis von LiDAR, KI-Korrosionsdetektion und 3D-Modellierung für Schiffs- und Offshore-Inspektionen eingeführt. Zeigt den Branchentrend zu KI-Assistenz in der Klassenarbeit. Quelle: marine-offshore.bureauveritas.com

  • agorum GmbH, „Digitalisierungsmöglichkeiten mit KI für Schiffbau” (2025): Dokumentenmanagementsystem-Anbieter publiziert Kosten-Hochrechnung für Zertifikatsverwaltung im Schiffbau: 500 Zertifikate × 20 Schiffe × 20 Min = 5.000 Std/Jahr ≈ 200.000 Euro. Quelle: agorum.com

  • SafeMTS-Programm, US Bureau of Transportation Statistics (März 2026): LLM-Pilotprojekt im kommerziellen Schiffsverkehr zur automatisierten Analyse von Near-Miss-Berichten. Automatisierte Detektion erhöhte Fallaufnahme um 90%, Zeitersparnis für kritische Fallidentifikation 75%. Zeigt Reife von LLMs für strukturierte maritime Dokumentenanalyse. Quelle: bts.gov/newsroom

  • Splash247, „Most maritime AI failures will be data failures, not algorithmic” (2024): Branchenanalyse, die zeigt: Sensordrift und Datenveralterung — nicht Algorithmenversagen — sind die Hauptursache für KI-Fehler in der Schifffahrt. Direkt übertragbar auf Survey-Report-Generierung: Templates und Regelwerksverweise müssen aktiv gepflegt werden. Quelle: splash247.com

  • Preisangaben Langdock, Azure OpenAI Service, Microsoft 365 Copilot: Veröffentlichte Anbieter-Tarife, Stand April–Mai 2026.

  • Surveyor-Tagessätze und Dokumentationsaufwand: Erfahrungswerte aus deutschen und skandinavischen Reedereikreisen sowie Einschätzungen aus Fachgesprächen; keine repräsentative Studie, aber konsistente Beobachtungen aus dem Umfeld norddeutscher Werften.


Du willst wissen, ob dieser Ansatz für eure Flottengröße und eure Klassifikationsgesellschaft konkret umsetzbar ist? Meld dich — das klären wir in einem kurzen Gespräch ohne Verpflichtung.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar