Zum Inhalt springen
Medizintechnik notified-bodymaengelbescheidkorrespondenz

Notified Body Korrespondenz strukturieren

KI analysiert Fragen und Mängelbescheide vom Notified Body, priorisiert Bearbeitungspunkte und erstellt strukturierte Antwortvorlagen — damit 30-Tage-Fristen nicht zur Engstelle werden.

⚡ Auf einen Blick
Problem
Mängelbescheide vom Notified Body enthalten oft 20–30 Einzelfragen, die innerhalb von 30 Tagen beantwortet sein müssen — mit Querverweisen auf MDR-Anhänge, technische Normen und vorherige Antworten, die niemand schnell findet.
KI-Lösung
KI verknüpft NB-Fragen automatisch mit den betroffenen Abschnitten der technischen Dokumentation, priorisiert nach Aufwand und Dringlichkeit, und generiert Antwortgerüste mit exakten Norm-Verweisen.
Typischer Nutzen
Bearbeitungszeit pro Findings-Runde um 40–60 % reduziert. Vollständigere Antworten durch automatische Querverweis-Prüfung. Kürzere Zertifizierungszyklen durch weniger Folgerunden.
Setup-Zeit
10–16 Wochen bis produktiver Pilotbetrieb
Kosteneinschätzung
15.000–40.000 € Einrichtung; ROI indirekt messbar
Regulatory Correspondence KI / Dokumenten-Assistent mit technischer Akte als Wissensbasis
Worum geht's?

Es ist Montag, 8:14 Uhr.

Sandra Neumann öffnet ihr E-Mail-Postfach und sieht die Nachricht, auf die sie seit acht Wochen gewartet hat — und gefürchtet hat. Der Notified Body hat sein Findings Letter zu ihrem Klasse-IIb-Gerät verschickt. 23 Fragen, aufgeteilt in fünf Kategorien. Antwortfrist: 30 Tage.

Sie öffnet das Dokument. Frage 1 bis 6 sind handhabbar — sie kennt die Stellen in der technischen Dokumentation, die der NB meint. Frage 7 dagegen referenziert MDR Anhang I, Abschnitt 8.4, und verlangt einen Nachweis, den Sandra so nicht ablegt hat. Sie ist sich nicht sicher, ob der NB hier eine andere Interpretation von “performance” vs. “clinical performance” ansetzt als ihre Regulatory-Team-Leitung — oder ob er recht hat und das Dossier tatsächlich eine Lücke hat.

Sie öffnet ihre technische Akte. 847 Dokumente, verteilt über drei SharePoint-Ordner, eine veraltete Ablage auf dem Netzlaufwerk und einen ZIP-Archiv-Ordner vom letzten externen Berater. Frage 12 und Frage 19 beziehen sich auf Normen, die in mindestens acht verschiedenen Abschnitten des Dossiers relevant sind — aber wo genau? Das weiß sie nicht auswendig.

Fünf Tage später hat sie 18 Antworten fertig. Vier Fragen — darunter 7, 12 und 19 — stehen noch, weil sie zuerst alle betroffenen Abschnitte finden, querlesen und abstimmen muss. Das dauert pro Frage zwei bis vier Stunden.

Sechs Wochen nach der Einreichung folgt das Zweite Findings Letter: elf neue Fragen — drei davon direkt über Sandrinas Antworten aus der ersten Runde.

Das ist der “Findings Letter Loop”. Kein Ausnahmefall, sondern der Normalfall für Medizinprodukte-Hersteller, die unter EU MDR zertifizieren.

Das echte Ausmaß des Problems

Der MDR-Zertifizierungsprozess ist in Europa strukturell schwierig. Laut dem MedTech Europe IVDR & MDR Survey 2024 (veröffentlicht Dezember 2024, 300+ Hersteller befragt) liegt die durchschnittliche Gesamtdauer einer neuen MDR-Zertifizierung bei 13 bis 18 Monaten — in komplexeren Fällen mit QMS-Erst-Zertifizierung bis zu 24 Monate. 47,6 Prozent der befragten Großunternehmen gaben an, Innovationsprojekte in Europa zurückgestellt zu haben.

Was diese Dauer treibt, sind selten fehlende Dokumente am Anfang — es sind die Findings-Runden. Laut praktischer Erfahrung aus MDR-Projekten gibt es bei den meisten Klasse-IIa/IIb-Zertifizierungen mindestens zwei Findings-Runden, bei Klasse III oft drei oder mehr. Jede Runde kostet im Schnitt vier bis acht Wochen zusätzliche Laufzeit.

Gleichzeitig zeigt die GlobalRWC-Analyse häufiger NB-Findings (2024): Die häufigste Ursache für Mängelbescheide sind klinische Bewertungen — fehlende Stand-der-Technik-Abgrenzungen, unklare Äquivalenzargumente oder unzureichend begründete klinische Kenngrößen. Das Problem ist nicht, dass die Hersteller keine guten Geräte bauen. Es ist, dass die Dokumentation vorhandener Nachweise für den NB nicht schnell genug auffindbar und strukturiert präsentierbar ist.

Rechne das konkret durch: Ein typisches Klasse-IIb-Medizinprodukt mit 5.000 Euro monatlichem Umsatz im Zielmarkt verliert bei zwei Monate Verzögerung durch schleppende Findings-Antworten rund 10.000 Euro an Markteintrittszeitpunkt. Bei einem Gerät mit 200.000 Euro monatlichem Zielmarktpotenzial sind es schon 400.000 Euro — ohne die internen Personalkosten mitzuzählen.

Die Regulatory-Affairs-Funktion ist dabei strukturell überlastet: Die meisten mittelständischen Medtech-Unternehmen haben ein bis drei Personen im RA-Team, die gleichzeitig mehrere Zertifizierungsprojekte, Post-Market Surveillance, FSCA-Handhabung und Lieferantenqualifikation betreuen. Jede Findings-Runde, die länger als nötig dauert, tut weh.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit strukturierter KI-Unterstützung
Zeit für erste Durchsicht eines 25-Fragen-Findings-Letters3–5 Stunden30–60 Minuten (Kategorisierung + Verlinkung automatisch)
Anteil unbeantworteter Fragen bei erstem AbgabeterminTypisch 3–6 Fragen offen wegen RechercheTypisch 0–2 offen, da Quellen automatisch aufgefunden
Durchschnittliche Zeit pro Antwortausarbeitung2–4 Stunden (Suche + Formulierung + Review)45–75 Minuten (KI-Gerüst + Expertenprüfung + Freigabe)
Risiko von Widersprüchen zwischen AntwortenHoch — keine Gesamtübersicht über AussagenNiedrig — KI prüft auf Konsistenz gegen vorherige Antworten
Institutionelles Lernen nach jeder RundeFragmentiert, in KöpfenStrukturiert erfassbar als Datenbank für Folgeprojekte

Eigene Erfahrungswerte aus RA-Projekten mit mittelständischen Medtech-Unternehmen. Keine repräsentative Studie.

Einschätzung auf einen Blick

Zeitersparnis — hoch (4/5) Die Zeitersparnis ist eine der greifbarsten in dieser Branchenkategorie. Eine Findings-Runde mit 20–30 Fragen, die manuell 40–60 Stunden Bearbeitungszeit kostet, lässt sich mit strukturiertem KI-Einsatz auf 15–25 Stunden drücken — weil die KI den langwierigsten Teil übernimmt: das Suchen und Querverweisen innerhalb der technischen Akte. Nicht ganz maximal bewertet, weil der verbleibende Review-Aufwand durch regulatorische Fachleute nicht wegfällt und nicht abgekürzt werden sollte.

Kosteneinsparung — mittel (3/5) Die Einrichtungskosten liegen realistisch bei 15.000–40.000 Euro (Plattform + Konfiguration + initiale Indexierung der technischen Dokumentation). Die laufenden Kosten sind handhabbar, aber nicht trivial. Der Nutzen entsteht primär über den beschleunigten Zertifizierungsweg — und dieser ist schwerer direkt zu isolieren als etwa bei der Technischen Dokumentation nach MDR, wo Zeitersparnis pro Seite direkt messbar ist. Daher Mittelfeldpositionierung.

Schnelle Umsetzung — mittel (3/5) 10–16 Wochen bis zum produktiven Pilotbetrieb ist keine Expresslösung, aber für den regulatorischen Kontext handhabbar. Der Aufwand liegt in der strukturierten Aufbereitung der technischen Akte als Wissensbasis — was häufig auch die erste sinnvolle Dokumenten-Inventur seit Jahren ist. Das Maximum von 4 in dieser Branche ist für sehr schlanke Anwendungsfälle reserviert; NB-Korrespondenz braucht die regulatorische Vorbereitung.

ROI-Sicherheit — sehr hoch (5/5) Das ist der stärkste Hebel dieser Anwendung. Jeder Monat kürzerer Zertifizierungszeit ist direkt in entgangene Markteinnahmen übersetzbar — zwischen 20.000 Euro (kleines Spezialsegment) und 150.000 Euro (Mainstream-Medizinprodukt mit breitem Markt) monatlich. Eine beschleunigte Findings-Antwort, die eine zweite Runde verhindert, kann zwei bis vier Monate Verzögerung einsparen. Das rechtfertigt die Einrichtungskosten bei den meisten Herstellern im ersten Zertifizierungsprojekt.

Skalierbarkeit — mittel (3/5) Das System lässt sich auf alle Produktzulassungen des Unternehmens anwenden — aber nicht ohne Aufwand. Jede technische Akte braucht eine eigene Indexierung und Konfiguration. Teams, die gleichzeitig fünf Produkte zertifizieren, profitieren überproportional; ein Einzelprojekt-Hersteller weniger. Skalierbarkeit ist also stark vom Portfolio abhängig.

Richtwerte — stark abhängig von Produktklasse, NB-Spezifik und Reifegrad der technischen Dokumentation.

Was das System konkret macht

Der KI-Agent für NB-Korrespondenz hat im Kern vier Funktionen. Keine davon macht regulatorische Entscheidungen — das bleibt menschliche Aufgabe. Was die KI übernimmt, ist die strukturierte Informationslogistik:

1. Fragen-Kategorisierung und Priorisierung Das System liest das Findings Letter ein und klassifiziert jede Frage nach: betroffenem Anhang des MDR (z. B. Anhang I, II oder XIV), betroffenem Abschnitt der technischen Akte, geschätztem Bearbeitungsaufwand und Abhängigkeiten zwischen Fragen. Eine Frage, die eine andere voraussetzt, wird automatisch hinter diese gereiht — statt dass die RA-Managerin das mental jongliert.

Disclaimer: Die Klassifizierung ist eine Arbeitshilfe — nicht als rechtlich bindende Priorisierung zu interpretieren. Regulatorische Entscheidungen müssen durch qualifizierte Personen getroffen werden.

2. Automatische Querverweis-Suche Für jede Frage durchsucht das System die indexierte technische Akte — strukturiert als RAG-Wissensbasis — und zeigt die relevantesten Abschnitte mit Dokumentname, Seitenzahl und einem Relevanz-Score. Statt 45 Minuten Suche in 847 Dokumenten: 2 Minuten Überprüfung der vorgeschlagenen Quellenabschnitte.

3. Antwortgerüst-Generierung Auf Basis der gefundenen Quellabschnitte erstellt das System ein strukturiertes Antwortgerüst: Einleitungssatz, relevante Nachweise aus der Akte, empfohlene Norm-Verweise, offene Punkte, die noch manuell ergänzt werden müssen. Das Gerüst ist ein Ausgangspunkt — kein Endprodukt.

4. Konsistenz-Prüfung über Runden hinweg Wenn eine zweite Findings-Runde eingeht, vergleicht das System die neuen Fragen automatisch mit den vorherigen Antworten und markiert Stellen, an denen ein NB-Reviewer eine frühere Aussage hinterfragt. So wird sichtbar, wo das Team in Runde 2 konsistent bleiben muss und wo eine Präzisierung nötig ist.

Was das System nicht macht: Es bewertet nicht, ob eine Antwort regulatorisch ausreichend ist. Es prüft nicht, ob eine Äquivalenzbehauptung tragfähig ist. Es übernimmt keine Haftung. Diese Entscheidungen müssen durch qualifizierte RA-Fachleute gegengezeichnet werden — das ist keine Einschränkung der KI, sondern regulatorische Anforderung nach ISO 13485.

Konkrete Werkzeuge — was wann passt

Für diesen Anwendungsfall gibt es zwei Ansätze: integrierte eQMS-Plattformen mit NB-Correspondence-Modulen und generische LLM-Umgebungen, die mit der technischen Akte als Wissensbasis aufgebaut werden.

Greenlight Guru — für Hersteller mit dediziertem MDR-eQMS Greenlight Guru ist das einzige vollständig auf MDR/IVDR ausgerichtete eQMS. Design Controls, Risk Register und technisches File sind eng verknüpft — das macht es zur natürlichen Plattform für NB-Correspondence-Tracking, weil Fragen direkt an die betroffenen Dokument-Abschnitte gelinkt werden können. Kein direktes LLM-Modul für Antwortgenerierung, aber die strukturierte Datenlage ist die beste Voraussetzung für einen darüber gelegten KI-Agenten. Kosten: ca. 25.000–35.000 USD/Jahr. Geeignet für: Hersteller, die noch kein eQMS haben und von Anfang an MDR-konform aufbauen wollen.

Veeva Vault — für mittelgroße bis große Hersteller Vault RIM deckt Health-Authority-Korrespondenz inkl. NB-Correspondence ab, mit vollständigem Audit Trail und EU-Datenresidenz. Die Veeva AI Suite (seit Dezember 2025) erlaubt eigene LLM-Agenten auf Basis von Amazon Bedrock oder Azure. Realistisch: Vault ist für Hersteller ab 50 Mitarbeitenden und mehreren parallelen Produktzulassungen sinnvoll — darunter ist der Overhead zu groß. Kosten: ab 25.000 €/Modul/Jahr aufwärts. Geeignet für: etablierte Hersteller mit Pharma/Biotech-Umfeld oder Dual-Market (CE + FDA).

Qualio — für wachsende Teams mit Budget-Sensitivität Qualio ist die zugänglichste QMS-Plattform für Medtech-KMU — in 4–10 Wochen produktiv, EU-Hosting, ISO-13485-konform. Correspondence-Tracking über das Dokument-Control-Modul abbildbar; LLM-Anbindung über API-Integration möglich, aber nicht out-of-the-box. Kosten: Starter ab ca. 25.000 €/Jahr. Geeignet für: Teams mit 10–100 Mitarbeitenden, die kein Mega-eQMS brauchen.

Claude oder ChatGPT mit eigener Wissensbasis — für den schnellen Einstieg Wer keine eQMS-Plattform hat oder kurzfristig beginnen will: Die technische Akte als indexiertes Kontext-Set in ein LLM laden und direkt mit dem Findings Letter arbeiten. Dabei ist NotebookLM der zugänglichste Einstieg (kostenlos, kein Setup), geeignet für kleinere Akten bis ~200 Seiten. Für größere Dokumentationsmengen bietet sich Claude (200k Token Kontextfenster) oder ein benutzerdefiniertes GPT mit Microsoft 365 Copilot (SharePoint-Integration) an. Kosten: 0–30 €/Person/Monat. Geeignet für: Pilotphase vor eQMS-Entscheidung, oder Hersteller mit kleinen Portfolios.

Zusammenfassung: Wann welcher Ansatz

  • Kein eQMS vorhanden, schneller Einstieg gewünscht → Claude / NotebookLM mit manuell indexierter Akte
  • Wachsendes Team, ISO-13485-konformes QMS nötig → Qualio
  • Dediziertes MDR-fokussiertes eQMS von Anfang an → Greenlight Guru
  • Mittlerer bis großer Hersteller, Vault bereits im Einsatz → Veeva Vault AI Suite
  • Microsoft 365 im Haus, SharePoint als Aktenlager → M365 Copilot als erster Test

Datenschutz und Datenhaltung

Technische Dokumentation nach MDR enthält sensible Geschäftsinformationen — Design-Details, Fertigungsverfahren, klinische Bewertungen, Sicherheitsnachweise. Sie enthält in der Regel keine patientenbezogenen Daten im DSGVO-Sinne, aber durchaus proprietäres Know-how und Betriebs­geheimnisse. Trotzdem gelten mehrere Anforderungen:

DSGVO-Relevanz: Sobald NB-Korrespondenz personenbezogene Daten enthält — etwa Namen von Prüfpersonen in klinischen Studien, Schulungsnachweise von Mitarbeitenden oder Qualifikationsdokumente von Auditoren — greift die DSGVO. In diesem Fall ist ein Auftragsverarbeitungsvertrag (AVV) mit dem LLM-Anbieter zwingend.

ISO 13485 — Validierungspflicht für QMS-Tools: Ein KI-Werkzeug, das in einem ISO-13485-geregelten Prozess eingesetzt wird, gilt als “Software in Support of QMS Process” und muss validiert werden. Das bedeutet: dokumentierter Validierungsplan, Testfälle, Abnahmekriterien. Das ist kein optionales Detail — es ist MDR-Konformitätsanforderung. Konsultiere dein Regulatory-Team oder einen externen Berater, bevor du ein KI-Tool in einen validierten QMS-Prozess integrierst.

Hosting nach Sensitivität entscheiden:

  • NotebookLM: Google-Cloud, US-Hosting. Für öffentliche oder nicht-sensitive technische Dokumente vertretbar; für vollständige Design-History-Files nicht empfohlen ohne explizite Datenschutzprüfung.
  • Claude via claude.ai: US-Hosting. Für produktiven Einsatz: Claude über AWS Bedrock (Frankfurt) — dann EU-Datenresidenz und AVV verfügbar.
  • Greenlight Guru: US-Hosting. Für deutsche/EU-Hersteller mit strenger DSGVO-Auslegung prüfungsbedürftig.
  • Veeva Vault: EU-Datenresidenz verfügbar — beste Wahl für sensitive regulatorische Dokumentation.
  • Qualio: EU-Hosting verfügbar — GxP-konform und ISO-13485-validierbar.

Empfehlung: Beginne mit einer Datenschutz-Folgenabschätzung für den spezifischen Dokumentenbestand, den du dem KI-System zugänglich machen willst. Der Datenschutzbeauftragte muss vor Produktivbetrieb eingebunden sein — das ist keine Bürokratie, sondern MDR-Prüfungsrisiko.

Was es kostet — realistisch gerechnet

Einmalige Einrichtungskosten

  • Dokumenten-Inventur und strukturierte Aufbereitung der technischen Akte (intern): typisch 3–6 Wochen für 1–2 RA-Mitarbeitende
  • Technische Einrichtung (Indexierung, RAG-Konfiguration, Anbindung ans Dokumentenmanagementsystem): extern 5.000–15.000 Euro bei IT-Partner oder Berater
  • eQMS-Einrichtungskosten (sofern Qualio oder Greenlight Guru): 10.000–20.000 Euro zusätzlich
  • Validierungsdokumentation (ISO 13485 konform): 3.000–8.000 Euro bei externer Unterstützung

Laufende Kosten (monatlich)

  • LLM-Plattform (Claude Pro / ChatGPT Team): 20–30 Euro/Person/Monat
  • eQMS-Lizenz (Qualio): ab ca. 2.000–3.000 Euro/Monat für kleine Teams
  • Greenlight Guru: ca. 2.000–3.000 USD/Monat im Einstieg
  • Veeva Vault: ab ca. 2.000 Euro/Monat für ein Modul

Wie du den ROI tatsächlich misst Der reale Beweis ist der Zertifizierungskalender: Wie viele Fragen bleiben beim nächsten Findings Letter noch offen? Wird eine zweite Runde ausgelöst? Vergleiche die Gesamtlaufzeit des nächsten Projekts mit dem vorherigen — das ist die ehrlichste Metrik. Nebenher: Wie viele Stunden verbringt dein RA-Team pro Findings-Letter? Führe das Protokoll vor und nach KI-Einführung.

Was du dagegenrechnen kannst Ein Klasse-IIb-Gerät mit anvisiertem EU-Markt von 80.000 Euro monatlichem Umsatz verliert bei zwei Monaten vermeidbarer Verzögerung 160.000 Euro Markterlös. Die Einrichtungskosten des KI-Systems (25.000–40.000 Euro) amortisieren sich bei einem Projekt. Wer drei oder mehr Produkte gleichzeitig zertifiziert, rechnet schneller. Orientierungswert — stark abhängig von Produktklasse, Markt und Preisgestaltung.

Drei typische Einstiegsfehler

1. Die gesamte technische Akte auf einmal indexieren — ohne Qualitätsprüfung. Der Reflex: Alle 847 Dokumente einlesen, dann ist das System vollständig. In der Praxis enthält jede gewachsene technische Akte drei bis fünf veraltete Versionen desselben Dokuments, widersprüchliche Norm-Referenzen aus zwei Zertifizierungsgenerationen und Dokumente, die der letzte externe Berater erstellt hat und deren Status niemand mehr kennt. Ein System, das auf diesem Chaos aufgebaut wird, gibt dem NB-Reviewer im schlimmsten Fall widersprüchliche Nachweise — das ist gefährlicher als kein System. Lösung: Erst Dokumenten-Inventur, dann Indexierung. Jede Dokumentenkategorie braucht eine definierte “Mastery Version” — die aktuelle, freigegebene Fassung. Alles andere bleibt außen vor.

2. KI-generierte Antworten ohne regulatorische Prüfung einreichen. Das KI-System erstellt Antwortgerüste, keine Antworten. Wer die generierten Texte ohne Prüfung durch eine qualifizierte RA-Person einreicht, riskiert mehreres: Das System kann Passagen aus der technischen Akte falsch zuordnen (Halluzination ist auch bei RAG-Systemen nicht ausgeschlossen). Es kann eine Norm-Aussage aus dem Kontext reißen. Es kann in Frage 12 eine Formulierung erzeugen, die der Antwort auf Frage 7 widerspricht. Der NB-Reviewer merkt das — und eskaliert. Lösung: Jede Antwort muss von einer qualifizierten RA-Person gelesen, verstanden und unterschrieben werden. Die KI spart Recherche-Zeit, nicht Entscheidungs-Verantwortung.

3. Das System einrichten, aber die Findings-Datenbank nicht aufbauen. Das ist der Fehler, der am teuersten bezahlt wird — weil er still passiert. Das System ist produktiv, die Findings-Letter-Antworten werden schneller. Aber niemand erfasst systematisch: Welche Fragen hat dieser NB immer wieder gestellt? Welche MDR-Interpretationsunterschiede gibt es zwischen verschiedenen Notified Bodies? Welche Normen-Auslegungen haben in der ersten Runde zu Folgefragen geführt? Nach 18 Monaten ist das Wissen der letzten drei Findings-Runden immer noch in Köpfen und E-Mail-Archiven — nicht im System. Das nächste Produkt startet bei null. Lösung: Von Anfang an eine strukturierte Findings-Datenbank anlegen (dazu mehr im nächsten Abschnitt).

Wie du aus NB-Findings-Mustern eine interne Datenbank aufbaust

Das ist der institutionelle Lernhebel, den die meisten Hersteller verschenken.

Jedes Findings Letter ist eine Wissensquelle: Welche Punkte findet dieser NB immer wieder? Welche Formulierungen in der technischen Akte lösen Folgefragen aus? Welche MDR-Anhang-Abschnitte sind für diesen NB-Reviewer schwerer Schwerpunkte?

Eine Findings-Datenbank muss keine aufwendige Software sein. Sie braucht vier Felder pro Eintrag:

FeldInhalt
NB-Frage (Original)Exakter Wortlaut aus dem Findings Letter
KategorieMDR-Anhang und Abschnitt, ISO-Norm, technischer Bereich
Antwort-AnsatzWelcher Nachweis hat überzeugt — oder nicht überzeugt
Folgefrage ausgelöst?Ja/Nein, wenn Ja: was war unklar

Mit drei abgeschlossenen Findings-Runden hast du Muster: Du siehst, welche Formulierungen in Anhang I, Abschnitt 3 dein NB immer hinterfragt. Du siehst, welcher Norm-Verweis regelmäßig als unvollständig markiert wird. Du siehst, ob sich zwei NB-Reviewer grundlegend in ihrer Interpretation unterscheiden.

Das KI-System kann ab einer gewissen Größe dieser Datenbank automatisch neue Findings Letters gegen historische Muster abgleichen: “Diese Frage zu Anhang I, Abschnitt 5 wurde in der Form in zwei früheren Projekten gestellt — hier ist, was damals funktioniert hat und was nicht.”

Das macht jeden nachfolgenden Zertifizierungsprozess effizienter — nicht durch bessere KI, sondern durch institutionelles Gedächtnis, das endlich zugänglich ist.

Tipp: Schreib diese Findings-Datenbank so auf, dass sie auch für neue RA-Mitarbeitende direkt nutzbar ist. Regulatory Affairs ist eine der Branchen mit dem höchsten impliziten Wissen — und mit den höchsten Kosten bei Personalwechseln.

Was du vor dem KI-Einsatz validieren musst

Dieser Abschnitt ist nicht optional — er ist Teil der regulatorischen Realität für ISO-13485-konforme Hersteller.

Wenn du ein KI-Werkzeug in einen dokumentierten QMS-Prozess integrierst — also einen Prozess, der in deinem Qualitätsmanagement-System beschrieben ist und unter ISO 13485 fällt — gilt dieses Tool als “Software in Support of a Quality Management System Process” nach FDA 21 CFR Part 11 / EU MDR-Anhang I Anforderungen.

Was das in der Praxis bedeutet: Du musst vor dem produktiven Einsatz dokumentieren, dass das Werkzeug deinen Anforderungen entspricht. Das nennt sich Computersystem-Validierung (CSV) oder, moderner, Computer Software Assurance (CSA). Die Anforderungen umfassen mindestens:

  • Validierungsplan: Welchen Zweck hat das Tool, welche Anforderungen muss es erfüllen?
  • Testfälle: Welche Inputs führen zu welchen erwarteten Outputs? Wie verhält sich das System bei Grenzfällen?
  • Abnahmeprotokoll: Hat das System die Testfälle bestanden?
  • Risikobeurteilung: Was passiert, wenn das System falsche Vorschläge macht? Wie wird das erkannt?

Für LLM-basierte Tools ist die Validierung konzeptionell anspruchsvoller als für klassische Software — weil LLMs nicht deterministisch sind. Die Praxis-Lösung: Definiere den Scope eng. Das Tool erstellt “Antwort-Entwürfe zur Überprüfung durch qualifizierte Personen” — kein Endprodukt. Das reduziert die Risikokategorie und damit den Validierungsaufwand erheblich.

Dies ist keine Rechtsberatung. Die konkrete Validierungspflicht hängt von deinem spezifischen Prozess, deiner Produktklasse und dem regulatorischen Rahmen ab. Konsultiere deinen Regulatory Affairs Manager oder einen zugelassenen Berater. Stand: Mai 2026.

Was mit der Einführung wirklich passiert — und was nicht

Die größte Hürde ist selten die Technologie. Es sind die impliziten Annahmen über den Prozess.

“Unsere Dokumente sind ja schon digital.” Ja — aber digital bedeutet selten strukturiert. Eine SharePoint-Ablage mit 800 Dateien in verschachtelten Ordnern, ohne Versionskontrolle, mit fünf verschiedenen Benennungskonventionen ist nicht strukturiert. Das System findet Dokumente, aber die Relevanz-Scores werden zufällig — weil das System nicht weiß, welche Datei die aktuelle Version ist. Die erste echte Arbeit beim Rollout ist die Dokumenten-Inventur, nicht die KI-Konfiguration.

“Das macht die KI schon richtig.” Ein häufiges Muster in den ersten Wochen: Die RA-Managerin sieht einen KI-Vorschlag, der gut klingt, und übernimmt ihn fast unverändert. Nach zwei Findings-Runden merkt sie, dass das System systematisch einen Norm-Verweis falsch zugeordnet hat — weil ein Dokument mit ähnlichem Titel aber anderen Inhalt im Ranking oben lag. Die Lösung ist nicht technisch, sondern prozessual: Jede Antwort braucht eine explizite Review-Runde — mit Signatur und Datum. Nicht als Pflicht-Theater, sondern weil das der NB auch erwartet.

“Das lernt ja mit der Zeit.” Standard-RAG-Systeme lernen nicht von selbst — sie geben zurück, was in der Wissensbasis steht. Wenn eine NB-Frage in Runde 2 eine Antwort aus Runde 1 anzweifelt, muss jemand aktiv prüfen, ob die Wissensbasis den Fehler enthält — und ihn manuell korrigieren. Das ist keine KI-Schwäche, sondern eine Notwendigkeit in regulierten Prozessen. Planbare Wartung, kein Selbstläufer.

Was konkret hilft:

  • Vor dem Rollout: Dokumenten-Inventur mit definierter “Mastery Version” pro Dokumenttyp
  • Pilotstart mit einem abgeschlossenen Findings Letter aus der Vergangenheit — das System kann seine Vorschläge gegen bekannte Antworten validieren
  • Expliziter Review-Schritt im Prozess: KI-Vorschlag → RA-Review → Freigabe durch verantwortliche Person
  • Findings-Datenbank von Tag 1 an pflegen — nicht als Nachgedanke

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Dokumenten-InventurWoche 1–3Bestehende Akte inventarisieren, veraltete Versionen aussondern, “Mastery Documents” festlegenMehr Verwirrung als erwartet — mehrere parallele Versionszweige vom letzten Berater
Plattformwahl und ValidierungsplanungWoche 2–4Tool-Entscheidung, Validierungsplan erstellen, DatenschutzprüfungValidierungsanforderungen werden unterschätzt — externe Unterstützung einplanen
Indexierung und KonfigurationWoche 4–8Dokumente einlesen, RAG-Konfiguration, Zugriffskontrolle einrichtenGescannte PDFs ohne Textlayer — OCR-Nachbearbeitung nötig
Testphase mit historischem Findings LetterWoche 7–10Vergangene Findings-Runde als Testfall verwenden, Qualität der Vorschläge prüfenSystem findet relevante Abschnitte nicht — Indexierung der betroffenen Dokumentkategorie unvollständig
Pilotbetrieb (nächster echter Findings Letter)Woche 10–16Erstes reales Findings Letter mit KI-Unterstützung bearbeiten, Review-Prozess etablierenKI-Vorschlag wird ohne Review übernommen — klaren Prozess kommunizieren
Produktivbetrieb und Findings-DatenbankAb Woche 14Regulärer Betrieb, Datenbank systematisch befüllen, Validierungsdokumentation finalisierenDatenbank-Pflege fällt unter Zeitdruck weg — Verantwortlichkeit namentlich benennen

Häufige Einwände — und was dahintersteckt

“Unser NB erwartet fundierte Expertise — keine KI-Texte.” Richtig — und das Ziel ist nicht, KI-Texte einzureichen. Das Ziel ist, dass eine qualifizierte RA-Person fundierte Texte schneller fertigstellen kann, weil die Recherche-Arbeit erledigt ist. Der NB bewertet das Ergebnis, nicht den Entstehungsprozess. Was er bemerkt: Sind alle relevanten Normstellen korrekt referenziert? Sind die Nachweise vollständig? Ist die Antwort konsistent mit dem Rest des Dossiers? Genau das verbessert eine strukturierte KI-Unterstützung — nicht die Sprache, sondern die Vollständigkeit.

“Wir haben keine Ressourcen für ein weiteres Tool.” Das ist der reale Einwand, den es zu prüfen gilt — nicht zu widerlegen. Wenn dein RA-Team aus einer Person besteht und gerade drei Projekte parallel läuft, ist der Einführungsaufwand von 10–16 Wochen ein echtes Problem. Lösung: Mit NotebookLM starten — kein Setup, kein Vertrag, keine Validierungspflicht im Pilotmodus. Lade das nächste Findings Letter und fünf Kerndokumente der technischen Akte hoch und teste, ob das Prinzip funktioniert. Dieser Aufwand ist kleiner als ein halber Tag.

“Was, wenn das System falsch referenziert?” Das wird passieren — nicht häufig, aber es wird passieren. Ein RAG-System zieht den textuell ähnlichsten Abschnitt, nicht zwingend den regulatorisch relevantesten. Genau deshalb ist der Review-Schritt nicht optional. Das Gegenteil davon — manuell in 800 Dokumenten suchen — produziert mehr Fehler, nur langsamer und weniger sichtbar. Die KI macht Fehler mit Relevanz-Score, du siehst sie. Manuell bleiben Fehler unsichtbar bis zur nächsten Findings-Runde.

Woran du merkst, dass das zu dir passt

  • Du hast mindestens eine abgeschlossene oder laufende MDR-Zertifizierung — und die nächste Findings-Runde ist absehbar
  • Dein RA-Team bearbeitet jedes Findings Letter mit mehr als 20 Stunden Aufwand und hat trotzdem regelmäßig Fragen, die unklar bleiben
  • Deine technische Akte hat über 200 Dokumente — Querverweise manuell zu prüfen kostet bei jeder Runde mehrere Tage
  • Du zertifizierst mehrere Produkte gleichzeitig und willst das Wissen aus einem Projekt auf das nächste übertragen
  • Du hast eine RA-Funktion mit mindestens einer qualifizierten Person, die KI-Vorschläge verantwortungsbewusst prüfen und freigeben kann

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Weniger als fünf aktive oder geplante Produktzertifizierungen. Bei ein bis zwei Projekten ist der Einrichtungsaufwand (Dokumenten-Inventur, Plattformkonfiguration, Validierung) im Verhältnis zu hoch. Ein gut strukturiertes SharePoint mit klarer Benennung und ein disziplinierter Bearbeitungsprozess reicht. KI lohnt sich erst, wenn Volumen und Wiederholungseffekte die Investition rechtfertigen.

  2. Keine qualifizierte Person verfügbar, die KI-Vorschläge regulatorisch prüft. Ein KI-System ohne RA-Expertise ist im Findings-Letter-Kontext gefährlicher als keines — weil es selbstbewusst Antworten generiert, die für den NB-Reviewer erkennbar falsch sein können. Wer nicht sicher beurteilen kann, ob ein MDR-Annex-Verweis korrekt ist, sollte das System nicht einführen, bevor diese Expertise vorhanden ist.

  3. Technische Akte liegt nicht in strukturierter digitaler Form vor. Wenn die Kerndokumente in E-Mail-Anhängen, auf lokalen Laufwerken und in PDF-Scans ohne Textlayer verteilt sind, ist die Vorarbeit für die Indexierung so aufwendig, dass das Ergebnis nach 16 Wochen immer noch unvollständig ist. Erst die Dokumenten-Infrastruktur aufräumen — dann KI einführen.

Das kannst du heute noch tun

Öffne NotebookLM — kostenlos, kein Setup, kein Vertrag. Lade drei bis fünf Kerndokumente aus deiner technischen Akte hoch: die aktuelle Version des Technical Summary, den relevantesten GSPR-Nachweis-Abschnitt und das Risikoregister. Lade dann das letzte Findings Letter deines NB hoch.

Stelle die Frage: “Welche Stellen in den Dokumenten sind relevant für Frage 7?” Sieh, was das System zurückgibt. Das dauert 20 Minuten — und gibt dir ein ehrliches Bild davon, ob deine technische Akte strukturiert genug ist, damit ein KI-System sinnvoll damit arbeiten kann.

Für den strukturierten produktiven Einsatz findest du hier einen Ausgangspunkt:

Prompt: NB-Findings-Letter analysieren und Antwortgerüste erstellen
Du bist ein Regulatory Affairs Assistent. Du hast Zugriff auf die technische Dokumentation eines Medizinprodukts. Deine Aufgabe: Analysiere das folgende Findings Letter und beantworte für jede Frage: 1. Welche Abschnitte der technischen Dokumentation sind relevant? 2. Welche MDR-Anhänge oder ISO-Normen werden adressiert? 3. Welches Antwortgerüst wäre ein guter Ausgangspunkt? Wichtig: Du erstellst Entwürfe zur Überprüfung durch qualifizierte RA-Personen — keine finalen Antworten. Weise bei jeder Antwort auf Abschnitte hin, die du nicht eindeutig zuordnen kannst. [HIER DAS FINDINGS LETTER EINFÜGEN] [HIER DIE RELEVANTEN TECHNISCHEN DOKUMENTE ALS KONTEXT EINFÜGEN]
Funktioniert mit Claude, ChatGPT, NotebookLM
Beispiel-Ausgabe

Mitarbeiter:in

Frage 12: Bitte erläutern Sie, wie die in Anhang I, Abschnitt 14.4 geforderten Nachweise zur klinischen Leistungsfähigkeit in der vorliegenden klinischen Bewertung dokumentiert sind. Die eingereichte Bewertung beschreibt die Stand-der-Technik-Literatur, enthält jedoch keine explizite Verknüpfung mit den definierten klinischen Nutzen-Indikatoren aus Abschnitt 3.2 des Technical Summary.

KI-Assistent

Analyse Frage 12: Relevante Abschnitte in der technischen Dokumentation: • Clinical Evaluation Report (CER) v3.2, Abschnitt 5.4 "Clinical Performance" (Seiten 41–47) • Technical Summary v2.1, Abschnitt 3.2 "Clinical Benefit Indicators" (Seiten 12–14) • GSPR Checklist, Zeilen 14.4a–14.4c MDR-Bezug: Anhang I, Abschnitt 14.4 (klinische Leistungsfähigkeit); Anhang XIV (klinische Bewertung) Antwortgerüst (Entwurf — bitte durch RA-Person prüfen): "Die klinischen Leistungsnachweise zu Anhang I §14.4 sind im CER v3.2, Abschnitt 5.4 dokumentiert. [RA: Bitte prüfen, ob die explizite Verknüpfung zu den in Technical Summary §3.2 definierten Indikatoren (Endpunkt A, B, C) im CER hinreichend textuell hergestellt ist — falls nicht, muss CER-Abschnitt 5.4 ergänzt werden, bevor diese Antwort eingereicht wird.]" Offener Punkt: Das System findet die direkte Verknüpfung zwischen CER §5.4 und Technical Summary §3.2 nicht als explizite Tabelle oder Referenz. Manuell prüfen, ob diese Verknüpfung vorhanden ist oder nachgetragen werden muss. Quelle: CER v3.2 (PDF), Technical Summary v2.1 (DOCX)

Quellen & Methodik

  • MedTech Europe IVDR & MDR Survey Results 2024: Veröffentlicht Dezember 2024; 300+ Hersteller befragt. Zertifizierungsdauer 13–18 Monate (teils bis 24 Monate), 47,6 % der Großunternehmen mit reduzierten Innovationsprojekten in Europa. medtecheurope.org

  • GlobalRWC: “Common Notified-Body Findings in EU MDR Clinical Evaluation Reports” (2024): Klinische Bewertungen sind die häufigste Quelle von MDR-Mängelbescheiden, noch vor QMS- und Risikoklassifizierungs-Findings. globalrwc.com

  • Johner Institut: “Validating ChatGPT” (2024): Halluzinationsrisiko bei LLMs in regulatorischen Prozessen; Validierungspflicht für Software in QMS-Prozessen. blog.johner-institute.com

  • Eurodev: “Cost of Obtaining EU MDR Compliance” (2024): NB-Gebühren für komplexe Klasse-III-Produkte bis 180.000 USD; markteintrittsverzögerungsbasierter ROI-Rahmen. eurodev.com

  • Preisangaben Greenlight Guru, Qualio, Veeva Vault, TrackWise Digital: Veröffentlichte und marktübliche Tarifinformationen sowie Erfahrungswerte aus MDR-Beratungsprojekten (Stand Mai 2026).

  • MDR Anhang I (GSPR), MDR Anhang XIV: Verordnung (EU) 2017/745 in der aktuell gültigen Fassung. ISO 13485:2016 (Medizinprodukte — Qualitätsmanagementsysteme).


Du willst einschätzen, ob deine technische Akte reif genug für den KI-Einsatz ist, oder du stehst kurz vor einer Findings-Runde? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar