Notified Body Korrespondenz strukturieren
KI analysiert Fragen und Mängelbescheide vom Notified Body, priorisiert Bearbeitungspunkte und erstellt strukturierte Antwortvorlagen — damit 30-Tage-Fristen nicht zur Engstelle werden.
- Problem
- Mängelbescheide vom Notified Body enthalten oft 20–30 Einzelfragen, die innerhalb von 30 Tagen beantwortet sein müssen — mit Querverweisen auf MDR-Anhänge, technische Normen und vorherige Antworten, die niemand schnell findet.
- KI-Lösung
- KI verknüpft NB-Fragen automatisch mit den betroffenen Abschnitten der technischen Dokumentation, priorisiert nach Aufwand und Dringlichkeit, und generiert Antwortgerüste mit exakten Norm-Verweisen.
- Typischer Nutzen
- Bearbeitungszeit pro Findings-Runde um 40–60 % reduziert. Vollständigere Antworten durch automatische Querverweis-Prüfung. Kürzere Zertifizierungszyklen durch weniger Folgerunden.
- Setup-Zeit
- 10–16 Wochen bis produktiver Pilotbetrieb
- Kosteneinschätzung
- 15.000–40.000 € Einrichtung; ROI indirekt messbar
Es ist Montag, 8:14 Uhr.
Sandra Neumann öffnet ihr E-Mail-Postfach und sieht die Nachricht, auf die sie seit acht Wochen gewartet hat — und gefürchtet hat. Der Notified Body hat sein Findings Letter zu ihrem Klasse-IIb-Gerät verschickt. 23 Fragen, aufgeteilt in fünf Kategorien. Antwortfrist: 30 Tage.
Sie öffnet das Dokument. Frage 1 bis 6 sind handhabbar — sie kennt die Stellen in der technischen Dokumentation, die der NB meint. Frage 7 dagegen referenziert MDR Anhang I, Abschnitt 8.4, und verlangt einen Nachweis, den Sandra so nicht ablegt hat. Sie ist sich nicht sicher, ob der NB hier eine andere Interpretation von “performance” vs. “clinical performance” ansetzt als ihre Regulatory-Team-Leitung — oder ob er recht hat und das Dossier tatsächlich eine Lücke hat.
Sie öffnet ihre technische Akte. 847 Dokumente, verteilt über drei SharePoint-Ordner, eine veraltete Ablage auf dem Netzlaufwerk und einen ZIP-Archiv-Ordner vom letzten externen Berater. Frage 12 und Frage 19 beziehen sich auf Normen, die in mindestens acht verschiedenen Abschnitten des Dossiers relevant sind — aber wo genau? Das weiß sie nicht auswendig.
Fünf Tage später hat sie 18 Antworten fertig. Vier Fragen — darunter 7, 12 und 19 — stehen noch, weil sie zuerst alle betroffenen Abschnitte finden, querlesen und abstimmen muss. Das dauert pro Frage zwei bis vier Stunden.
Sechs Wochen nach der Einreichung folgt das Zweite Findings Letter: elf neue Fragen — drei davon direkt über Sandrinas Antworten aus der ersten Runde.
Das ist der “Findings Letter Loop”. Kein Ausnahmefall, sondern der Normalfall für Medizinprodukte-Hersteller, die unter EU MDR zertifizieren.
Das echte Ausmaß des Problems
Der MDR-Zertifizierungsprozess ist in Europa strukturell schwierig. Laut dem MedTech Europe IVDR & MDR Survey 2024 (veröffentlicht Dezember 2024, 300+ Hersteller befragt) liegt die durchschnittliche Gesamtdauer einer neuen MDR-Zertifizierung bei 13 bis 18 Monaten — in komplexeren Fällen mit QMS-Erst-Zertifizierung bis zu 24 Monate. 47,6 Prozent der befragten Großunternehmen gaben an, Innovationsprojekte in Europa zurückgestellt zu haben.
Was diese Dauer treibt, sind selten fehlende Dokumente am Anfang — es sind die Findings-Runden. Laut praktischer Erfahrung aus MDR-Projekten gibt es bei den meisten Klasse-IIa/IIb-Zertifizierungen mindestens zwei Findings-Runden, bei Klasse III oft drei oder mehr. Jede Runde kostet im Schnitt vier bis acht Wochen zusätzliche Laufzeit.
Gleichzeitig zeigt die GlobalRWC-Analyse häufiger NB-Findings (2024): Die häufigste Ursache für Mängelbescheide sind klinische Bewertungen — fehlende Stand-der-Technik-Abgrenzungen, unklare Äquivalenzargumente oder unzureichend begründete klinische Kenngrößen. Das Problem ist nicht, dass die Hersteller keine guten Geräte bauen. Es ist, dass die Dokumentation vorhandener Nachweise für den NB nicht schnell genug auffindbar und strukturiert präsentierbar ist.
Rechne das konkret durch: Ein typisches Klasse-IIb-Medizinprodukt mit 5.000 Euro monatlichem Umsatz im Zielmarkt verliert bei zwei Monate Verzögerung durch schleppende Findings-Antworten rund 10.000 Euro an Markteintrittszeitpunkt. Bei einem Gerät mit 200.000 Euro monatlichem Zielmarktpotenzial sind es schon 400.000 Euro — ohne die internen Personalkosten mitzuzählen.
Die Regulatory-Affairs-Funktion ist dabei strukturell überlastet: Die meisten mittelständischen Medtech-Unternehmen haben ein bis drei Personen im RA-Team, die gleichzeitig mehrere Zertifizierungsprojekte, Post-Market Surveillance, FSCA-Handhabung und Lieferantenqualifikation betreuen. Jede Findings-Runde, die länger als nötig dauert, tut weh.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit strukturierter KI-Unterstützung |
|---|---|---|
| Zeit für erste Durchsicht eines 25-Fragen-Findings-Letters | 3–5 Stunden | 30–60 Minuten (Kategorisierung + Verlinkung automatisch) |
| Anteil unbeantworteter Fragen bei erstem Abgabetermin | Typisch 3–6 Fragen offen wegen Recherche | Typisch 0–2 offen, da Quellen automatisch aufgefunden |
| Durchschnittliche Zeit pro Antwortausarbeitung | 2–4 Stunden (Suche + Formulierung + Review) | 45–75 Minuten (KI-Gerüst + Expertenprüfung + Freigabe) |
| Risiko von Widersprüchen zwischen Antworten | Hoch — keine Gesamtübersicht über Aussagen | Niedrig — KI prüft auf Konsistenz gegen vorherige Antworten |
| Institutionelles Lernen nach jeder Runde | Fragmentiert, in Köpfen | Strukturiert erfassbar als Datenbank für Folgeprojekte |
Eigene Erfahrungswerte aus RA-Projekten mit mittelständischen Medtech-Unternehmen. Keine repräsentative Studie.
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) Die Zeitersparnis ist eine der greifbarsten in dieser Branchenkategorie. Eine Findings-Runde mit 20–30 Fragen, die manuell 40–60 Stunden Bearbeitungszeit kostet, lässt sich mit strukturiertem KI-Einsatz auf 15–25 Stunden drücken — weil die KI den langwierigsten Teil übernimmt: das Suchen und Querverweisen innerhalb der technischen Akte. Nicht ganz maximal bewertet, weil der verbleibende Review-Aufwand durch regulatorische Fachleute nicht wegfällt und nicht abgekürzt werden sollte.
Kosteneinsparung — mittel (3/5) Die Einrichtungskosten liegen realistisch bei 15.000–40.000 Euro (Plattform + Konfiguration + initiale Indexierung der technischen Dokumentation). Die laufenden Kosten sind handhabbar, aber nicht trivial. Der Nutzen entsteht primär über den beschleunigten Zertifizierungsweg — und dieser ist schwerer direkt zu isolieren als etwa bei der Technischen Dokumentation nach MDR, wo Zeitersparnis pro Seite direkt messbar ist. Daher Mittelfeldpositionierung.
Schnelle Umsetzung — mittel (3/5) 10–16 Wochen bis zum produktiven Pilotbetrieb ist keine Expresslösung, aber für den regulatorischen Kontext handhabbar. Der Aufwand liegt in der strukturierten Aufbereitung der technischen Akte als Wissensbasis — was häufig auch die erste sinnvolle Dokumenten-Inventur seit Jahren ist. Das Maximum von 4 in dieser Branche ist für sehr schlanke Anwendungsfälle reserviert; NB-Korrespondenz braucht die regulatorische Vorbereitung.
ROI-Sicherheit — sehr hoch (5/5) Das ist der stärkste Hebel dieser Anwendung. Jeder Monat kürzerer Zertifizierungszeit ist direkt in entgangene Markteinnahmen übersetzbar — zwischen 20.000 Euro (kleines Spezialsegment) und 150.000 Euro (Mainstream-Medizinprodukt mit breitem Markt) monatlich. Eine beschleunigte Findings-Antwort, die eine zweite Runde verhindert, kann zwei bis vier Monate Verzögerung einsparen. Das rechtfertigt die Einrichtungskosten bei den meisten Herstellern im ersten Zertifizierungsprojekt.
Skalierbarkeit — mittel (3/5) Das System lässt sich auf alle Produktzulassungen des Unternehmens anwenden — aber nicht ohne Aufwand. Jede technische Akte braucht eine eigene Indexierung und Konfiguration. Teams, die gleichzeitig fünf Produkte zertifizieren, profitieren überproportional; ein Einzelprojekt-Hersteller weniger. Skalierbarkeit ist also stark vom Portfolio abhängig.
Richtwerte — stark abhängig von Produktklasse, NB-Spezifik und Reifegrad der technischen Dokumentation.
Was das System konkret macht
Der KI-Agent für NB-Korrespondenz hat im Kern vier Funktionen. Keine davon macht regulatorische Entscheidungen — das bleibt menschliche Aufgabe. Was die KI übernimmt, ist die strukturierte Informationslogistik:
1. Fragen-Kategorisierung und Priorisierung Das System liest das Findings Letter ein und klassifiziert jede Frage nach: betroffenem Anhang des MDR (z. B. Anhang I, II oder XIV), betroffenem Abschnitt der technischen Akte, geschätztem Bearbeitungsaufwand und Abhängigkeiten zwischen Fragen. Eine Frage, die eine andere voraussetzt, wird automatisch hinter diese gereiht — statt dass die RA-Managerin das mental jongliert.
Disclaimer: Die Klassifizierung ist eine Arbeitshilfe — nicht als rechtlich bindende Priorisierung zu interpretieren. Regulatorische Entscheidungen müssen durch qualifizierte Personen getroffen werden.
2. Automatische Querverweis-Suche Für jede Frage durchsucht das System die indexierte technische Akte — strukturiert als RAG-Wissensbasis — und zeigt die relevantesten Abschnitte mit Dokumentname, Seitenzahl und einem Relevanz-Score. Statt 45 Minuten Suche in 847 Dokumenten: 2 Minuten Überprüfung der vorgeschlagenen Quellenabschnitte.
3. Antwortgerüst-Generierung Auf Basis der gefundenen Quellabschnitte erstellt das System ein strukturiertes Antwortgerüst: Einleitungssatz, relevante Nachweise aus der Akte, empfohlene Norm-Verweise, offene Punkte, die noch manuell ergänzt werden müssen. Das Gerüst ist ein Ausgangspunkt — kein Endprodukt.
4. Konsistenz-Prüfung über Runden hinweg Wenn eine zweite Findings-Runde eingeht, vergleicht das System die neuen Fragen automatisch mit den vorherigen Antworten und markiert Stellen, an denen ein NB-Reviewer eine frühere Aussage hinterfragt. So wird sichtbar, wo das Team in Runde 2 konsistent bleiben muss und wo eine Präzisierung nötig ist.
Was das System nicht macht: Es bewertet nicht, ob eine Antwort regulatorisch ausreichend ist. Es prüft nicht, ob eine Äquivalenzbehauptung tragfähig ist. Es übernimmt keine Haftung. Diese Entscheidungen müssen durch qualifizierte RA-Fachleute gegengezeichnet werden — das ist keine Einschränkung der KI, sondern regulatorische Anforderung nach ISO 13485.
Konkrete Werkzeuge — was wann passt
Für diesen Anwendungsfall gibt es zwei Ansätze: integrierte eQMS-Plattformen mit NB-Correspondence-Modulen und generische LLM-Umgebungen, die mit der technischen Akte als Wissensbasis aufgebaut werden.
Greenlight Guru — für Hersteller mit dediziertem MDR-eQMS Greenlight Guru ist das einzige vollständig auf MDR/IVDR ausgerichtete eQMS. Design Controls, Risk Register und technisches File sind eng verknüpft — das macht es zur natürlichen Plattform für NB-Correspondence-Tracking, weil Fragen direkt an die betroffenen Dokument-Abschnitte gelinkt werden können. Kein direktes LLM-Modul für Antwortgenerierung, aber die strukturierte Datenlage ist die beste Voraussetzung für einen darüber gelegten KI-Agenten. Kosten: ca. 25.000–35.000 USD/Jahr. Geeignet für: Hersteller, die noch kein eQMS haben und von Anfang an MDR-konform aufbauen wollen.
Veeva Vault — für mittelgroße bis große Hersteller Vault RIM deckt Health-Authority-Korrespondenz inkl. NB-Correspondence ab, mit vollständigem Audit Trail und EU-Datenresidenz. Die Veeva AI Suite (seit Dezember 2025) erlaubt eigene LLM-Agenten auf Basis von Amazon Bedrock oder Azure. Realistisch: Vault ist für Hersteller ab 50 Mitarbeitenden und mehreren parallelen Produktzulassungen sinnvoll — darunter ist der Overhead zu groß. Kosten: ab 25.000 €/Modul/Jahr aufwärts. Geeignet für: etablierte Hersteller mit Pharma/Biotech-Umfeld oder Dual-Market (CE + FDA).
Qualio — für wachsende Teams mit Budget-Sensitivität Qualio ist die zugänglichste QMS-Plattform für Medtech-KMU — in 4–10 Wochen produktiv, EU-Hosting, ISO-13485-konform. Correspondence-Tracking über das Dokument-Control-Modul abbildbar; LLM-Anbindung über API-Integration möglich, aber nicht out-of-the-box. Kosten: Starter ab ca. 25.000 €/Jahr. Geeignet für: Teams mit 10–100 Mitarbeitenden, die kein Mega-eQMS brauchen.
Claude oder ChatGPT mit eigener Wissensbasis — für den schnellen Einstieg Wer keine eQMS-Plattform hat oder kurzfristig beginnen will: Die technische Akte als indexiertes Kontext-Set in ein LLM laden und direkt mit dem Findings Letter arbeiten. Dabei ist NotebookLM der zugänglichste Einstieg (kostenlos, kein Setup), geeignet für kleinere Akten bis ~200 Seiten. Für größere Dokumentationsmengen bietet sich Claude (200k Token Kontextfenster) oder ein benutzerdefiniertes GPT mit Microsoft 365 Copilot (SharePoint-Integration) an. Kosten: 0–30 €/Person/Monat. Geeignet für: Pilotphase vor eQMS-Entscheidung, oder Hersteller mit kleinen Portfolios.
Zusammenfassung: Wann welcher Ansatz
- Kein eQMS vorhanden, schneller Einstieg gewünscht → Claude / NotebookLM mit manuell indexierter Akte
- Wachsendes Team, ISO-13485-konformes QMS nötig → Qualio
- Dediziertes MDR-fokussiertes eQMS von Anfang an → Greenlight Guru
- Mittlerer bis großer Hersteller, Vault bereits im Einsatz → Veeva Vault AI Suite
- Microsoft 365 im Haus, SharePoint als Aktenlager → M365 Copilot als erster Test
Datenschutz und Datenhaltung
Technische Dokumentation nach MDR enthält sensible Geschäftsinformationen — Design-Details, Fertigungsverfahren, klinische Bewertungen, Sicherheitsnachweise. Sie enthält in der Regel keine patientenbezogenen Daten im DSGVO-Sinne, aber durchaus proprietäres Know-how und Betriebsgeheimnisse. Trotzdem gelten mehrere Anforderungen:
DSGVO-Relevanz: Sobald NB-Korrespondenz personenbezogene Daten enthält — etwa Namen von Prüfpersonen in klinischen Studien, Schulungsnachweise von Mitarbeitenden oder Qualifikationsdokumente von Auditoren — greift die DSGVO. In diesem Fall ist ein Auftragsverarbeitungsvertrag (AVV) mit dem LLM-Anbieter zwingend.
ISO 13485 — Validierungspflicht für QMS-Tools: Ein KI-Werkzeug, das in einem ISO-13485-geregelten Prozess eingesetzt wird, gilt als “Software in Support of QMS Process” und muss validiert werden. Das bedeutet: dokumentierter Validierungsplan, Testfälle, Abnahmekriterien. Das ist kein optionales Detail — es ist MDR-Konformitätsanforderung. Konsultiere dein Regulatory-Team oder einen externen Berater, bevor du ein KI-Tool in einen validierten QMS-Prozess integrierst.
Hosting nach Sensitivität entscheiden:
- NotebookLM: Google-Cloud, US-Hosting. Für öffentliche oder nicht-sensitive technische Dokumente vertretbar; für vollständige Design-History-Files nicht empfohlen ohne explizite Datenschutzprüfung.
- Claude via claude.ai: US-Hosting. Für produktiven Einsatz: Claude über AWS Bedrock (Frankfurt) — dann EU-Datenresidenz und AVV verfügbar.
- Greenlight Guru: US-Hosting. Für deutsche/EU-Hersteller mit strenger DSGVO-Auslegung prüfungsbedürftig.
- Veeva Vault: EU-Datenresidenz verfügbar — beste Wahl für sensitive regulatorische Dokumentation.
- Qualio: EU-Hosting verfügbar — GxP-konform und ISO-13485-validierbar.
Empfehlung: Beginne mit einer Datenschutz-Folgenabschätzung für den spezifischen Dokumentenbestand, den du dem KI-System zugänglich machen willst. Der Datenschutzbeauftragte muss vor Produktivbetrieb eingebunden sein — das ist keine Bürokratie, sondern MDR-Prüfungsrisiko.
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten
- Dokumenten-Inventur und strukturierte Aufbereitung der technischen Akte (intern): typisch 3–6 Wochen für 1–2 RA-Mitarbeitende
- Technische Einrichtung (Indexierung, RAG-Konfiguration, Anbindung ans Dokumentenmanagementsystem): extern 5.000–15.000 Euro bei IT-Partner oder Berater
- eQMS-Einrichtungskosten (sofern Qualio oder Greenlight Guru): 10.000–20.000 Euro zusätzlich
- Validierungsdokumentation (ISO 13485 konform): 3.000–8.000 Euro bei externer Unterstützung
Laufende Kosten (monatlich)
- LLM-Plattform (Claude Pro / ChatGPT Team): 20–30 Euro/Person/Monat
- eQMS-Lizenz (Qualio): ab ca. 2.000–3.000 Euro/Monat für kleine Teams
- Greenlight Guru: ca. 2.000–3.000 USD/Monat im Einstieg
- Veeva Vault: ab ca. 2.000 Euro/Monat für ein Modul
Wie du den ROI tatsächlich misst Der reale Beweis ist der Zertifizierungskalender: Wie viele Fragen bleiben beim nächsten Findings Letter noch offen? Wird eine zweite Runde ausgelöst? Vergleiche die Gesamtlaufzeit des nächsten Projekts mit dem vorherigen — das ist die ehrlichste Metrik. Nebenher: Wie viele Stunden verbringt dein RA-Team pro Findings-Letter? Führe das Protokoll vor und nach KI-Einführung.
Was du dagegenrechnen kannst Ein Klasse-IIb-Gerät mit anvisiertem EU-Markt von 80.000 Euro monatlichem Umsatz verliert bei zwei Monaten vermeidbarer Verzögerung 160.000 Euro Markterlös. Die Einrichtungskosten des KI-Systems (25.000–40.000 Euro) amortisieren sich bei einem Projekt. Wer drei oder mehr Produkte gleichzeitig zertifiziert, rechnet schneller. Orientierungswert — stark abhängig von Produktklasse, Markt und Preisgestaltung.
Drei typische Einstiegsfehler
1. Die gesamte technische Akte auf einmal indexieren — ohne Qualitätsprüfung. Der Reflex: Alle 847 Dokumente einlesen, dann ist das System vollständig. In der Praxis enthält jede gewachsene technische Akte drei bis fünf veraltete Versionen desselben Dokuments, widersprüchliche Norm-Referenzen aus zwei Zertifizierungsgenerationen und Dokumente, die der letzte externe Berater erstellt hat und deren Status niemand mehr kennt. Ein System, das auf diesem Chaos aufgebaut wird, gibt dem NB-Reviewer im schlimmsten Fall widersprüchliche Nachweise — das ist gefährlicher als kein System. Lösung: Erst Dokumenten-Inventur, dann Indexierung. Jede Dokumentenkategorie braucht eine definierte “Mastery Version” — die aktuelle, freigegebene Fassung. Alles andere bleibt außen vor.
2. KI-generierte Antworten ohne regulatorische Prüfung einreichen. Das KI-System erstellt Antwortgerüste, keine Antworten. Wer die generierten Texte ohne Prüfung durch eine qualifizierte RA-Person einreicht, riskiert mehreres: Das System kann Passagen aus der technischen Akte falsch zuordnen (Halluzination ist auch bei RAG-Systemen nicht ausgeschlossen). Es kann eine Norm-Aussage aus dem Kontext reißen. Es kann in Frage 12 eine Formulierung erzeugen, die der Antwort auf Frage 7 widerspricht. Der NB-Reviewer merkt das — und eskaliert. Lösung: Jede Antwort muss von einer qualifizierten RA-Person gelesen, verstanden und unterschrieben werden. Die KI spart Recherche-Zeit, nicht Entscheidungs-Verantwortung.
3. Das System einrichten, aber die Findings-Datenbank nicht aufbauen. Das ist der Fehler, der am teuersten bezahlt wird — weil er still passiert. Das System ist produktiv, die Findings-Letter-Antworten werden schneller. Aber niemand erfasst systematisch: Welche Fragen hat dieser NB immer wieder gestellt? Welche MDR-Interpretationsunterschiede gibt es zwischen verschiedenen Notified Bodies? Welche Normen-Auslegungen haben in der ersten Runde zu Folgefragen geführt? Nach 18 Monaten ist das Wissen der letzten drei Findings-Runden immer noch in Köpfen und E-Mail-Archiven — nicht im System. Das nächste Produkt startet bei null. Lösung: Von Anfang an eine strukturierte Findings-Datenbank anlegen (dazu mehr im nächsten Abschnitt).
Wie du aus NB-Findings-Mustern eine interne Datenbank aufbaust
Das ist der institutionelle Lernhebel, den die meisten Hersteller verschenken.
Jedes Findings Letter ist eine Wissensquelle: Welche Punkte findet dieser NB immer wieder? Welche Formulierungen in der technischen Akte lösen Folgefragen aus? Welche MDR-Anhang-Abschnitte sind für diesen NB-Reviewer schwerer Schwerpunkte?
Eine Findings-Datenbank muss keine aufwendige Software sein. Sie braucht vier Felder pro Eintrag:
| Feld | Inhalt |
|---|---|
| NB-Frage (Original) | Exakter Wortlaut aus dem Findings Letter |
| Kategorie | MDR-Anhang und Abschnitt, ISO-Norm, technischer Bereich |
| Antwort-Ansatz | Welcher Nachweis hat überzeugt — oder nicht überzeugt |
| Folgefrage ausgelöst? | Ja/Nein, wenn Ja: was war unklar |
Mit drei abgeschlossenen Findings-Runden hast du Muster: Du siehst, welche Formulierungen in Anhang I, Abschnitt 3 dein NB immer hinterfragt. Du siehst, welcher Norm-Verweis regelmäßig als unvollständig markiert wird. Du siehst, ob sich zwei NB-Reviewer grundlegend in ihrer Interpretation unterscheiden.
Das KI-System kann ab einer gewissen Größe dieser Datenbank automatisch neue Findings Letters gegen historische Muster abgleichen: “Diese Frage zu Anhang I, Abschnitt 5 wurde in der Form in zwei früheren Projekten gestellt — hier ist, was damals funktioniert hat und was nicht.”
Das macht jeden nachfolgenden Zertifizierungsprozess effizienter — nicht durch bessere KI, sondern durch institutionelles Gedächtnis, das endlich zugänglich ist.
Tipp: Schreib diese Findings-Datenbank so auf, dass sie auch für neue RA-Mitarbeitende direkt nutzbar ist. Regulatory Affairs ist eine der Branchen mit dem höchsten impliziten Wissen — und mit den höchsten Kosten bei Personalwechseln.
Was du vor dem KI-Einsatz validieren musst
Dieser Abschnitt ist nicht optional — er ist Teil der regulatorischen Realität für ISO-13485-konforme Hersteller.
Wenn du ein KI-Werkzeug in einen dokumentierten QMS-Prozess integrierst — also einen Prozess, der in deinem Qualitätsmanagement-System beschrieben ist und unter ISO 13485 fällt — gilt dieses Tool als “Software in Support of a Quality Management System Process” nach FDA 21 CFR Part 11 / EU MDR-Anhang I Anforderungen.
Was das in der Praxis bedeutet: Du musst vor dem produktiven Einsatz dokumentieren, dass das Werkzeug deinen Anforderungen entspricht. Das nennt sich Computersystem-Validierung (CSV) oder, moderner, Computer Software Assurance (CSA). Die Anforderungen umfassen mindestens:
- Validierungsplan: Welchen Zweck hat das Tool, welche Anforderungen muss es erfüllen?
- Testfälle: Welche Inputs führen zu welchen erwarteten Outputs? Wie verhält sich das System bei Grenzfällen?
- Abnahmeprotokoll: Hat das System die Testfälle bestanden?
- Risikobeurteilung: Was passiert, wenn das System falsche Vorschläge macht? Wie wird das erkannt?
Für LLM-basierte Tools ist die Validierung konzeptionell anspruchsvoller als für klassische Software — weil LLMs nicht deterministisch sind. Die Praxis-Lösung: Definiere den Scope eng. Das Tool erstellt “Antwort-Entwürfe zur Überprüfung durch qualifizierte Personen” — kein Endprodukt. Das reduziert die Risikokategorie und damit den Validierungsaufwand erheblich.
Dies ist keine Rechtsberatung. Die konkrete Validierungspflicht hängt von deinem spezifischen Prozess, deiner Produktklasse und dem regulatorischen Rahmen ab. Konsultiere deinen Regulatory Affairs Manager oder einen zugelassenen Berater. Stand: Mai 2026.
Was mit der Einführung wirklich passiert — und was nicht
Die größte Hürde ist selten die Technologie. Es sind die impliziten Annahmen über den Prozess.
“Unsere Dokumente sind ja schon digital.” Ja — aber digital bedeutet selten strukturiert. Eine SharePoint-Ablage mit 800 Dateien in verschachtelten Ordnern, ohne Versionskontrolle, mit fünf verschiedenen Benennungskonventionen ist nicht strukturiert. Das System findet Dokumente, aber die Relevanz-Scores werden zufällig — weil das System nicht weiß, welche Datei die aktuelle Version ist. Die erste echte Arbeit beim Rollout ist die Dokumenten-Inventur, nicht die KI-Konfiguration.
“Das macht die KI schon richtig.” Ein häufiges Muster in den ersten Wochen: Die RA-Managerin sieht einen KI-Vorschlag, der gut klingt, und übernimmt ihn fast unverändert. Nach zwei Findings-Runden merkt sie, dass das System systematisch einen Norm-Verweis falsch zugeordnet hat — weil ein Dokument mit ähnlichem Titel aber anderen Inhalt im Ranking oben lag. Die Lösung ist nicht technisch, sondern prozessual: Jede Antwort braucht eine explizite Review-Runde — mit Signatur und Datum. Nicht als Pflicht-Theater, sondern weil das der NB auch erwartet.
“Das lernt ja mit der Zeit.” Standard-RAG-Systeme lernen nicht von selbst — sie geben zurück, was in der Wissensbasis steht. Wenn eine NB-Frage in Runde 2 eine Antwort aus Runde 1 anzweifelt, muss jemand aktiv prüfen, ob die Wissensbasis den Fehler enthält — und ihn manuell korrigieren. Das ist keine KI-Schwäche, sondern eine Notwendigkeit in regulierten Prozessen. Planbare Wartung, kein Selbstläufer.
Was konkret hilft:
- Vor dem Rollout: Dokumenten-Inventur mit definierter “Mastery Version” pro Dokumenttyp
- Pilotstart mit einem abgeschlossenen Findings Letter aus der Vergangenheit — das System kann seine Vorschläge gegen bekannte Antworten validieren
- Expliziter Review-Schritt im Prozess: KI-Vorschlag → RA-Review → Freigabe durch verantwortliche Person
- Findings-Datenbank von Tag 1 an pflegen — nicht als Nachgedanke
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Dokumenten-Inventur | Woche 1–3 | Bestehende Akte inventarisieren, veraltete Versionen aussondern, “Mastery Documents” festlegen | Mehr Verwirrung als erwartet — mehrere parallele Versionszweige vom letzten Berater |
| Plattformwahl und Validierungsplanung | Woche 2–4 | Tool-Entscheidung, Validierungsplan erstellen, Datenschutzprüfung | Validierungsanforderungen werden unterschätzt — externe Unterstützung einplanen |
| Indexierung und Konfiguration | Woche 4–8 | Dokumente einlesen, RAG-Konfiguration, Zugriffskontrolle einrichten | Gescannte PDFs ohne Textlayer — OCR-Nachbearbeitung nötig |
| Testphase mit historischem Findings Letter | Woche 7–10 | Vergangene Findings-Runde als Testfall verwenden, Qualität der Vorschläge prüfen | System findet relevante Abschnitte nicht — Indexierung der betroffenen Dokumentkategorie unvollständig |
| Pilotbetrieb (nächster echter Findings Letter) | Woche 10–16 | Erstes reales Findings Letter mit KI-Unterstützung bearbeiten, Review-Prozess etablieren | KI-Vorschlag wird ohne Review übernommen — klaren Prozess kommunizieren |
| Produktivbetrieb und Findings-Datenbank | Ab Woche 14 | Regulärer Betrieb, Datenbank systematisch befüllen, Validierungsdokumentation finalisieren | Datenbank-Pflege fällt unter Zeitdruck weg — Verantwortlichkeit namentlich benennen |
Häufige Einwände — und was dahintersteckt
“Unser NB erwartet fundierte Expertise — keine KI-Texte.” Richtig — und das Ziel ist nicht, KI-Texte einzureichen. Das Ziel ist, dass eine qualifizierte RA-Person fundierte Texte schneller fertigstellen kann, weil die Recherche-Arbeit erledigt ist. Der NB bewertet das Ergebnis, nicht den Entstehungsprozess. Was er bemerkt: Sind alle relevanten Normstellen korrekt referenziert? Sind die Nachweise vollständig? Ist die Antwort konsistent mit dem Rest des Dossiers? Genau das verbessert eine strukturierte KI-Unterstützung — nicht die Sprache, sondern die Vollständigkeit.
“Wir haben keine Ressourcen für ein weiteres Tool.” Das ist der reale Einwand, den es zu prüfen gilt — nicht zu widerlegen. Wenn dein RA-Team aus einer Person besteht und gerade drei Projekte parallel läuft, ist der Einführungsaufwand von 10–16 Wochen ein echtes Problem. Lösung: Mit NotebookLM starten — kein Setup, kein Vertrag, keine Validierungspflicht im Pilotmodus. Lade das nächste Findings Letter und fünf Kerndokumente der technischen Akte hoch und teste, ob das Prinzip funktioniert. Dieser Aufwand ist kleiner als ein halber Tag.
“Was, wenn das System falsch referenziert?” Das wird passieren — nicht häufig, aber es wird passieren. Ein RAG-System zieht den textuell ähnlichsten Abschnitt, nicht zwingend den regulatorisch relevantesten. Genau deshalb ist der Review-Schritt nicht optional. Das Gegenteil davon — manuell in 800 Dokumenten suchen — produziert mehr Fehler, nur langsamer und weniger sichtbar. Die KI macht Fehler mit Relevanz-Score, du siehst sie. Manuell bleiben Fehler unsichtbar bis zur nächsten Findings-Runde.
Woran du merkst, dass das zu dir passt
- Du hast mindestens eine abgeschlossene oder laufende MDR-Zertifizierung — und die nächste Findings-Runde ist absehbar
- Dein RA-Team bearbeitet jedes Findings Letter mit mehr als 20 Stunden Aufwand und hat trotzdem regelmäßig Fragen, die unklar bleiben
- Deine technische Akte hat über 200 Dokumente — Querverweise manuell zu prüfen kostet bei jeder Runde mehrere Tage
- Du zertifizierst mehrere Produkte gleichzeitig und willst das Wissen aus einem Projekt auf das nächste übertragen
- Du hast eine RA-Funktion mit mindestens einer qualifizierten Person, die KI-Vorschläge verantwortungsbewusst prüfen und freigeben kann
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Weniger als fünf aktive oder geplante Produktzertifizierungen. Bei ein bis zwei Projekten ist der Einrichtungsaufwand (Dokumenten-Inventur, Plattformkonfiguration, Validierung) im Verhältnis zu hoch. Ein gut strukturiertes SharePoint mit klarer Benennung und ein disziplinierter Bearbeitungsprozess reicht. KI lohnt sich erst, wenn Volumen und Wiederholungseffekte die Investition rechtfertigen.
-
Keine qualifizierte Person verfügbar, die KI-Vorschläge regulatorisch prüft. Ein KI-System ohne RA-Expertise ist im Findings-Letter-Kontext gefährlicher als keines — weil es selbstbewusst Antworten generiert, die für den NB-Reviewer erkennbar falsch sein können. Wer nicht sicher beurteilen kann, ob ein MDR-Annex-Verweis korrekt ist, sollte das System nicht einführen, bevor diese Expertise vorhanden ist.
-
Technische Akte liegt nicht in strukturierter digitaler Form vor. Wenn die Kerndokumente in E-Mail-Anhängen, auf lokalen Laufwerken und in PDF-Scans ohne Textlayer verteilt sind, ist die Vorarbeit für die Indexierung so aufwendig, dass das Ergebnis nach 16 Wochen immer noch unvollständig ist. Erst die Dokumenten-Infrastruktur aufräumen — dann KI einführen.
Das kannst du heute noch tun
Öffne NotebookLM — kostenlos, kein Setup, kein Vertrag. Lade drei bis fünf Kerndokumente aus deiner technischen Akte hoch: die aktuelle Version des Technical Summary, den relevantesten GSPR-Nachweis-Abschnitt und das Risikoregister. Lade dann das letzte Findings Letter deines NB hoch.
Stelle die Frage: “Welche Stellen in den Dokumenten sind relevant für Frage 7?” Sieh, was das System zurückgibt. Das dauert 20 Minuten — und gibt dir ein ehrliches Bild davon, ob deine technische Akte strukturiert genug ist, damit ein KI-System sinnvoll damit arbeiten kann.
Für den strukturierten produktiven Einsatz findest du hier einen Ausgangspunkt:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
-
MedTech Europe IVDR & MDR Survey Results 2024: Veröffentlicht Dezember 2024; 300+ Hersteller befragt. Zertifizierungsdauer 13–18 Monate (teils bis 24 Monate), 47,6 % der Großunternehmen mit reduzierten Innovationsprojekten in Europa. medtecheurope.org
-
GlobalRWC: “Common Notified-Body Findings in EU MDR Clinical Evaluation Reports” (2024): Klinische Bewertungen sind die häufigste Quelle von MDR-Mängelbescheiden, noch vor QMS- und Risikoklassifizierungs-Findings. globalrwc.com
-
Johner Institut: “Validating ChatGPT” (2024): Halluzinationsrisiko bei LLMs in regulatorischen Prozessen; Validierungspflicht für Software in QMS-Prozessen. blog.johner-institute.com
-
Eurodev: “Cost of Obtaining EU MDR Compliance” (2024): NB-Gebühren für komplexe Klasse-III-Produkte bis 180.000 USD; markteintrittsverzögerungsbasierter ROI-Rahmen. eurodev.com
-
Preisangaben Greenlight Guru, Qualio, Veeva Vault, TrackWise Digital: Veröffentlichte und marktübliche Tarifinformationen sowie Erfahrungswerte aus MDR-Beratungsprojekten (Stand Mai 2026).
-
MDR Anhang I (GSPR), MDR Anhang XIV: Verordnung (EU) 2017/745 in der aktuell gültigen Fassung. ISO 13485:2016 (Medizinprodukte — Qualitätsmanagementsysteme).
Du willst einschätzen, ob deine technische Akte reif genug für den KI-Einsatz ist, oder du stehst kurz vor einer Findings-Runde? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Technische Dokumentation nach MDR erstellen
KI unterstützt bei der Erstellung technischer Dokumentationen gemäß EU MDR 2017/745. Strukturierung, Vollständigkeitsprüfung und Textgenerierung aus vorhandenen Daten.
Mehr erfahrenPost-Market Surveillance Berichte automatisieren
KI analysiert Felddaten, Beschwerden und Vigilanzmeldungen und erstellt strukturierte PMS-Berichte nach MDR-Anforderungen automatisch.
Mehr erfahrenUsability-Testing-Dokumentation strukturieren
KI strukturiert Usability-Testprotokolle nach IEC 62366 und generiert Bewertungsberichte aus Rohdaten der Nutzerstudien.
Mehr erfahren