Medizintechnik notified-bodymaengelbescheidkorrespondenz

Notified Body Korrespondenz strukturieren

KI analysiert Fragen und Mängelbescheide vom Notified Body, priorisiert Bearbeitungspunkte und erstellt strukturierte Antwortvorlagen, damit 30-Tage-Fristen nicht zur Engstelle werden.

⚡ Auf einen Blick

Problem: Mängelbescheide vom Notified Body enthalten oft 20–30 Einzelfragen, die innerhalb von 30 Tagen beantwortet sein müssen, mit Querverweisen auf MDR-Anhänge, technische Normen und vorherige Antworten, die niemand schnell findet.
KI-Lösung: RAG-System (Retrieval-Augmented Generation) verknüpft NB-Fragen automatisch mit den betroffenen Abschnitten der technischen Dokumentation, priorisiert nach Aufwand und Dringlichkeit, und generiert über ein LLM strukturierte Antwortgerüste mit exakten Norm-Verweisen.
Typischer Nutzen: Bearbeitungszeit pro Findings-Runde um 40–60 % reduziert. Vollständigere Antworten durch automatische Querverweis-Prüfung. Kürzere Zertifizierungszyklen durch weniger Folgerunden.
Setup-Zeit: 10–16 Wochen bis produktiver Pilotbetrieb
Kosteneinschätzung: 15.000–40.000 € Einrichtung; 20–3.000 €/Monat laufend je nach Plattform

Regulatory Correspondence KIDokumenten-Assistent mit technischer Akte

Worum geht's?

Es ist Montag, 8:14 Uhr.

Sandra Neumann öffnet ihr E-Mail-Postfach und sieht die Nachricht, auf die sie seit acht Wochen gewartet hat, und gefürchtet hat. Der Notified Body hat sein Findings Letter zu ihrem Klasse-IIb-Gerät verschickt. 23 Fragen, aufgeteilt in fünf Kategorien. Antwortfrist: 30 Tage.

Sie öffnet das Dokument. Frage 1 bis 6 sind handhabbar, sie kennt die Stellen in der technischen Dokumentation, die der NB meint. Frage 7 dagegen referenziert MDR Anhang I, Abschnitt 8.4, und verlangt einen Nachweis, den Sandra so nicht ablegt hat. Sie ist sich nicht sicher, ob der NB hier eine andere Interpretation von “performance” vs. “clinical performance” ansetzt als ihre Regulatory-Team-Leitung, oder ob er recht hat und das Dossier tatsächlich eine Lücke hat.

Sie öffnet ihre technische Akte. 847 Dokumente, verteilt über drei SharePoint-Ordner, eine veraltete Ablage auf dem Netzlaufwerk und einen ZIP-Archiv-Ordner vom letzten externen Berater. Frage 12 und Frage 19 beziehen sich auf Normen, die in mindestens acht verschiedenen Abschnitten des Dossiers relevant sind, aber wo genau? Das weiß sie nicht auswendig.

Fünf Tage später hat sie 18 Antworten fertig. Vier Fragen, darunter 7, 12 und 19, stehen noch, weil sie zuerst alle betroffenen Abschnitte finden, querlesen und abstimmen muss. Das dauert pro Frage zwei bis vier Stunden.

Sechs Wochen nach der Einreichung folgt das Zweite Findings Letter: elf neue Fragen, drei davon direkt über Sandrinas Antworten aus der ersten Runde.

Das ist der “Findings Letter Loop”. Kein Ausnahmefall, sondern der Normalfall für Medizinprodukte-Hersteller, die unter EU MDR zertifizieren.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Der MDR-Zertifizierungsprozess ist in Europa strukturell schwierig. Laut dem MedTech Europe IVDR & MDR Survey 2024 (veröffentlicht Dezember 2024, 300+ Hersteller befragt) liegt die durchschnittliche Gesamtdauer einer neuen MDR-Zertifizierung bei 13 bis 18 Monaten, in komplexeren Fällen mit QMS-Erst-Zertifizierung bis zu 24 Monate. 47,6 Prozent der befragten Großunternehmen gaben an, Innovationsprojekte in Europa zurückgestellt zu haben.

Was diese Dauer treibt, sind selten fehlende Dokumente am Anfang, es sind die Findings-Runden. Laut praktischer Erfahrung aus MDR-Projekten gibt es bei den meisten Klasse-IIa/IIb-Zertifizierungen mindestens zwei Findings-Runden, bei Klasse III oft drei oder mehr. Jede Runde kostet im Schnitt vier bis acht Wochen zusätzliche Laufzeit.

Gleichzeitig zeigt die GlobalRWC-Analyse häufiger NB-Findings (2024): Die häufigste Ursache für Mängelbescheide sind klinische Bewertungen, fehlende Stand-der-Technik-Abgrenzungen, unklare Äquivalenzargumente oder unzureichend begründete klinische Kenngrößen. Das Problem ist nicht, dass die Hersteller keine guten Geräte bauen. Es ist, dass die Dokumentation vorhandener Nachweise für den NB nicht schnell genug auffindbar und strukturiert präsentierbar ist.

Rechne das konkret durch: Ein typisches Klasse-IIb-Medizinprodukt mit 5.000 Euro monatlichem Umsatz im Zielmarkt verliert bei zwei Monate Verzögerung durch schleppende Findings-Antworten rund 10.000 Euro an Markteintrittszeitpunkt. Bei einem Gerät mit 200.000 Euro monatlichem Zielmarktpotenzial sind es schon 400.000 Euro, ohne die internen Personalkosten mitzuzählen.

Die Regulatory-Affairs-Funktion ist dabei strukturell überlastet: Die meisten mittelständischen Medtech-Unternehmen haben ein bis drei Personen im RA-Team, die gleichzeitig mehrere Zertifizierungsprojekte, Post-Market Surveillance, FSCA-Handhabung und Lieferantenqualifikation betreuen. Jede Findings-Runde, die länger als nötig dauert, tut weh.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI-Unterstützung	Mit strukturierter KI-Unterstützung
Zeit für erste Durchsicht eines 25-Fragen-Findings-Letters	3–5 Stunden	30–60 Minuten (Kategorisierung + Verlinkung automatisch)
Anteil unbeantworteter Fragen bei erstem Abgabetermin	Typisch 3–6 Fragen offen wegen Recherche	Typisch 0–2 offen, da Quellen automatisch aufgefunden
Durchschnittliche Zeit pro Antwortausarbeitung	2–4 Stunden (Suche + Formulierung + Review)	45–75 Minuten (KI-Gerüst + Expertenprüfung + Freigabe)
Risiko von Widersprüchen zwischen Antworten	Hoch, keine Gesamtübersicht über Aussagen	Niedrig, KI prüft auf Konsistenz gegen vorherige Antworten
Institutionelles Lernen nach jeder Runde	Fragmentiert, in Köpfen	Strukturiert erfassbar als Datenbank für Folgeprojekte

Eigene Erfahrungswerte aus RA-Projekten mit mittelständischen Medtech-Unternehmen. Keine repräsentative Studie.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5) Die Zeitersparnis ist eine der greifbarsten in dieser Branchenkategorie. Eine Findings-Runde mit 20–30 Fragen, die manuell 40–60 Stunden Bearbeitungszeit kostet, lässt sich mit strukturiertem KI-Einsatz auf 15–25 Stunden drücken, weil die KI den langwierigsten Teil übernimmt: das Suchen und Querverweisen innerhalb der technischen Akte. Nicht ganz maximal bewertet, weil der verbleibende Review-Aufwand durch regulatorische Fachleute nicht wegfällt und nicht abgekürzt werden sollte.

Kosteneinsparung, mittel (3/5) Die Einrichtungskosten liegen realistisch bei 15.000–40.000 Euro (Plattform + Konfiguration + initiale Indexierung der technischen Dokumentation). Die laufenden Kosten sind handhabbar, aber nicht trivial. Der Nutzen entsteht primär über den beschleunigten Zertifizierungsweg, und dieser ist schwerer direkt zu isolieren als etwa bei der Technischen Dokumentation nach MDR, wo Zeitersparnis pro Seite direkt messbar ist. Daher Mittelfeldpositionierung.

Schnelle Umsetzung, mittel (3/5) 10–16 Wochen bis zum produktiven Pilotbetrieb ist keine Expresslösung, aber für den regulatorischen Kontext handhabbar. Der Aufwand liegt in der strukturierten Aufbereitung der technischen Akte als Wissensbasis, was häufig auch die erste sinnvolle Dokumenten-Inventur seit Jahren ist. Das Maximum von 4 in dieser Branche ist für sehr schlanke Anwendungsfälle reserviert; NB-Korrespondenz braucht die regulatorische Vorbereitung.

ROI-Sicherheit, sehr hoch (5/5) Das ist der stärkste Hebel dieser Anwendung. Jeder Monat kürzerer Zertifizierungszeit ist direkt in entgangene Markteinnahmen übersetzbar, zwischen 20.000 Euro (kleines Spezialsegment) und 150.000 Euro (Mainstream-Medizinprodukt mit breitem Markt) monatlich. Eine beschleunigte Findings-Antwort, die eine zweite Runde verhindert, kann zwei bis vier Monate Verzögerung einsparen. Das rechtfertigt die Einrichtungskosten bei den meisten Herstellern im ersten Zertifizierungsprojekt.

Skalierbarkeit, mittel (3/5) Das System lässt sich auf alle Produktzulassungen des Unternehmens anwenden, aber nicht ohne Aufwand. Jede technische Akte braucht eine eigene Indexierung und Konfiguration. Teams, die gleichzeitig fünf Produkte zertifizieren, profitieren überproportional; ein Einzelprojekt-Hersteller weniger. Skalierbarkeit ist also stark vom Portfolio abhängig.

Richtwerte, stark abhängig von Produktklasse, NB-Spezifik und Reifegrad der technischen Dokumentation.

Was das System konkret macht

Der KI-Agent für NB-Korrespondenz hat im Kern vier Funktionen. Keine davon macht regulatorische Entscheidungen, das bleibt menschliche Aufgabe. Was die KI übernimmt, ist die strukturierte Informationslogistik:

1. Fragen-Kategorisierung und Priorisierung Das System liest das Findings Letter ein und klassifiziert jede Frage nach: betroffenem Anhang des MDR (z. B. Anhang I, II oder XIV), betroffenem Abschnitt der technischen Akte, geschätztem Bearbeitungsaufwand und Abhängigkeiten zwischen Fragen. Eine Frage, die eine andere voraussetzt, wird automatisch hinter diese gereiht, statt dass die RA-Managerin das mental jongliert.

Disclaimer: Die Klassifizierung ist eine Arbeitshilfe, nicht als rechtlich bindende Priorisierung zu interpretieren. Regulatorische Entscheidungen müssen durch qualifizierte Personen getroffen werden.

2. Automatische Querverweis-Suche Für jede Frage durchsucht das System die indexierte technische Akte, strukturiert als RAG-Wissensbasis, und zeigt die relevantesten Abschnitte mit Dokumentname, Seitenzahl und einem Relevanz-Score. Statt 45 Minuten Suche in 847 Dokumenten: 2 Minuten Überprüfung der vorgeschlagenen Quellenabschnitte.

3. Antwortgerüst-Generierung Auf Basis der gefundenen Quellabschnitte erstellt das System ein strukturiertes Antwortgerüst: Einleitungssatz, relevante Nachweise aus der Akte, empfohlene Norm-Verweise, offene Punkte, die noch manuell ergänzt werden müssen. Das Gerüst ist ein Ausgangspunkt, kein Endprodukt.

4. Konsistenz-Prüfung über Runden hinweg Wenn eine zweite Findings-Runde eingeht, vergleicht das System die neuen Fragen automatisch mit den vorherigen Antworten und markiert Stellen, an denen ein NB-Reviewer eine frühere Aussage hinterfragt. So wird sichtbar, wo das Team in Runde 2 konsistent bleiben muss und wo eine Präzisierung nötig ist.

Was das System nicht macht: Es bewertet nicht, ob eine Antwort regulatorisch ausreichend ist. Es prüft nicht, ob eine Äquivalenzbehauptung tragfähig ist. Es übernimmt keine Haftung. Diese Entscheidungen müssen durch qualifizierte RA-Fachleute gegengezeichnet werden, das ist keine Einschränkung der KI, sondern regulatorische Anforderung nach ISO 13485.

Konkrete Werkzeuge, was wann passt

Für diesen Anwendungsfall gibt es zwei Ansätze: integrierte eQMS-Plattformen mit NB-Correspondence-Modulen und generische LLM-Umgebungen, die mit der technischen Akte als Wissensbasis aufgebaut werden.

Greenlight Guru, für Hersteller mit dediziertem MDR-eQMS Greenlight Guru ist das einzige vollständig auf MDR/IVDR ausgerichtete eQMS. Design Controls, Risk Register und technisches File sind eng verknüpft, das macht es zur natürlichen Plattform für die NB-Correspondence-Nachverfolgung, weil Fragen direkt an die betroffenen Dokument-Abschnitte gelinkt werden können. Kein direktes LLM-Modul für Antwortgenerierung, aber die strukturierte Datenlage ist die beste Voraussetzung für einen darüber gelegten KI-Agenten. Kosten: ca. 25.000–35.000 USD/Jahr. Geeignet für: Hersteller, die noch kein eQMS haben und von Anfang an MDR-konform aufbauen wollen.

Veeva Vault, für mittelgroße bis große Hersteller Vault RIM deckt Health-Authority-Korrespondenz inkl. NB-Correspondence ab, mit vollständigem Audit Trail und EU-Datenresidenz. Die Veeva AI Suite (seit Dezember 2025) erlaubt eigene LLM-Agenten auf Basis von Amazon Bedrock oder Azure. Realistisch: Vault ist für Hersteller ab 50 Mitarbeitenden und mehreren parallelen Produktzulassungen sinnvoll, darunter ist der Overhead zu groß. Kosten: ab 25.000 €/Modul/Jahr aufwärts. Geeignet für: etablierte Hersteller mit Pharma/Biotech-Umfeld oder Dual-Market (CE + FDA).

Qualio, für wachsende Teams mit Budget-Sensitivität Qualio ist die zugänglichste QMS-Plattform für Medtech-KMU, in 4–10 Wochen produktiv, EU-Hosting, ISO-13485-konform. Correspondence-Nachverfolgung über das Dokument-Control-Modul abbildbar; LLM-Anbindung über API-Integration möglich, aber nicht out-of-the-box. Kosten: Starter ab ca. 25.000 €/Jahr. Geeignet für: Teams mit 10–100 Mitarbeitenden, die kein Mega-eQMS brauchen.

Claude oder ChatGPT mit eigener Wissensbasis, für den schnellen Einstieg Wer keine eQMS-Plattform hat oder kurzfristig beginnen will: Die technische Akte als indexiertes Kontext-Set in ein LLM laden und direkt mit dem Findings Letter arbeiten. Dabei ist NotebookLM der zugänglichste Einstieg (kostenlos, kein Setup), geeignet für kleinere Akten bis ~200 Seiten. Für größere Dokumentationsmengen bietet sich Claude (200k Token Kontextfenster) oder ein benutzerdefiniertes GPT mit Microsoft 365 Copilot (SharePoint-Integration) an. Kosten: 0–30 €/Person/Monat. Geeignet für: Pilotphase vor eQMS-Entscheidung, oder Hersteller mit kleinen Portfolios.

Zusammenfassung: Wann welcher Ansatz

Kein eQMS vorhanden, schneller Einstieg gewünscht → Claude / NotebookLM mit manuell indexierter Akte
Wachsendes Team, ISO-13485-konformes QMS nötig → Qualio
Dediziertes MDR-fokussiertes eQMS von Anfang an → Greenlight Guru
Mittlerer bis großer Hersteller, Vault bereits im Einsatz → Veeva Vault AI Suite
Microsoft 365 im Haus, SharePoint als Aktenlager → M365 Copilot als erster Test

Datenschutz und Datenhaltung

Technische Dokumentation nach MDR enthält sensible Geschäftsinformationen, Design-Details, Fertigungsverfahren, klinische Bewertungen, Sicherheitsnachweise. Sie enthält in der Regel keine patientenbezogenen Daten im DSGVO-Sinne, aber durchaus proprietäres Know-how und Betriebsgeheimnisse. Trotzdem gelten mehrere Anforderungen:

DSGVO-Relevanz: Sobald NB-Korrespondenz personenbezogene Daten enthält, etwa Namen von Prüfpersonen in klinischen Studien, Schulungsnachweise von Mitarbeitenden oder Qualifikationsdokumente von Auditoren, greift die DSGVO. In diesem Fall ist ein Auftragsverarbeitungsvertrag (AVV) mit dem LLM-Anbieter zwingend.

ISO 13485, Validierungspflicht für QMS-Tools: Ein KI-Werkzeug, das in einem ISO-13485-geregelten Prozess eingesetzt wird, gilt als “Software in Support of QMS Process” und muss validiert werden. Das bedeutet: dokumentierter Validierungsplan, Testfälle, Abnahmekriterien. Das ist kein optionales Detail, es ist MDR-Konformitätsanforderung. Konsultiere dein Regulatory-Team oder einen externen Berater, bevor du ein KI-Tool in einen validierten QMS-Prozess integrierst.

Hosting nach Sensitivität entscheiden:

NotebookLM: Google-Cloud, US-Hosting. Für öffentliche oder nicht-sensitive technische Dokumente vertretbar; für vollständige Design-History-Files nicht empfohlen ohne explizite Datenschutzprüfung.
Claude via claude.ai: US-Hosting. Für produktiven Einsatz: Claude über AWS Bedrock (Frankfurt), dann EU-Datenresidenz und AVV verfügbar.
Greenlight Guru: US-Hosting. Für deutsche/EU-Hersteller mit strenger DSGVO-Auslegung prüfungsbedürftig.
Veeva Vault: EU-Datenresidenz verfügbar, beste Wahl für sensitive regulatorische Dokumentation.
Qualio: EU-Hosting verfügbar, GxP-konform und ISO-13485-validierbar.

Empfehlung: Beginne mit einer Datenschutz-Folgenabschätzung für den spezifischen Dokumentenbestand, den du dem KI-System zugänglich machen willst. Der Datenschutzbeauftragte muss vor Produktivbetrieb eingebunden sein, das ist keine Bürokratie, sondern MDR-Prüfungsrisiko.

Was es kostet, realistisch gerechnet

Einmalige Einrichtungskosten

Dokumenten-Inventur und strukturierte Aufbereitung der technischen Akte (intern): typisch 3–6 Wochen für 1–2 RA-Mitarbeitende
Technische Einrichtung (Indexierung, RAG-Konfiguration, Anbindung ans Dokumentenmanagementsystem): extern 5.000–15.000 Euro bei IT-Partner oder Berater
eQMS-Einrichtungskosten (sofern Qualio oder Greenlight Guru): 10.000–20.000 Euro zusätzlich
Validierungsdokumentation (ISO 13485 konform): 3.000–8.000 Euro bei externer Unterstützung

Laufende Kosten (monatlich)

LLM-Plattform (Claude Pro / ChatGPT Team): 20–30 Euro/Person/Monat
eQMS-Lizenz (Qualio): ab ca. 2.000–3.000 Euro/Monat für kleine Teams
Greenlight Guru: ca. 2.000–3.000 USD/Monat im Einstieg
Veeva Vault: ab ca. 2.000 Euro/Monat für ein Modul

Wie du den ROI tatsächlich misst Der reale Beweis ist der Zertifizierungskalender: Wie viele Fragen bleiben beim nächsten Findings Letter noch offen? Wird eine zweite Runde ausgelöst? Vergleiche die Gesamtlaufzeit des nächsten Projekts mit dem vorherigen, das ist die ehrlichste Metrik. Nebenher: Wie viele Stunden verbringt dein RA-Team pro Findings-Letter? Führe das Protokoll vor und nach KI-Einführung.

Was du dagegenrechnen kannst Ein Klasse-IIb-Gerät mit anvisiertem EU-Markt von 80.000 Euro monatlichem Umsatz verliert bei zwei Monaten vermeidbarer Verzögerung 160.000 Euro Markterlös. Die Einrichtungskosten des KI-Systems (25.000–40.000 Euro) amortisieren sich bei einem Projekt. Wer drei oder mehr Produkte gleichzeitig zertifiziert, rechnet schneller. Orientierungswert, stark abhängig von Produktklasse, Markt und Preisgestaltung.

Drei typische Einstiegsfehler

1. Die gesamte technische Akte auf einmal indexieren, ohne Qualitätsprüfung. Der Reflex: Alle 847 Dokumente einlesen, dann ist das System vollständig. In der Praxis enthält jede gewachsene technische Akte drei bis fünf veraltete Versionen desselben Dokuments, widersprüchliche Norm-Referenzen aus zwei Zertifizierungsgenerationen und Dokumente, die der letzte externe Berater erstellt hat und deren Status niemand mehr kennt. Ein System, das auf diesem Chaos aufgebaut wird, gibt dem NB-Reviewer im schlimmsten Fall widersprüchliche Nachweise, das ist gefährlicher als kein System. Lösung: Erst Dokumenten-Inventur, dann Indexierung. Jede Dokumentenkategorie braucht eine definierte “Mastery Version”, die aktuelle, freigegebene Fassung. Alles andere bleibt außen vor.

2. KI-generierte Antworten ohne regulatorische Prüfung einreichen. Das KI-System erstellt Antwortgerüste, keine Antworten. Wer die generierten Texte ohne Prüfung durch eine qualifizierte RA-Person einreicht, riskiert mehreres: Das System kann Passagen aus der technischen Akte falsch zuordnen (Halluzination ist auch bei RAG-Systemen nicht ausgeschlossen). Es kann eine Norm-Aussage aus dem Kontext reißen. Es kann in Frage 12 eine Formulierung erzeugen, die der Antwort auf Frage 7 widerspricht. Der NB-Reviewer merkt das, und eskaliert. Lösung: Jede Antwort muss von einer qualifizierten RA-Person gelesen, verstanden und unterschrieben werden. Die KI spart Recherche-Zeit, nicht Entscheidungs-Verantwortung.

3. Das System einrichten, aber die Findings-Datenbank nicht aufbauen. Das ist der Fehler, der am teuersten bezahlt wird, weil er still passiert. Das System ist produktiv, die Findings-Letter-Antworten werden schneller. Aber niemand erfasst systematisch: Welche Fragen hat dieser NB immer wieder gestellt? Welche MDR-Interpretationsunterschiede gibt es zwischen verschiedenen Notified Bodies? Welche Normen-Auslegungen haben in der ersten Runde zu Folgefragen geführt? Nach 18 Monaten ist das Wissen der letzten drei Findings-Runden immer noch in Köpfen und E-Mail-Archiven, nicht im System. Das nächste Produkt startet bei null. Lösung: Von Anfang an eine strukturierte Findings-Datenbank anlegen (dazu mehr im nächsten Abschnitt).

Wie du aus NB-Findings-Mustern eine interne Datenbank aufbaust

Das ist der institutionelle Lernhebel, den die meisten Hersteller verschenken.

Jedes Findings Letter ist eine Wissensquelle: Welche Punkte findet dieser NB immer wieder? Welche Formulierungen in der technischen Akte lösen Folgefragen aus? Welche MDR-Anhang-Abschnitte sind für diesen NB-Reviewer schwerer Schwerpunkte?

Eine Findings-Datenbank muss keine aufwendige Software sein. Sie braucht vier Felder pro Eintrag:

Feld	Inhalt
NB-Frage (Original)	Exakter Wortlaut aus dem Findings Letter
Kategorie	MDR-Anhang und Abschnitt, ISO-Norm, technischer Bereich
Antwort-Ansatz	Welcher Nachweis hat überzeugt, oder nicht überzeugt
Folgefrage ausgelöst?	Ja/Nein, wenn Ja: was war unklar

Mit drei abgeschlossenen Findings-Runden hast du Muster: Du siehst, welche Formulierungen in Anhang I, Abschnitt 3 dein NB immer hinterfragt. Du siehst, welcher Norm-Verweis regelmäßig als unvollständig markiert wird. Du siehst, ob sich zwei NB-Reviewer grundlegend in ihrer Interpretation unterscheiden.

Das KI-System kann ab einer gewissen Größe dieser Datenbank automatisch neue Findings Letters gegen historische Muster abgleichen: “Diese Frage zu Anhang I, Abschnitt 5 wurde in der Form in zwei früheren Projekten gestellt, hier ist, was damals funktioniert hat und was nicht.”

Das macht jeden nachfolgenden Zertifizierungsprozess effizienter, nicht durch bessere KI, sondern durch institutionelles Gedächtnis, das endlich zugänglich ist.

Tipp: Schreib diese Findings-Datenbank so auf, dass sie auch für neue RA-Mitarbeitende direkt nutzbar ist. Regulatory Affairs ist eine der Branchen mit dem höchsten impliziten Wissen, und mit den höchsten Kosten bei Personalwechseln.

Was du vor dem KI-Einsatz validieren musst

Dieser Abschnitt ist nicht optional, er ist Teil der regulatorischen Realität für ISO-13485-konforme Hersteller.

Wenn du ein KI-Werkzeug in einen dokumentierten QMS-Prozess integrierst, also einen Prozess, der in deinem Qualitätsmanagement-System beschrieben ist und unter ISO 13485 fällt, gilt dieses Tool als “Software in Support of a Quality Management System Process” nach FDA 21 CFR Part 11 / EU MDR-Anhang I Anforderungen.

Was das in der Praxis bedeutet: Du musst vor dem produktiven Einsatz dokumentieren, dass das Werkzeug deinen Anforderungen entspricht. Das nennt sich Computersystem-Validierung (CSV) oder, moderner, Computer Software Assurance (CSA). Die Anforderungen umfassen mindestens:

Validierungsplan: Welchen Zweck hat das Tool, welche Anforderungen muss es erfüllen?
Testfälle: Welche Inputs führen zu welchen erwarteten Outputs? Wie verhält sich das System bei Grenzfällen?
Abnahmeprotokoll: Hat das System die Testfälle bestanden?
Risikobeurteilung: Was passiert, wenn das System falsche Vorschläge macht? Wie wird das erkannt?

Für LLM-basierte Tools ist die Validierung konzeptionell anspruchsvoller als für klassische Software, weil LLMs nicht deterministisch sind. Die Praxis-Lösung: Definiere den Scope eng. Das Tool erstellt “Antwort-Entwürfe zur Überprüfung durch qualifizierte Personen”, kein Endprodukt. Das reduziert die Risikokategorie und damit den Validierungsaufwand erheblich.

Dies ist keine Rechtsberatung. Die konkrete Validierungspflicht hängt von deinem spezifischen Prozess, deiner Produktklasse und dem regulatorischen Rahmen ab. Konsultiere deinen Regulatory Affairs Manager oder einen zugelassenen Berater. Stand: Mai 2026.

Was mit der Einführung wirklich passiert, und was nicht

Die größte Hürde ist selten die Technologie. Es sind die impliziten Annahmen über den Prozess.

“Unsere Dokumente sind ja schon digital.” Ja, aber digital bedeutet selten strukturiert. Eine SharePoint-Ablage mit 800 Dateien in verschachtelten Ordnern, ohne Versionskontrolle, mit fünf verschiedenen Benennungskonventionen ist nicht strukturiert. Das System findet Dokumente, aber die Relevanz-Scores werden zufällig, weil das System nicht weiß, welche Datei die aktuelle Version ist. Die erste echte Arbeit bei der Einführung ist die Dokumenten-Inventur, nicht die KI-Konfiguration.

“Das macht die KI schon richtig.” Ein häufiges Muster in den ersten Wochen: Die RA-Managerin sieht einen KI-Vorschlag, der gut klingt, und übernimmt ihn fast unverändert. Nach zwei Findings-Runden merkt sie, dass das System systematisch einen Norm-Verweis falsch zugeordnet hat, weil ein Dokument mit ähnlichem Titel aber anderen Inhalt im Ranking oben lag. Die Lösung ist nicht technisch, sondern prozessual: Jede Antwort braucht eine explizite Review-Runde, mit Signatur und Datum. Nicht als Pflicht-Theater, sondern weil das der NB auch erwartet.

“Das lernt ja mit der Zeit.” Standard-RAG-Systeme lernen nicht von selbst, sie geben zurück, was in der Wissensbasis steht. Wenn eine NB-Frage in Runde 2 eine Antwort aus Runde 1 anzweifelt, muss jemand aktiv prüfen, ob die Wissensbasis den Fehler enthält, und ihn manuell korrigieren. Das ist keine KI-Schwäche, sondern eine Notwendigkeit in regulierten Prozessen. Planbare Wartung, kein Selbstläufer.

Was konkret hilft:

Vor der Einführung: Dokumenten-Inventur mit definierter “Mastery Version” pro Dokumenttyp
Pilotstart mit einem abgeschlossenen Findings Letter aus der Vergangenheit, das System kann seine Vorschläge gegen bekannte Antworten validieren
Expliziter Review-Schritt im Prozess: KI-Vorschlag → RA-Review → Freigabe durch verantwortliche Person
Findings-Datenbank von Tag 1 an pflegen, nicht als Nachgedanke

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Dokumenten-Inventur	Woche 1–3	Bestehende Akte inventarisieren, veraltete Versionen aussondern, “Mastery Documents” festlegen	Mehr Verwirrung als erwartet, mehrere parallele Versionszweige vom letzten Berater
Plattformwahl und Validierungsplanung	Woche 2–4	Tool-Entscheidung, Validierungsplan erstellen, Datenschutzprüfung	Validierungsanforderungen werden unterschätzt, externe Unterstützung einplanen
Indexierung und Konfiguration	Woche 4–8	Dokumente einlesen, RAG-Konfiguration, Zugriffskontrolle einrichten	Gescannte PDFs ohne Textlayer, OCR-Nachbearbeitung nötig
Testphase mit historischem Findings Letter	Woche 7–10	Vergangene Findings-Runde als Testfall verwenden, Qualität der Vorschläge prüfen	System findet relevante Abschnitte nicht, Indexierung der betroffenen Dokumentkategorie unvollständig
Pilotbetrieb (nächster echter Findings Letter)	Woche 10–16	Erstes reales Findings Letter mit KI-Unterstützung bearbeiten, Review-Prozess etablieren	KI-Vorschlag wird ohne Review übernommen, klaren Prozess kommunizieren
Produktivbetrieb und Findings-Datenbank	Ab Woche 14	Regulärer Betrieb, Datenbank systematisch befüllen, Validierungsdokumentation finalisieren	Datenbank-Pflege fällt unter Zeitdruck weg, Verantwortlichkeit namentlich benennen

Häufige Einwände, und was dahintersteckt

“Unser NB erwartet fundierte Expertise, keine KI-Texte.” Richtig, und das Ziel ist nicht, KI-Texte einzureichen. Das Ziel ist, dass eine qualifizierte RA-Person fundierte Texte schneller fertigstellen kann, weil die Recherche-Arbeit erledigt ist. Der NB bewertet das Ergebnis, nicht den Entstehungsprozess. Was er bemerkt: Sind alle relevanten Normstellen korrekt referenziert? Sind die Nachweise vollständig? Ist die Antwort konsistent mit dem Rest des Dossiers? Genau das verbessert eine strukturierte KI-Unterstützung, nicht die Sprache, sondern die Vollständigkeit.

“Wir haben keine Ressourcen für ein weiteres Tool.” Das ist der reale Einwand, den es zu prüfen gilt, nicht zu widerlegen. Wenn dein RA-Team aus einer Person besteht und gerade drei Projekte parallel läuft, ist der Einführungsaufwand von 10–16 Wochen ein echtes Problem. Lösung: Mit NotebookLM starten, kein Setup, kein Vertrag, keine Validierungspflicht im Pilotmodus. Lade das nächste Findings Letter und fünf Kerndokumente der technischen Akte hoch und teste, ob das Prinzip funktioniert. Dieser Aufwand ist kleiner als ein halber Tag.

“Was, wenn das System falsch referenziert?” Das wird passieren, nicht häufig, aber es wird passieren. Ein RAG-System zieht den textuell ähnlichsten Abschnitt, nicht zwingend den regulatorisch relevantesten. Genau deshalb ist der Review-Schritt nicht optional. Das Gegenteil davon, manuell in 800 Dokumenten suchen, produziert mehr Fehler, nur langsamer und weniger sichtbar. Die KI macht Fehler mit Relevanz-Score, du siehst sie. Manuell bleiben Fehler unsichtbar bis zur nächsten Findings-Runde.

Woran du merkst, dass das zu dir passt

Du hast mindestens eine abgeschlossene oder laufende MDR-Zertifizierung, und die nächste Findings-Runde ist absehbar
Dein RA-Team bearbeitet jedes Findings Letter mit mehr als 20 Stunden Aufwand und hat trotzdem regelmäßig Fragen, die unklar bleiben
Deine technische Akte hat über 200 Dokumente, Querverweise manuell zu prüfen kostet bei jeder Runde mehrere Tage
Du zertifizierst mehrere Produkte gleichzeitig und willst das Wissen aus einem Projekt auf das nächste übertragen
Du hast eine RA-Funktion mit mindestens einer qualifizierten Person, die KI-Vorschläge verantwortungsbewusst prüfen und freigeben kann

Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:

Weniger als fünf aktive oder geplante Produktzertifizierungen. Bei ein bis zwei Projekten ist der Einrichtungsaufwand (Dokumenten-Inventur, Plattformkonfiguration, Validierung) im Verhältnis zu hoch. Ein gut strukturiertes SharePoint mit klarer Benennung und ein disziplinierter Bearbeitungsprozess reicht. KI lohnt sich erst, wenn Volumen und Wiederholungseffekte die Investition rechtfertigen.
Keine qualifizierte Person verfügbar, die KI-Vorschläge regulatorisch prüft. Ein KI-System ohne RA-Expertise ist im Findings-Letter-Kontext gefährlicher als keines, weil es selbstbewusst Antworten generiert, die für den NB-Reviewer erkennbar falsch sein können. Wer nicht sicher beurteilen kann, ob ein MDR-Annex-Verweis korrekt ist, sollte das System nicht einführen, bevor diese Expertise vorhanden ist.
Technische Akte liegt nicht in strukturierter digitaler Form vor. Wenn die Kerndokumente in E-Mail-Anhängen, auf lokalen Laufwerken und in PDF-Scans ohne Textlayer verteilt sind, ist die Vorarbeit für die Indexierung so aufwendig, dass das Ergebnis nach 16 Wochen immer noch unvollständig ist. Erst die Dokumenten-Infrastruktur aufräumen, dann KI einführen.

Das kannst du heute noch tun

Öffne NotebookLM, kostenlos, kein Setup, kein Vertrag. Lade drei bis fünf Kerndokumente aus deiner technischen Akte hoch: die aktuelle Version des Technical Summary, den relevantesten GSPR-Nachweis-Abschnitt und das Risikoregister. Lade dann das letzte Findings Letter deines NB hoch.

Stelle die Frage: “Welche Stellen in den Dokumenten sind relevant für Frage 7?” Sieh, was das System zurückgibt. Das dauert 20 Minuten, und gibt dir ein ehrliches Bild davon, ob deine technische Akte strukturiert genug ist, damit ein KI-System sinnvoll damit arbeiten kann.

Für den strukturierten produktiven Einsatz findest du hier einen Ausgangspunkt:

Prompt: NB-Findings-Letter analysieren und Antwortgerüste erstellen

Du bist ein Regulatory Affairs Assistent. Du hast Zugriff auf die technische Dokumentation eines Medizinprodukts. Deine Aufgabe: Analysiere das folgende Findings Letter und beantworte für jede Frage: 1. Welche Abschnitte der technischen Dokumentation sind relevant? 2. Welche MDR-Anhänge oder ISO-Normen werden adressiert? 3. Welches Antwortgerüst wäre ein guter Ausgangspunkt? Wichtig: Du erstellst Entwürfe zur Überprüfung durch qualifizierte RA-Personen, keine finalen Antworten. Weise bei jeder Antwort auf Abschnitte hin, die du nicht eindeutig zuordnen kannst. [HIER DAS FINDINGS LETTER EINFÜGEN] [HIER DIE RELEVANTEN TECHNISCHEN DOKUMENTE ALS KONTEXT EINFÜGEN]

Funktioniert mit Claude, ChatGPT, NotebookLM

Beispiel-Ausgabe

Mitarbeiter:in

Frage 12: Bitte erläutern Sie, wie die in Anhang I, Abschnitt 14.4 geforderten Nachweise zur klinischen Leistungsfähigkeit in der vorliegenden klinischen Bewertung dokumentiert sind. Die eingereichte Bewertung beschreibt die Stand-der-Technik-Literatur, enthält jedoch keine explizite Verknüpfung mit den definierten klinischen Nutzen-Indikatoren aus Abschnitt 3.2 des Technical Summary.

KI-Assistent

Analyse Frage 12: Relevante Abschnitte in der technischen Dokumentation: • Clinical Evaluation Report (CER) v3.2, Abschnitt 5.4 "Clinical Performance" (Seiten 41–47) • Technical Summary v2.1, Abschnitt 3.2 "Clinical Benefit Indicators" (Seiten 12–14) • GSPR Checklist, Zeilen 14.4a–14.4c MDR-Bezug: Anhang I, Abschnitt 14.4 (klinische Leistungsfähigkeit); Anhang XIV (klinische Bewertung) Antwortgerüst (Entwurf, bitte durch RA-Person prüfen): "Die klinischen Leistungsnachweise zu Anhang I §14.4 sind im CER v3.2, Abschnitt 5.4 dokumentiert. [RA: Bitte prüfen, ob die explizite Verknüpfung zu den in Technical Summary §3.2 definierten Indikatoren (Endpunkt A, B, C) im CER hinreichend textuell hergestellt ist, falls nicht, muss CER-Abschnitt 5.4 ergänzt werden, bevor diese Antwort eingereicht wird.]" Offener Punkt: Das System findet die direkte Verknüpfung zwischen CER §5.4 und Technical Summary §3.2 nicht als explizite Tabelle oder Referenz. Manuell prüfen, ob diese Verknüpfung vorhanden ist oder nachgetragen werden muss. Quelle: CER v3.2 (PDF), Technical Summary v2.1 (DOCX)

Quellen & Methodik

MedTech Europe IVDR & MDR Survey Results 2024: Veröffentlicht Dezember 2024; 300+ Hersteller befragt. Zertifizierungsdauer 13–18 Monate (teils bis 24 Monate), 47,6 % der Großunternehmen mit reduzierten Innovationsprojekten in Europa. medtecheurope.org
GlobalRWC: “Common Notified-Body Findings in EU MDR Clinical Evaluation Reports” (2024): Klinische Bewertungen sind die häufigste Quelle von MDR-Mängelbescheiden, noch vor QMS- und Risikoklassifizierungs-Findings. globalrwc.com
Johner Institut: “Validating ChatGPT” (2024): Halluzinationsrisiko bei LLMs in regulatorischen Prozessen; Validierungspflicht für Software in QMS-Prozessen. blog.johner-institute.com
Eurodev: “Cost of Obtaining EU MDR Compliance” (2024): NB-Gebühren für komplexe Klasse-III-Produkte bis 180.000 USD; markteintrittsverzögerungsbasierter ROI-Rahmen. eurodev.com
Preisangaben Greenlight Guru, Qualio, Veeva Vault, TrackWise Digital: Veröffentlichte und marktübliche Tarifinformationen sowie Erfahrungswerte aus MDR-Beratungsprojekten (Stand Mai 2026).
MDR Anhang I (GSPR), MDR Anhang XIV: Verordnung (EU) 2017/745 in der aktuell gültigen Fassung. ISO 13485:2016 (Medizinprodukte, Qualitätsmanagementsysteme).

Du willst einschätzen, ob deine technische Akte reif genug für den KI-Einsatz ist, oder du stehst kurz vor einer Findings-Runde? Meld dich, das klären wir gemeinsam in einem kurzen Gespräch.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Medizintechnik vergleichen

Weitere Use Cases

Technische Dokumentation nach MDR erstellen

KI unterstützt bei der Erstellung technischer Dokumentationen gemäß EU MDR 2017/745. Strukturierung, Vollständigkeitsprüfung und Textgenerierung aus vorhandenen Daten.

Mehr erfahren

Post-Market Surveillance Berichte automatisieren

KI analysiert Felddaten, Beschwerden und Vigilanzmeldungen und erstellt strukturierte PMS-Berichte nach MDR-Anforderungen automatisch.

Mehr erfahren

Usability-Testing-Dokumentation strukturieren

KI strukturiert Usability-Testprotokolle nach IEC 62366 und generiert Bewertungsberichte aus Rohdaten der Nutzerstudien.

Mehr erfahren

Zurück zu Medizintechnik

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

Notified Body Korrespondenz strukturieren

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was das System konkret macht

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Was es kostet, realistisch gerechnet

Drei typische Einstiegsfehler

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Wie du aus NB-Findings-Mustern eine interne Datenbank aufbaust

Was du vor dem KI-Einsatz validieren musst

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Technische Dokumentation nach MDR erstellen

Post-Market Surveillance Berichte automatisieren

Usability-Testing-Dokumentation strukturieren

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI