Post-Market Clinical Follow-up (PMCF) Studien effizient verwalten
KI automatisiert die Literaturdurchsuchung, extrahiert Endpunkte aus Registerdaten und generiert strukturierte PMCF-Evaluierungsberichte, und hält dabei den Audit-Trail für die Benannte Stelle lückenlos.
- Problem
- PMCF ist MDR-Pflicht für Klasse-IIb- und Klasse-III-Produkte, aber die manuelle Datenaggregation aus klinischen Registern, PubMed und Vigilanzdaten kostet Clinical-Affairs-Teams mehrere Monate, und ein fehlerhafter Bericht zieht Mängelrügen der Benannten Stelle nach sich.
- KI-Lösung
- LLM-gestützte Suchpipeline durchsucht klinische Datenbanken und Register, extrahiert relevante Endpunkte nach vordefinierten PICO-Kriterien, bewertet klinische Signale und generiert strukturierte PMCF-Evaluierungsberichte mit nachvollziehbarem Audit-Trail.
- Typischer Nutzen
- Erstellungszeit für den PMCF-Evaluierungsbericht von 6–10 Wochen auf 2–3 Wochen reduziert. Vollständigkeitslücken werden automatisch markiert. Notified-Body-ready Dokumentation vom ersten Entwurf an.
- Setup-Zeit
- 10–16 Wochen bis validierter, Notified-Body-ready Pilotbetrieb
- Kosteneinschätzung
- Tool-Lizenzen 600–15.000 €/Jahr; Einrichtung + Validierung einmalig 5.000–15.000 €
Es ist ein Donnerstagvormittag, 10:47 Uhr.
Markus Lenz, Regulatory Affairs Manager bei einem mittelständischen Orthopädiehersteller aus dem Schwarzwald, öffnet die E-Mail seiner Benannten Stelle. Der Betreff: „Deficiency Letter, PMCF Evaluation Report, Produktfamilie Hüftimplantat Typ A.” Dritte Zeile: „Die vorgelegten Daten sind quantitativ nicht ausreichend, um die Sicherheit und Leistung des Produktes im gegenwärtigen Stadium des Produktlebenszyklus gemäß MDR Anhang XIV Teil B zu bestätigen.” Frist für die Nachbesserung: acht Wochen.
Markus kennt das Gefühl. Der letzte PMCF-Evaluierungsbericht hat sein Team drei Monate gekostet. Zwei Medical Writers. Über 900 Literaturtreffer aus PubMed, Embase und dem Implantat-Register. Manuelle Datenextraktion in Excel. Zwei Runden interne Qualitätskontrolle. Und am Ende: ein Befund.
Das Problem ist nicht, dass sein Team schlecht gearbeitet hat. Das Problem ist die Struktur. Die Literaturdurchsuchung ist reproduzierbar, aber zeitaufwendig. Die Datenselektion folgt Kriterien, die jedes Mal neu formalisiert werden müssen. Die Texte der Evaluierungsberichte ähneln sich von Produkt zu Produkt, trotzdem schreibt jede:r Medical Writer von vorn.
PMCF ist keine inhaltliche Herausforderung. Es ist eine Prozessherausforderung.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
PMCF, Post-Market Clinical Follow-up nach MDR Anhang XIV Teil B, ist für Hersteller von Klasse-IIb- und Klasse-III-Medizinprodukten keine Option. Es ist eine laufende regulatorische Pflicht während des gesamten Produktlebenszyklus, solange das Produkt auf dem EU-Markt ist.
Was das in der Praxis bedeutet, hat eine Erhebung von Climedo Health unter europäischen Medizintechnikherstellern ermittelt: Mehr als die Hälfte der befragten Unternehmen investiert über fünf Stunden pro Woche allein in die EU-MDR-PMCF-Verwaltung, nur für laufende Dokumentation, nicht für Studienplanung oder Auswertung. Zwei Drittel haben mindestens eine neue Stelle geschaffen, nur um den PMCF-Anforderungen gerecht zu werden. Die MDR-Compliance kostet viele Hersteller mehr als fünf Prozent ihres Jahresumsatzes.
Der konkrete Engpass liegt in der Literaturrecherche. Ein PMCF-Evaluierungsbericht für ein Klasse-IIb-Implantat erfordert typischerweise:
- Eine systematische Datenbanksuche (PubMed, Embase, Cochrane, produktspezifische Register) mit 500–3.000 Treffern
- Dual-Reviewer-Screening nach PICO-definierten Ein- und Ausschlusskriterien
- Manuelle Datenextraktion aus 30–150 eingeschlossenen Studien
- Bewertung der Studienqualität, adverse-event-Analyse und Signalabgleich mit dem Risikoregister
- Strukturierte Berichterstellung nach MDR Anhang XIV und MEDDEV 2.12/2 Rev. 2
Wer das mit Tabellenkalkulationen und geteilten Word-Dokumenten angeht, was laut Climedo-Erhebung noch über zwei Drittel der Hersteller tun, verbringt mit diesem Zyklus sechs bis zehn Wochen pro Produktfamilie. Wer mehrere Klasse-III-Produkte hat, läuft dauerhaft dem nächsten Fristenkalender hinterher.
Das Risiko ist greifbar: Deficiency Letters, wie im Beispiel oben, sind unter Medizintechnikherstellern der häufigste Grund für verzögerte Rezertifizierungen. Laut einer Analyse von QServe Group zählen unzureichend begründete PMCF-Pläne und lückenhafte klinische Evidenz zu den fünf häufigsten Mängelgründen bei Notified-Body-Audits. Im schlimmsten Fall droht ein Serious Concern, und damit eine Aussetzung des CE-Zertifikats.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit KI-gestütztem PMCF-Workflow |
|---|---|---|
| Zeitaufwand pro PMCF-Evaluierungsbericht | 6–10 Wochen, 2–3 Mitarbeitende | 2–3 Wochen, 1–2 Mitarbeitende ¹ |
| Literaturtreffer-Screening (500–2.000 Treffer) | 3–6 Wochen manuell | 1–2 Wochen mit KI-Vorpriorisierung ¹ |
| Datenextraktion (30–150 Studien) | 2–4 Wochen manuell | 3–7 Tage mit KI-Extraktionsvorschlägen ² |
| Audit-Trail-Dokumentation | Manuell in Excel, fehleranfällig | Automatisch, Notified-Body-ready |
| Konsistenz über Produktfamilien | Stark variabel (je nach Bearbeiter:in) | Strukturell einheitlich durch Vorlagen |
| Reaktionszeit bei Deficiency Letter | Wochen (Kaltstart) | Schneller dank vorhandener Evidenzbasis |
¹ Basierend auf DistillerSR-Fallstudie (NuVasive/Dr. Bonnie H. Weiner): ~30 % Zeitreduktion bei CER-Literaturreviews; Philips-Fallstudie: >70 % schnelleres Screening. Eigene Konservativschätzung für PMCF-Kontext: 40–60 %. ² Erfahrungswert aus Praxisberichten medizintechnischer Clinical-Affairs-Teams; keine repräsentative Studie.
Der entscheidende Punkt ist nicht allein die Zeitersparnis. Es ist die Konsistenz: Ein KI-gestützter Workflow, der dieselben PICO-Kriterien, dieselbe Suchstrategie und dieselben Extraktionsfelder auf jede Produktfamilie anwendet, produziert einen Audit-Trail, den Benannte Stellen nachvollziehen können. Das ist strukturell wertvoller als ein manuell erstellter Bericht, den niemand außer dem Autor reproduzieren kann.
Einschätzung auf einen Blick
Zeitersparnis, hoch (4/5) Vier bis acht Wochen Literaturaufwand pro PMCF-Evaluierungsbericht lassen sich realistisch um 40–60 Prozent komprimieren, das sind zwei bis vier Wochen, die das Clinical-Affairs-Team für produktivere Aufgaben nutzen kann. Höher bewertet als Schulungsunterlagen oder Installationsprotokolle; etwas unterhalb der rein textbasierten Anwendungsfälle wie Technische Dokumentation oder Beschwerdemanagement, weil die manuelle Verifikation von KI-extrahierten Endpunkten nicht entfällt.
Kosteneinsparung, hoch (4/5) Die Referenz ist der Outsourcing-Preis: Ein PMCF-Evaluierungsbericht bei einem spezialisierten CRO kostet typischerweise 15.000–50.000 Euro pro Produktfamilie und Zyklus. Mit einem internen KI-gestützten Workflow sinkt dieser Aufwand auf Tool-Lizenzkosten plus internen Personalanteil, bei mehreren Produkten über mehrere Jahre rechnet sich das deutlich. Ähnlich stark bewertet wie die Technische Dokumentation MDR, bei der externe Beratungskosten den Vergleichswert setzen.
Schnelle Umsetzung, mittel (3/5) Bis zum validierten, Notified-Body-ready Pilotbetrieb vergehen realistisch zehn bis sechzehn Wochen: Suchstrategie dokumentieren, Tool-Workflow konfigurieren, mit echten Reviews testen, intern validieren und genehmigen lassen. Das ist der gleiche Schwierigkeitsgrad wie die meisten anderen regulatorisch getriebenen Anwendungsfälle im Medizintechnik-Portfolio, mehr als für rein textbasierte Aufgaben, weniger als für vollständige EDC-Systemimplementierungen.
ROI-Sicherheit, mittel (3/5) Der ROI ist real, aber er drückt sich hauptsächlich in Compliance-Schutz aus, nicht in direkten Umsatzgewinnen. Die regulatorische Pflicht besteht ohnehin; KI reduziert den Erfüllungsaufwand. Wie stark hängt davon ab, wie viele PMCF-pflichtige Produkte ihr habt, wie oft die Berichte aktualisiert werden müssen und ob ihr bisher auf CRO-Outsourcing angewiesen wart. Vergleichbar mit der Klinischen Bewertung MDR Anhang XIV: Nutzen messbar, aber kein Direkthebel auf den Deckungsbeitrag.
Skalierbarkeit, hoch (4/5) Der eingerichtete Workflow, Suchstrategie, Extraktionsfelder, Berichtsvorlage, ist auf jede weitere PMCF-pflichtige Produktfamilie übertragbar. Mit zehn Produkten spart der Ansatz zehnfach, ohne proportional mehr Setup-Aufwand. Nicht ganz maximal bewertet, weil jede neue Indikation oder Produktklasse eine Anpassung der PICO-Kriterien und Suchbegriffe erfordert, das ist Arbeit, aber keine Neuerfindung.
Richtwerte, stark abhängig von Anzahl der PMCF-pflichtigen Produkte, Komplexität der klinischen Evidenzlage und vorhandenem Clinical-Affairs-Know-how.
Was die KI-gestützte Literaturdurchsuchung konkret macht
Der Prozess lässt sich in vier Phasen unterteilen:
Phase 1: Systematische Literatursuche Ein Tool wie Elicit oder DistillerSR durchsucht PubMed, Embase, CINAHL und, bei implantierbaren Produkten, produktspezifische Register nach einer vordefinierten Suchstrategie. Die Suche ist nicht semantisch geraten, sondern nach PICO-Schema strukturiert: Population, Intervention, Comparator, Outcome. Das Ergebnis ist reproduzierbar und dokumentierbar, was Benannte Stellen explizit verlangen.
Phase 2: KI-gestütztes Titelscreening Aus 500–3.000 Treffern sind typischerweise 30–150 wirklich relevant. Ein LLM-basierter Screening-Algorithmus (in DistillerSR: „AI Rerank”) lernt aus den ersten manuellen Reviewer-Entscheidungen und priorisiert die verbleibenden Treffer nach Relevanzwahrscheinlichkeit. Das reduziert den manuellen Screeningaufwand um 35–70 Prozent, ohne Treffer zu löschen, du screenst weiterhin alle Records, aber in optimierter Reihenfolge.
Phase 3: Datenextraktion und Signalbewertung Aus den eingeschlossenen Studien extrahiert das System vorab definierte Datenpunkte: Stichprobengröße, Follow-up-Dauer, Primär- und Sekundärendpunkte, adverse events, Device-Deficiencies. Ein Generative KI-Modul (in DistillerSR: „Smart Evidence Extraction”) schlägt Werte für jedes Extraktionsfeld aus dem Volltext vor. Der Reviewer bestätigt oder korrigiert, jeder Schritt protokolliert mit Zeitstempel und Begründung.
Phase 4: Berichtsgenerierung Aus dem strukturierten Datensatz generiert das System einen Entwurf des PMCF-Evaluierungsberichts nach MDR-Anhang-XIV-Schema: Zusammenfassung der klinischen Evidenz, Signalbewertung, Abgleich mit dem Risikoregister, Schlussfolgerung zur Sicherheit und Leistung. Das ist kein Fertig-Bericht, ein Medical Writer muss interpretieren und freigeben. Aber es ist ein fundierter Entwurf statt eines leeren Dokuments.
Was dabei nicht ersetzt wird: Die regulatorische Bewertung, ob die kumulierte Evidenz ausreicht, Signale klinisch relevant sind, Sicherheitsbedenken eine Produktänderung erfordern, bleibt menschliche Fachentscheidung. KI beschleunigt den Datenzugang, nicht das Urteil.
Konkrete Werkzeuge, was wann passt
Für die systematische Literaturrecherche:
DistillerSR ist die Erstempfehlung für regulatorische Literaturreviews unter EU-MDR. Das Tool hat spezialisierte MDR/CER-Workflow-Templates, einen validierten KI-Algorithmus (AI Rerank, 47 % Screening-Aufwandsreduktion bei 95 % Recall), vollständige Audit-Trail-Dokumentation und ist laut Anbieter bei über 70 % der 20 größten Pharma- und Medizinproduktehersteller weltweit im Einsatz. NuVasive, ein Wirbelsäulenimplantat-Hersteller, berichtet von ca. 30 % Zeitreduktion pro CER-Submission. Philips erzielte in einer Fallstudie >70 % schnelleres Screening. Einschränkung: Preise nur auf Anfrage, US-Hosting, für sensible Patientenregister-Daten relevant.
Elicit ist günstiger (ab 49 USD/Monat) und für erste Sondierungen und Scoping-Searches gut geeignet. Wichtige Einschränkung für PMCF-Kontexte: Eine Vergleichsstudie (Lau et al., Cochrane Evidence Synthesis, 2025) stellte fest, dass Elicit bei klassischen Suchmethoden nur 17,6 % der letztlich eingeschlossenen Studien identifizierte. Für regulatorisch valide PMCF-Searches ist Elicit daher kein vollwertiger Ersatz für klassische Datenbanksuchen, es eignet sich als Ergänzung, nicht als alleinige Quelle.
Covidence bietet einen Cochrane-empfohlenen, strukturierten Dual-Reviewer-Workflow mit Konfliktdokumentation. Gut geeignet, wenn zwei unabhängige Reviewer Pflicht sind und PRISMA-Dokumentation für den Bericht erstellt werden soll. Einzelreview ab 339 USD/Jahr; kein MDR-spezifisches Template, aber PRISMA-Compliance ist ausreichend.
Für die Datenerhebung im Feld (PMCF-Surveys):
Climedo ist das einzige europäische EDC-System, das explizit für Medizintechnik-PMCF unter EU MDR entwickelt wurde. Digitale Patientenbefragungen per SMS/E-Mail/QR-Code, automatische Erinnerungen, GCP-konformer Audit-Trail, EU-Hosting und DSGVO-Konformität. In einer Herstellerbefragung stieg die Rücklaufquote nach Digitalisierung von 22 % auf 41 %. Preise auf Anfrage; Pilot-Optionen verfügbar.
Für komplexere klinische Studien im PMCF-Kontext (nicht nur Surveys, sondern kontrollierte Beobachtungsstudien mit mehreren Sites) sind Medidata Rave EDC oder Veeva Vault die etablierten Plattformen, mit dem entsprechend höheren Implementierungsaufwand und Enterprise-Preisen.
Für das Berichtsschreiben:
Sowohl Claude als auch ChatGPT lassen sich für die Berichtsgenerierung aus strukturierten Datensätzen einsetzen, mit einem sorgfältig konstruierten Prompt, der den MDR-Anhang-XIV-Berichtsrahmen vorgibt und explizit auf Halluzinationsschutz ausgelegt ist. Das erzeugt keinen publikationsfertigen Text, aber eine Rohfassung, die menschliche Überarbeitung drastisch beschleunigt. Für höhere Sicherheitsanforderungen empfiehlt sich der Einsatz über AWS Bedrock (EU-Region) statt der Consumer-Apps.
Wann welcher Ansatz:
- Erstrecherche / Scoping: Elicit (günstig, gut für Überblick)
- Regulatorisch valider Review, MDR-Audit-Trail nötig: DistillerSR
- Dual-Reviewer-PRISMA-Workflow mit Konfliktverwaltung: Covidence
- PMCF-Surveys und eCOA, EU-DSGVO-Pflicht: Climedo
- Komplexe Beobachtungsstudie mit Site-Management: Medidata Rave / Veeva Vault
Datenschutz und Datenhaltung
PMCF-Daten sind in zwei Kategorien zu trennen: bibliografische Literaturdaten (publizierte Paper aus PubMed, Embase, Registern) und patientenbezogene Primärdaten aus eigenen klinischen Studien oder Befragungen.
Für bibliografische Daten (der Löwenanteil der Literaturdatenbankarbeit): Hier werden keine Patientendaten verarbeitet, die Daten sind publiziert und anonymisiert. Die Nutzung von DistillerSR oder Elicit ist aus DSGVO-Sicht unkritisch, auch wenn beide in den USA hosten. Ein Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO ist sinnvoll, aber der Risikohorizont ist niedrig.
Für patientenbezogene Primärdaten aus PMCF-Surveys, Registern oder klinischen Sites gilt: Pseudonymisierung vor jeder Übertragung an externe Systeme ist Pflicht. Climedo speichert Daten auf EU-Servern und bietet GCP-konformen Audit-Trail, das ist die sauberste Lösung für DSGVO-konforme PMCF-Befragungen ohne Datentransfer in Drittstaaten. Medidata Rave und Veeva Vault bieten ebenfalls EU-Hosting-Optionen, die im Vertrag explizit vereinbart werden müssen.
Besonderheit für KI-Berichtsmodule: Wenn strukturierte Extraktionsdaten, auch ohne direkte Patientenidentifikation, an LLM-APIs wie die OpenAI-Consumer-App übergeben werden, bewegen sie sich in Richtung Grauzone. Für regulatorisch sensible Berichtsauswertungen empfiehlt sich der Einsatz über Enterprise-Zugänge (OpenAI Enterprise, AWS Bedrock, Azure OpenAI), die keine Trainingsdatennutzung der Eingaben und EU-Regionalverarbeitung garantieren.
Ethikkommissions-Anforderungen: Ob eine PMCF-Maßnahme einer Ethikkommissionsanmeldung bedarf, hängt vom Studiendesign ab. Reine Registerdatenauswertungen und anonymisierte Befragungen ohne Eingriff fallen meist nicht darunter, aber das muss je nach Bundesland und Einrichtung individuell geprüft werden.
Was es kostet, realistisch gerechnet
Einstiegskosten für Tools:
- Elicit Pro: ca. 49 USD/Monat (588 USD/Jahr), geeignet für erste Recherchen
- Covidence Single Review: 339 USD/Jahr pro aktivem Review
- DistillerSR: Enterprise-Preismodell auf Anfrage; typisch im mittleren vierstelligen bis niedrigen fünfstelligen Euro-Bereich pro Jahr
- Climedo: auf Anfrage; abhängig von Studienanzahl und Umfang; Pilot-Optionen verfügbar
Interne Einrichtungskosten:
- Suchstrategie dokumentieren und validieren: 3–5 Tage Aufwand Clinical Affairs + Regulatory
- Tool-Konfiguration (Extraktionsfelder, Berichtsvorlage): 1–2 Wochen
- Interne Validierung des Workflows: 2–4 Wochen (regulatorische Pflicht, wenn der Output in Notified-Body-Dokumentation einfließt)
Gesamtkosten im ersten Jahr: 15.000–30.000 Euro inklusive Tool-Lizenzen, interner Einrichtung und erster Validierungsrunde.
Was du dagegenstellen kannst: Der Marktpreis für ein PMCF-Evaluierungsbericht-Outsourcing bei einer spezialisierten CRO liegt typischerweise bei 15.000–50.000 Euro pro Produktfamilie und Zyklus, abhängig von Komplexität der Indikation, Menge der Treffer und Berichtstiefe. Wer drei oder mehr PMCF-pflichtige Produkte hat und den Zyklus jährlich oder zweijährlich durchläuft, amortisiert die Tool-Investition oft nach dem ersten oder zweiten Zyklus. Wer nur ein einziges Klasse-IIb-Produkt hat, sollte die Rechnung ehrlich aufmachen: Einmaliges Outsourcing ist dort womöglich günstiger als eigene Tool-Infrastruktur.
Was du nicht weglassen kannst: Der menschliche Medical-Writer-Anteil entfällt nicht. KI beschleunigt das Screening und erstellt Entwürfe, die regulatorische Entscheidung, was ausreichende klinische Evidenz bedeutet, liegt beim Fachpersonal. Plane mindestens 50 % des bisherigen Zeitaufwands weiterhin ein, die restlichen 50 % sind der realistische Einsparungsbereich.
Was passiert, wenn die klinischen Daten nicht ausreichen
Dieser Abschnitt gehört zum PMCF-Thema, obwohl er unangenehm ist.
Was ein Serious Concern ist: Eine Benannte Stelle kann während der Konformitätsbewertung oder einer Überwachungsaudit einen „Serious Concern” (schwerwiegenden Mangel) erklären, wenn die klinischen Daten qualitativ oder quantitativ nicht ausreichen, um Sicherheit und Leistung des Produktes während des gesamten Lebenszyklus zu bestätigen, wie in MDR Art. 61 und Anhang XIV Teil B gefordert. Das ist keine Routinekorrespondenz. Ein Serious Concern kann zum vorläufigen Aussetzen des CE-Zertifikats führen, was den Verkauf des Produkts in der EU de facto unmöglich macht.
Was häufig dazu führt:
- Ein PMCF-Plan, der keine direkte Verbindung zu den im CER identifizierten Datenlücken aufweist (laut QServe Group einer der fünf häufigsten Mängelgründe)
- Klinische Daten, die zwar vorhanden, aber nicht statistisch ausreichend für die Risikoprofilbewertung sind
- Fehlender Abgleich der PMCF-Ergebnisse mit dem Risikoregister und den Instructions for Use
- Unrealistische Zeitpläne im PMCF-Plan, die die Benannte Stelle als Hinweis auf fehlende Ernsthaftigkeit wertet
Was KI dabei helfen kann: KI beschleunigt die Evidenzaggregation und macht bestehende Datenlücken sichtbar, automatisch markierte Vollständigkeitslücken im Bericht sind ein echter Mehrwert. Ein gut konfiguriertes Extraktionssystem zeigt: „Für diesen klinischen Endpunkt haben wir aus der Literatur n=X Patienten aus fünf Studien, die Benannte Stelle wird das voraussichtlich für ausreichend/nicht ausreichend befunden.”
Was KI nicht leisten kann: Daten, die schlicht nicht existieren, kann keine KI erschaffen. Wenn das Produkt in einem dünnen klinischen Evidenzfeld operiert, neuartige Technologie, seltene Indikation, Produktentwicklung aus dem Äquivalenzweg, ist die Grundproblematik nicht ein Prozess-, sondern ein Evidenzproblem. In diesem Fall ist die richtige Antwort nicht ein besserer PMCF-Bericht, sondern eine eigene klinische Studie nach ISO 14155, mit Ethikkommissionsanmeldung, Studienprotokoll und Site-Management. Das ist eine andere Liga als das Literaturmanagement und kein Einsatzfeld für reine Schreib-KI.
Der Auslöser für einen Serious Concern ist selten ein schlechter Bericht. Er ist fast immer eine strukturell unzureichende Datenbasis. KI zeigt dieses Problem früher, aber sie löst es nicht.
Vier typische Einstiegsfehler
1. Elicit als vollständige Ersatz-Datenbanksuche einsetzen. Elicit ist ein nützliches Recherchetool, aber laut einer Cochrane-Vergleichsstudie (Lau et al., 2025) identifizierte es bei klassischen systematischen Reviews im Mittel nur 17,6 % der letztlich eingeschlossenen Studien. Für einen regulatorisch validen PMCF-Review nach MDR ist das kritisch: Ein KI-Tool, das fast fünf von sechs relevanten Studien übersieht, produziert keine ausreichende Evidenzbasis. Die Lösung ist nicht, Elicit zu verbannen, sondern es als Ergänzung zur klassischen Datenbanksuche (PubMed, Embase, Scopus) einzusetzen, nicht als Ersatz.
2. Den KI-generierten Berichtsentwurf ohne Verifikation einreichen. Die größte Fehlvorstellung bei KI-Berichtsgenerierung: Das System schreibt den Bericht, wir schicken ihn raus. In der Praxis halluziniert kein Literaturreview-Tool, wenn es auf echten Paper-Daten basiert, aber die Interpretation der Befunde erfordert regulatorische Expertise. Ein KI-extrahierter adverse-event-Rate-Wert aus einer Studie kann rechnerisch korrekt sein und dennoch in einem falschen klinischen Kontext stehen. Wer diese Verifikation überspringt, riskiert genau den Befund, den der Workflow eigentlich vermeiden soll: ein Deficiency Letter mit dem Hinweis auf unzureichende klinische Bewertung.
3. Den Workflow nicht intern validieren. Ein KI-gestützter Reviewprozess, der in Notified-Body-Dokumentation einfließt, ist ein computergestütztes System im GxP-Sinn. Das bedeutet: Ohne interne Validierung, dokumentierter Nachweis, dass der Workflow das tut, was er soll, reproduzierbar und nachvollziehbar, fehlt die regulatorische Grundlage für den Einsatz. Diese Validierung kostet zwei bis vier Wochen, ist aber nicht optional. Wer sie überspringt, baut die nächste Angriffsfläche für den Auditor.
4. Den PMCF-Workflow ohne Verbindung zum CER aufsetzen. Ein PMCF-Plan, der kein Mapping auf die im Clinical Evaluation Report (CER) identifizierten Datenlücken enthält, ist laut QServe Group „eine Non-Conformity, die nur darauf wartet, gefunden zu werden.” KI kann die Verbindung zwischen CER-Gap-Analyse und PMCF-Evidenzerhebung strukturieren, aber nur, wenn dieser Zusammenhang im Workflow explizit abgebildet ist. Ein automatisiertes System, das Literatur aggregiert, ohne zu wissen, welche Datenlücken es schließen soll, produziert riesige Berichte ohne regulatorischen Mehrwert.
Was mit der Einführung wirklich passiert, und was nicht
Der häufigste Widerstand kommt nicht von der Technik, sondern von zwei Richtungen.
Die regulatorischen Skeptiker: Clinical Affairs Teams, die seit Jahren mit einer bestimmten Suchstrategie und einem bewährten Berichtsformat arbeiten, reagieren auf KI-gestützte Workflows oft mit: „Wir wissen nicht, ob die Benannte Stelle das akzeptiert.” Das ist eine legitime Sorge, keine Ausrede. Die Lösung ist Transparenz im Bericht: Ein KI-gestützter Workflow, der seinen Screening-Prozess vollständig dokumentiert (welche Datenbanken, welche Suchbegriffe, welcher KI-Algorithmus mit welchen Parametern, welche menschliche Review-Ebene), ist für Benannte Stellen akzeptabler als eine undokumentierte Excel-Selektion. Die Akzeptanzfrage löst sich durch Dokumentationsqualität, nicht durch Tool-Vermeidung.
Die Qualitätssicherung: Wer für den PMCF-Bericht unterschreibt, will wissen, dass die Datenextraktion stimmt. Das ist das Richtige, und der Grund, warum regulatorisch akzeptable KI-Tools wie DistillerSR jeden KI-Vorschlag unter menschlicher Verifikationspflicht stellen. Diese Pflicht ist nicht ein Ineffizienzproblem des Tools, sondern die regulatorische Grundlage, die den Einsatz überhaupt ermöglicht. Wer das erklären kann, nimmt der Sorge die Schärfe.
Was in der Praxis hilft:
- Ersten Pilot-Review parallel zur manuellen Methode durchführen, beide Ergebnisse vergleichen, Unterschiede dokumentieren. Das schafft Vertrauen, nicht durch Überzeugung, sondern durch Evidenz.
- Die Benannte Stelle frühzeitig informieren, dass ein automatisiertes Screening-Tool eingesetzt wird, nicht um Erlaubnis zu fragen, sondern um proaktiv zu zeigen, dass der Audit-Trail vollständig ist.
- Einen internen SOP für den KI-gestützten PMCF-Workflow dokumentieren, bevor der erste regulatorisch verwendete Review startet.
Was nicht passiert: Der manuelle Medical Writer verschwindet nicht. Wer das erwartet, wird enttäuscht. KI beschleunigt den Prozess; sie übernimmt nicht die regulatorische Verantwortung. Wer das klar kommuniziert, vermeidet falsche Erwartungen in beide Richtungen.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Bestandsaufnahme & Planung | Woche 1–2 | PMCF-pflichtige Produktfamilien priorisieren, bestehende Suchstrategien sichten, Tool-Auswahl finalisieren | Mehr Produkte als erwartet, Scope zu früh zu groß; lieber mit einer Produktfamilie beginnen |
| Suchstrategie & Tool-Setup | Woche 3–5 | PICO-Kriterien formalisieren, Suchbegriffe mit Datenbankspezialisten abstimmen, Extraktionsfelder konfigurieren | Fehlende Expertise für PICO-Formalisierung, externe Beratung einplanen |
| Pilot-Review erste Produktfamilie | Woche 6–10 | Literaturdurchsuchung, KI-Screening, manuelle Verifikation, Datenextraktion, Berichtsentwurf erstellen | KI-Treffermenge weicht von manueller Erwartung ab, Ursache analysieren, Suchstrategie anpassen |
| Interne Validierung | Woche 10–14 | Workflow gegen SOPs prüfen, Audit-Trail dokumentieren, Freigabe durch RA-Leitung | Validierung dauert länger als geplant, kein Abkürzen; das ist regulatorisch nicht verhandelbar |
| Ausweitung auf weitere Produktfamilien | Ab Woche 14 | Suchstrategie anpassen, zweiten Review starten, Lessons Learned einfließen lassen | Tempoerwartung zu hoch, auch Folgereviews brauchen manuelle Verifikationszeit |
Häufige Einwände, und was dahintersteckt
„Wir wissen nicht, ob die Benannte Stelle KI-gestützte Reviews akzeptiert.” Benannte Stellen bewerten nicht das Tool, sondern den Audit-Trail und die Reproduzierbarkeit. Ein vollständig dokumentierter KI-Workflow, welche Datenbanken, welcher Algorithmus, welche menschliche Review-Ebene, ist in der Regel akzeptabler als ein undokumentierter manueller Prozess, bei dem nicht nachvollziehbar ist, nach welchen Kriterien Treffer ausgeschlossen wurden. Die Frage ist nicht „KI oder nicht?”, sondern „ist der Prozess transparent und reproduzierbar?”
„Wir haben nur ein PMCF-pflichtiges Produkt, lohnt sich das?” Ehrliche Antwort: Möglicherweise nicht. Ein einzelner Produktfamilien-Review mit einem CRO kostet 15.000–30.000 Euro, die Tool-Infrastruktur kostet in der Einrichtung ähnlich viel, mit dem Unterschied, dass die CRO sofort loslegen kann und ihr nicht monatelang aufbauen müsst. Der Business Case für interne KI-gestützte Workflows beginnt bei zwei bis drei PMCF-pflichtigen Produktfamilien, die regelmäßige Berichtszyklen haben.
„Unsere Medical Writer beherrschen den Prozess bereits sehr gut.” Stimmt, und das ist kein Argument gegen den Ansatz, sondern dafür. Ein:e erfahrene:r Medical Writer, der/die KI-Tools für Screening und Extraktion nutzt, ist deutlich produktiver als ein:e Medical Writer ohne diese Unterstützung. Der Einsatz von DistillerSR verändert den Job nicht, er entfernt den aufwendigsten, repetitivsten Teil davon.
Woran du merkst, dass das zu dir passt
- Du hast zwei oder mehr Klasse-IIb- oder Klasse-III-Produkte mit laufender PMCF-Pflicht und der nächste Berichtszyklus ist in weniger als sechs Monaten
- Dein Clinical-Affairs-Team verbringt mehrere Wochen pro Jahr mit manueller Literaturrecherche für PMCF-Berichte, und das Volumen wächst mit jedem neuen Produkt
- Ihr habt bereits einen CER und einen PMCF-Plan, der die Datenlücken benennt, aber die systematische Evidenzerhebung fehlt noch oder ist manuell kaum skalierbar
- Eine Benannte Stelle hat euch bereits Deficiency-Hinweise zu PMCF-Evidenz gegeben, und ihr wollt beim nächsten Zyklus proaktiv Vollständigkeit nachweisen können
- Ihr outsourct PMCF-Berichte an CROs für mehr als 20.000 Euro pro Zyklus, und wollt wissen, ob sich das internalisieren lässt
Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:
-
Unter zehn Mitarbeitenden ohne dediziertes Clinical-Affairs-Know-how. Der Einsatz von Tools wie DistillerSR setzt voraus, dass jemand Suchstrategien nach PICO formalisieren, Extraktionsfelder korrekt konfigurieren und Audit-Trails regulatorisch bewerten kann. Ohne diese Fachkompetenz produziert das Tool zwar Berichte, aber keine, die regulatorisch tragfähig sind. Wer kein Clinical-Affairs-Personal hat, braucht erst das Know-how, dann das Tool.
-
Nur ein einziges PMCF-pflichtiges Produkt mit niedrigem Risikoprofil (Klasse IIa, kein aktives Implantat). Der Setup-Aufwand für eine vollständig validierte KI-Workflow-Umgebung, Suchstrategie, Tool-Konfiguration, interne Validierung, SOP, rentiert sich nicht für einen einzigen Berichtszyklus alle drei Jahre. Hier ist CRO-Outsourcing wirtschaftlich sinnvoller.
-
Kein dokumentierter PMCF-Plan, der Datenlücken aus dem CER benennt. Ein KI-Tool beschleunigt die Evidenzerhebung für bereits definierte PMCF-Ziele. Wenn der PMCF-Plan fehlt, unvollständig oder nicht mit dem CER verknüpft ist, löst das Tool das Grundproblem nicht, es beschleunigt lediglich die Produktion eines regulatorisch unzureichenden Berichts. Erst den Plan in Ordnung bringen, dann das Tool einsetzen.
Das kannst du heute noch tun
Öffne Elicit, kostenlos, kein Setup, sofort nutzbar. Formuliere die PMCF-Kernfrage für ein eurer Produkte als englische Forschungsfrage (Beispiel: „What are the complication rates and clinical outcomes of [device type] in [target population] at [follow-up period]?”) und lass Elicit die ersten 50–100 Paper dazu liefern, mit automatischer Extraktion von Stichprobengröße, Follow-up-Dauer und primären Outcomes.
Das dauert 20 Minuten. Was du danach weißt: Wie dünn oder dicht das klinische Evidenzfeld für dein Produkt ist, und ob der nächste PMCF-Review eher ein Screeningproblem (zu viele Treffer) oder ein Evidenzproblem (zu wenige valide Studien) haben wird.
Für den regulatorisch validen Einsatz brauchst du eine strukturierte Suchstrategie nach dem Muster unten:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Climedo Health, Erhebung zu PMCF-Management-Aufwand (2023): Mehr als die Hälfte der befragten Medizintechnikhersteller investiert über 5 Stunden/Woche in EU-MDR-PMCF-Verwaltung; MDR-Compliance kostet viele Hersteller mehr als 5 % des Jahresumsatzes; zwei Drittel haben mindestens eine neue Stelle geschaffen. Quelle: climedo.de/en/blog/how-to-cut-costs-when-managing-your-pmcf-studies/
- DistillerSR, NuVasive-Fallstudie (Monique Liston, Senior Medical Writer): Ca. 30 % Zeitreduktion pro CER-Literaturreview; Spreadsheet-Workflow als „fehleranfällig, nicht reproduzierbar, inkonsistent” beschrieben. Quelle: distillersr.com/resources/case-studies/nuvasive-streamlined-literature-reviews
- DistillerSR, Philips-Fallstudie: >70 % schnelleres Screening für CER-Submissions. Quelle: distillersr.com/industries/medical-devices
- Lau et al. (2025), Cochrane Evidence Synthesis and Methods: Vergleich Elicit AI vs. klassische Literatursuche in vier Fallstudien; Elicit identifizierte im Mittel nur 17,6 % der final eingeschlossenen Studien. Quelle: onlinelibrary.wiley.com/doi/full/10.1002/cesm.70050
- QServe Group, „Top 5 Reasons PMCF Plans Fail Under MDR” (2024): PMCF-Pläne ohne Mapping zu CER-Datenlücken als häufigste Mängelursache bei Notified-Body-Audits. Quelle: qservegroup.com/blog/top-5-reasons-pmcf-plans-fail-under-mdr
- MDR Anhang XIV Teil B: Regulatorische Grundlage für PMCF-Anforderungen bei Klasse-IIb- und Klasse-III-Produkten. Verordnung (EU) 2017/745 des Europäischen Parlaments und des Rates (aktuelle Fassung).
- CRO-Preisvergleich: Erfahrungswerte aus Branchenberichten und Hersteller-Aussagen; keine repräsentative Erhebung. Bereich 15.000–50.000 Euro pro PMCF-Evaluierungsbericht entspricht der typischen Bandbreite für Klasse-IIb/III-Implantate; Einzel-Produkte mit wenig Evidenzaufwand können darunter liegen.
- Datenschutz: DSGVO Art. 28 (Auftragsverarbeitung); EU MDR Anhang XIV Teil B; ICH E6(R3) für klinische PMCF-Studien nach ISO 14155.
Du willst wissen, ob sich ein KI-gestützter PMCF-Workflow für dein Produktportfolio lohnt, oder ob CRO-Outsourcing in eurem Fall die bessere Wahl bleibt? Das rechnen wir gemeinsam durch.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Technische Dokumentation nach MDR erstellen
KI unterstützt bei der Erstellung technischer Dokumentationen gemäß EU MDR 2017/745. Strukturierung, Vollständigkeitsprüfung und Textgenerierung aus vorhandenen Daten.
Mehr erfahrenPost-Market Surveillance Berichte automatisieren
KI analysiert Felddaten, Beschwerden und Vigilanzmeldungen und erstellt strukturierte PMS-Berichte nach MDR-Anforderungen automatisch.
Mehr erfahrenUsability-Testing-Dokumentation strukturieren
KI strukturiert Usability-Testprotokolle nach IEC 62366 und generiert Bewertungsberichte aus Rohdaten der Nutzerstudien.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.