Zum Inhalt springen
Medizintechnik pmcfmdrklinische-evidenz

Post-Market Clinical Follow-up (PMCF) Studien effizient verwalten

KI automatisiert die Literaturdurchsuchung, extrahiert Endpunkte aus Registerdaten und generiert strukturierte PMCF-Evaluierungsberichte, und hält dabei den Audit-Trail für die Benannte Stelle lückenlos.

⚡ Auf einen Blick
Problem
PMCF ist MDR-Pflicht für Klasse-IIb- und Klasse-III-Produkte, aber die manuelle Datenaggregation aus klinischen Registern, PubMed und Vigilanzdaten kostet Clinical-Affairs-Teams mehrere Monate, und ein fehlerhafter Bericht zieht Mängelrügen der Benannten Stelle nach sich.
KI-Lösung
LLM-gestützte Suchpipeline durchsucht klinische Datenbanken und Register, extrahiert relevante Endpunkte nach vordefinierten PICO-Kriterien, bewertet klinische Signale und generiert strukturierte PMCF-Evaluierungsberichte mit nachvollziehbarem Audit-Trail.
Typischer Nutzen
Erstellungszeit für den PMCF-Evaluierungsbericht von 6–10 Wochen auf 2–3 Wochen reduziert. Vollständigkeitslücken werden automatisch markiert. Notified-Body-ready Dokumentation vom ersten Entwurf an.
Setup-Zeit
10–16 Wochen bis validierter, Notified-Body-ready Pilotbetrieb
Kosteneinschätzung
Tool-Lizenzen 600–15.000 €/Jahr; Einrichtung + Validierung einmalig 5.000–15.000 €
Clinical Data ExtractionKI-gestützter Regulatory-Assistent
Worum geht's?

Es ist ein Donnerstagvormittag, 10:47 Uhr.

Markus Lenz, Regulatory Affairs Manager bei einem mittelständischen Orthopädiehersteller aus dem Schwarzwald, öffnet die E-Mail seiner Benannten Stelle. Der Betreff: „Deficiency Letter, PMCF Evaluation Report, Produktfamilie Hüftimplantat Typ A.” Dritte Zeile: „Die vorgelegten Daten sind quantitativ nicht ausreichend, um die Sicherheit und Leistung des Produktes im gegenwärtigen Stadium des Produktlebenszyklus gemäß MDR Anhang XIV Teil B zu bestätigen.” Frist für die Nachbesserung: acht Wochen.

Markus kennt das Gefühl. Der letzte PMCF-Evaluierungsbericht hat sein Team drei Monate gekostet. Zwei Medical Writers. Über 900 Literaturtreffer aus PubMed, Embase und dem Implantat-Register. Manuelle Datenextraktion in Excel. Zwei Runden interne Qualitätskontrolle. Und am Ende: ein Befund.

Das Problem ist nicht, dass sein Team schlecht gearbeitet hat. Das Problem ist die Struktur. Die Literaturdurchsuchung ist reproduzierbar, aber zeitaufwendig. Die Datenselektion folgt Kriterien, die jedes Mal neu formalisiert werden müssen. Die Texte der Evaluierungsberichte ähneln sich von Produkt zu Produkt, trotzdem schreibt jede:r Medical Writer von vorn.

PMCF ist keine inhaltliche Herausforderung. Es ist eine Prozessherausforderung.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

PMCF, Post-Market Clinical Follow-up nach MDR Anhang XIV Teil B, ist für Hersteller von Klasse-IIb- und Klasse-III-Medizinprodukten keine Option. Es ist eine laufende regulatorische Pflicht während des gesamten Produktlebenszyklus, solange das Produkt auf dem EU-Markt ist.

Was das in der Praxis bedeutet, hat eine Erhebung von Climedo Health unter europäischen Medizintechnikherstellern ermittelt: Mehr als die Hälfte der befragten Unternehmen investiert über fünf Stunden pro Woche allein in die EU-MDR-PMCF-Verwaltung, nur für laufende Dokumentation, nicht für Studienplanung oder Auswertung. Zwei Drittel haben mindestens eine neue Stelle geschaffen, nur um den PMCF-Anforderungen gerecht zu werden. Die MDR-Compliance kostet viele Hersteller mehr als fünf Prozent ihres Jahresumsatzes.

Der konkrete Engpass liegt in der Literaturrecherche. Ein PMCF-Evaluierungsbericht für ein Klasse-IIb-Implantat erfordert typischerweise:

  • Eine systematische Datenbanksuche (PubMed, Embase, Cochrane, produktspezifische Register) mit 500–3.000 Treffern
  • Dual-Reviewer-Screening nach PICO-definierten Ein- und Ausschlusskriterien
  • Manuelle Datenextraktion aus 30–150 eingeschlossenen Studien
  • Bewertung der Studienqualität, adverse-event-Analyse und Signalabgleich mit dem Risikoregister
  • Strukturierte Berichterstellung nach MDR Anhang XIV und MEDDEV 2.12/2 Rev. 2

Wer das mit Tabellenkalkulationen und geteilten Word-Dokumenten angeht, was laut Climedo-Erhebung noch über zwei Drittel der Hersteller tun, verbringt mit diesem Zyklus sechs bis zehn Wochen pro Produktfamilie. Wer mehrere Klasse-III-Produkte hat, läuft dauerhaft dem nächsten Fristenkalender hinterher.

Das Risiko ist greifbar: Deficiency Letters, wie im Beispiel oben, sind unter Medizintechnikherstellern der häufigste Grund für verzögerte Rezertifizierungen. Laut einer Analyse von QServe Group zählen unzureichend begründete PMCF-Pläne und lückenhafte klinische Evidenz zu den fünf häufigsten Mängelgründen bei Notified-Body-Audits. Im schlimmsten Fall droht ein Serious Concern, und damit eine Aussetzung des CE-Zertifikats.

Mit vs. ohne KI, ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit KI-gestütztem PMCF-Workflow
Zeitaufwand pro PMCF-Evaluierungsbericht6–10 Wochen, 2–3 Mitarbeitende2–3 Wochen, 1–2 Mitarbeitende ¹
Literaturtreffer-Screening (500–2.000 Treffer)3–6 Wochen manuell1–2 Wochen mit KI-Vorpriorisierung ¹
Datenextraktion (30–150 Studien)2–4 Wochen manuell3–7 Tage mit KI-Extraktionsvorschlägen ²
Audit-Trail-DokumentationManuell in Excel, fehleranfälligAutomatisch, Notified-Body-ready
Konsistenz über ProduktfamilienStark variabel (je nach Bearbeiter:in)Strukturell einheitlich durch Vorlagen
Reaktionszeit bei Deficiency LetterWochen (Kaltstart)Schneller dank vorhandener Evidenzbasis

¹ Basierend auf DistillerSR-Fallstudie (NuVasive/Dr. Bonnie H. Weiner): ~30 % Zeitreduktion bei CER-Literaturreviews; Philips-Fallstudie: >70 % schnelleres Screening. Eigene Konservativschätzung für PMCF-Kontext: 40–60 %. ² Erfahrungswert aus Praxisberichten medizintechnischer Clinical-Affairs-Teams; keine repräsentative Studie.

Der entscheidende Punkt ist nicht allein die Zeitersparnis. Es ist die Konsistenz: Ein KI-gestützter Workflow, der dieselben PICO-Kriterien, dieselbe Suchstrategie und dieselben Extraktionsfelder auf jede Produktfamilie anwendet, produziert einen Audit-Trail, den Benannte Stellen nachvollziehen können. Das ist strukturell wertvoller als ein manuell erstellter Bericht, den niemand außer dem Autor reproduzieren kann.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5) Vier bis acht Wochen Literaturaufwand pro PMCF-Evaluierungsbericht lassen sich realistisch um 40–60 Prozent komprimieren, das sind zwei bis vier Wochen, die das Clinical-Affairs-Team für produktivere Aufgaben nutzen kann. Höher bewertet als Schulungsunterlagen oder Installationsprotokolle; etwas unterhalb der rein textbasierten Anwendungsfälle wie Technische Dokumentation oder Beschwerdemanagement, weil die manuelle Verifikation von KI-extrahierten Endpunkten nicht entfällt.

Kosteneinsparung, hoch (4/5) Die Referenz ist der Outsourcing-Preis: Ein PMCF-Evaluierungsbericht bei einem spezialisierten CRO kostet typischerweise 15.000–50.000 Euro pro Produktfamilie und Zyklus. Mit einem internen KI-gestützten Workflow sinkt dieser Aufwand auf Tool-Lizenzkosten plus internen Personalanteil, bei mehreren Produkten über mehrere Jahre rechnet sich das deutlich. Ähnlich stark bewertet wie die Technische Dokumentation MDR, bei der externe Beratungskosten den Vergleichswert setzen.

Schnelle Umsetzung, mittel (3/5) Bis zum validierten, Notified-Body-ready Pilotbetrieb vergehen realistisch zehn bis sechzehn Wochen: Suchstrategie dokumentieren, Tool-Workflow konfigurieren, mit echten Reviews testen, intern validieren und genehmigen lassen. Das ist der gleiche Schwierigkeitsgrad wie die meisten anderen regulatorisch getriebenen Anwendungsfälle im Medizintechnik-Portfolio, mehr als für rein textbasierte Aufgaben, weniger als für vollständige EDC-Systemimplementierungen.

ROI-Sicherheit, mittel (3/5) Der ROI ist real, aber er drückt sich hauptsächlich in Compliance-Schutz aus, nicht in direkten Umsatzgewinnen. Die regulatorische Pflicht besteht ohnehin; KI reduziert den Erfüllungsaufwand. Wie stark hängt davon ab, wie viele PMCF-pflichtige Produkte ihr habt, wie oft die Berichte aktualisiert werden müssen und ob ihr bisher auf CRO-Outsourcing angewiesen wart. Vergleichbar mit der Klinischen Bewertung MDR Anhang XIV: Nutzen messbar, aber kein Direkthebel auf den Deckungsbeitrag.

Skalierbarkeit, hoch (4/5) Der eingerichtete Workflow, Suchstrategie, Extraktionsfelder, Berichtsvorlage, ist auf jede weitere PMCF-pflichtige Produktfamilie übertragbar. Mit zehn Produkten spart der Ansatz zehnfach, ohne proportional mehr Setup-Aufwand. Nicht ganz maximal bewertet, weil jede neue Indikation oder Produktklasse eine Anpassung der PICO-Kriterien und Suchbegriffe erfordert, das ist Arbeit, aber keine Neuerfindung.

Richtwerte, stark abhängig von Anzahl der PMCF-pflichtigen Produkte, Komplexität der klinischen Evidenzlage und vorhandenem Clinical-Affairs-Know-how.

Was die KI-gestützte Literaturdurchsuchung konkret macht

Der Prozess lässt sich in vier Phasen unterteilen:

Phase 1: Systematische Literatursuche Ein Tool wie Elicit oder DistillerSR durchsucht PubMed, Embase, CINAHL und, bei implantierbaren Produkten, produktspezifische Register nach einer vordefinierten Suchstrategie. Die Suche ist nicht semantisch geraten, sondern nach PICO-Schema strukturiert: Population, Intervention, Comparator, Outcome. Das Ergebnis ist reproduzierbar und dokumentierbar, was Benannte Stellen explizit verlangen.

Phase 2: KI-gestütztes Titelscreening Aus 500–3.000 Treffern sind typischerweise 30–150 wirklich relevant. Ein LLM-basierter Screening-Algorithmus (in DistillerSR: „AI Rerank”) lernt aus den ersten manuellen Reviewer-Entscheidungen und priorisiert die verbleibenden Treffer nach Relevanzwahrscheinlichkeit. Das reduziert den manuellen Screeningaufwand um 35–70 Prozent, ohne Treffer zu löschen, du screenst weiterhin alle Records, aber in optimierter Reihenfolge.

Phase 3: Datenextraktion und Signalbewertung Aus den eingeschlossenen Studien extrahiert das System vorab definierte Datenpunkte: Stichprobengröße, Follow-up-Dauer, Primär- und Sekundärendpunkte, adverse events, Device-Deficiencies. Ein Generative KI-Modul (in DistillerSR: „Smart Evidence Extraction”) schlägt Werte für jedes Extraktionsfeld aus dem Volltext vor. Der Reviewer bestätigt oder korrigiert, jeder Schritt protokolliert mit Zeitstempel und Begründung.

Phase 4: Berichtsgenerierung Aus dem strukturierten Datensatz generiert das System einen Entwurf des PMCF-Evaluierungsberichts nach MDR-Anhang-XIV-Schema: Zusammenfassung der klinischen Evidenz, Signalbewertung, Abgleich mit dem Risikoregister, Schlussfolgerung zur Sicherheit und Leistung. Das ist kein Fertig-Bericht, ein Medical Writer muss interpretieren und freigeben. Aber es ist ein fundierter Entwurf statt eines leeren Dokuments.

Was dabei nicht ersetzt wird: Die regulatorische Bewertung, ob die kumulierte Evidenz ausreicht, Signale klinisch relevant sind, Sicherheitsbedenken eine Produktänderung erfordern, bleibt menschliche Fachentscheidung. KI beschleunigt den Datenzugang, nicht das Urteil.

Konkrete Werkzeuge, was wann passt

Für die systematische Literaturrecherche:

DistillerSR ist die Erstempfehlung für regulatorische Literaturreviews unter EU-MDR. Das Tool hat spezialisierte MDR/CER-Workflow-Templates, einen validierten KI-Algorithmus (AI Rerank, 47 % Screening-Aufwandsreduktion bei 95 % Recall), vollständige Audit-Trail-Dokumentation und ist laut Anbieter bei über 70 % der 20 größten Pharma- und Medizinproduktehersteller weltweit im Einsatz. NuVasive, ein Wirbelsäulenimplantat-Hersteller, berichtet von ca. 30 % Zeitreduktion pro CER-Submission. Philips erzielte in einer Fallstudie >70 % schnelleres Screening. Einschränkung: Preise nur auf Anfrage, US-Hosting, für sensible Patientenregister-Daten relevant.

Elicit ist günstiger (ab 49 USD/Monat) und für erste Sondierungen und Scoping-Searches gut geeignet. Wichtige Einschränkung für PMCF-Kontexte: Eine Vergleichsstudie (Lau et al., Cochrane Evidence Synthesis, 2025) stellte fest, dass Elicit bei klassischen Suchmethoden nur 17,6 % der letztlich eingeschlossenen Studien identifizierte. Für regulatorisch valide PMCF-Searches ist Elicit daher kein vollwertiger Ersatz für klassische Datenbanksuchen, es eignet sich als Ergänzung, nicht als alleinige Quelle.

Covidence bietet einen Cochrane-empfohlenen, strukturierten Dual-Reviewer-Workflow mit Konfliktdokumentation. Gut geeignet, wenn zwei unabhängige Reviewer Pflicht sind und PRISMA-Dokumentation für den Bericht erstellt werden soll. Einzelreview ab 339 USD/Jahr; kein MDR-spezifisches Template, aber PRISMA-Compliance ist ausreichend.

Für die Datenerhebung im Feld (PMCF-Surveys):

Climedo ist das einzige europäische EDC-System, das explizit für Medizintechnik-PMCF unter EU MDR entwickelt wurde. Digitale Patientenbefragungen per SMS/E-Mail/QR-Code, automatische Erinnerungen, GCP-konformer Audit-Trail, EU-Hosting und DSGVO-Konformität. In einer Herstellerbefragung stieg die Rücklaufquote nach Digitalisierung von 22 % auf 41 %. Preise auf Anfrage; Pilot-Optionen verfügbar.

Für komplexere klinische Studien im PMCF-Kontext (nicht nur Surveys, sondern kontrollierte Beobachtungsstudien mit mehreren Sites) sind Medidata Rave EDC oder Veeva Vault die etablierten Plattformen, mit dem entsprechend höheren Implementierungsaufwand und Enterprise-Preisen.

Für das Berichtsschreiben:

Sowohl Claude als auch ChatGPT lassen sich für die Berichtsgenerierung aus strukturierten Datensätzen einsetzen, mit einem sorgfältig konstruierten Prompt, der den MDR-Anhang-XIV-Berichtsrahmen vorgibt und explizit auf Halluzinationsschutz ausgelegt ist. Das erzeugt keinen publikationsfertigen Text, aber eine Rohfassung, die menschliche Überarbeitung drastisch beschleunigt. Für höhere Sicherheitsanforderungen empfiehlt sich der Einsatz über AWS Bedrock (EU-Region) statt der Consumer-Apps.

Wann welcher Ansatz:

  • Erstrecherche / Scoping: Elicit (günstig, gut für Überblick)
  • Regulatorisch valider Review, MDR-Audit-Trail nötig: DistillerSR
  • Dual-Reviewer-PRISMA-Workflow mit Konfliktverwaltung: Covidence
  • PMCF-Surveys und eCOA, EU-DSGVO-Pflicht: Climedo
  • Komplexe Beobachtungsstudie mit Site-Management: Medidata Rave / Veeva Vault

Datenschutz und Datenhaltung

PMCF-Daten sind in zwei Kategorien zu trennen: bibliografische Literaturdaten (publizierte Paper aus PubMed, Embase, Registern) und patientenbezogene Primärdaten aus eigenen klinischen Studien oder Befragungen.

Für bibliografische Daten (der Löwenanteil der Literaturdatenbankarbeit): Hier werden keine Patientendaten verarbeitet, die Daten sind publiziert und anonymisiert. Die Nutzung von DistillerSR oder Elicit ist aus DSGVO-Sicht unkritisch, auch wenn beide in den USA hosten. Ein Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO ist sinnvoll, aber der Risikohorizont ist niedrig.

Für patientenbezogene Primärdaten aus PMCF-Surveys, Registern oder klinischen Sites gilt: Pseudonymisierung vor jeder Übertragung an externe Systeme ist Pflicht. Climedo speichert Daten auf EU-Servern und bietet GCP-konformen Audit-Trail, das ist die sauberste Lösung für DSGVO-konforme PMCF-Befragungen ohne Datentransfer in Drittstaaten. Medidata Rave und Veeva Vault bieten ebenfalls EU-Hosting-Optionen, die im Vertrag explizit vereinbart werden müssen.

Besonderheit für KI-Berichtsmodule: Wenn strukturierte Extraktionsdaten, auch ohne direkte Patientenidentifikation, an LLM-APIs wie die OpenAI-Consumer-App übergeben werden, bewegen sie sich in Richtung Grauzone. Für regulatorisch sensible Berichtsauswertungen empfiehlt sich der Einsatz über Enterprise-Zugänge (OpenAI Enterprise, AWS Bedrock, Azure OpenAI), die keine Trainingsdatennutzung der Eingaben und EU-Regionalverarbeitung garantieren.

Ethikkommissions-Anforderungen: Ob eine PMCF-Maßnahme einer Ethikkommissionsanmeldung bedarf, hängt vom Studiendesign ab. Reine Registerdatenauswertungen und anonymisierte Befragungen ohne Eingriff fallen meist nicht darunter, aber das muss je nach Bundesland und Einrichtung individuell geprüft werden.

Was es kostet, realistisch gerechnet

Einstiegskosten für Tools:

  • Elicit Pro: ca. 49 USD/Monat (588 USD/Jahr), geeignet für erste Recherchen
  • Covidence Single Review: 339 USD/Jahr pro aktivem Review
  • DistillerSR: Enterprise-Preismodell auf Anfrage; typisch im mittleren vierstelligen bis niedrigen fünfstelligen Euro-Bereich pro Jahr
  • Climedo: auf Anfrage; abhängig von Studienanzahl und Umfang; Pilot-Optionen verfügbar

Interne Einrichtungskosten:

  • Suchstrategie dokumentieren und validieren: 3–5 Tage Aufwand Clinical Affairs + Regulatory
  • Tool-Konfiguration (Extraktionsfelder, Berichtsvorlage): 1–2 Wochen
  • Interne Validierung des Workflows: 2–4 Wochen (regulatorische Pflicht, wenn der Output in Notified-Body-Dokumentation einfließt)

Gesamtkosten im ersten Jahr: 15.000–30.000 Euro inklusive Tool-Lizenzen, interner Einrichtung und erster Validierungsrunde.

Was du dagegenstellen kannst: Der Marktpreis für ein PMCF-Evaluierungsbericht-Outsourcing bei einer spezialisierten CRO liegt typischerweise bei 15.000–50.000 Euro pro Produktfamilie und Zyklus, abhängig von Komplexität der Indikation, Menge der Treffer und Berichtstiefe. Wer drei oder mehr PMCF-pflichtige Produkte hat und den Zyklus jährlich oder zweijährlich durchläuft, amortisiert die Tool-Investition oft nach dem ersten oder zweiten Zyklus. Wer nur ein einziges Klasse-IIb-Produkt hat, sollte die Rechnung ehrlich aufmachen: Einmaliges Outsourcing ist dort womöglich günstiger als eigene Tool-Infrastruktur.

Was du nicht weglassen kannst: Der menschliche Medical-Writer-Anteil entfällt nicht. KI beschleunigt das Screening und erstellt Entwürfe, die regulatorische Entscheidung, was ausreichende klinische Evidenz bedeutet, liegt beim Fachpersonal. Plane mindestens 50 % des bisherigen Zeitaufwands weiterhin ein, die restlichen 50 % sind der realistische Einsparungsbereich.

Newsletter

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Neue KI-Use-Cases, ehrliche Tool-Tests und DSGVO-Updates, verständlich aufbereitet. Kein Spam, jederzeit abbestellbar.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Was passiert, wenn die klinischen Daten nicht ausreichen

Dieser Abschnitt gehört zum PMCF-Thema, obwohl er unangenehm ist.

Was ein Serious Concern ist: Eine Benannte Stelle kann während der Konformitätsbewertung oder einer Überwachungsaudit einen „Serious Concern” (schwerwiegenden Mangel) erklären, wenn die klinischen Daten qualitativ oder quantitativ nicht ausreichen, um Sicherheit und Leistung des Produktes während des gesamten Lebenszyklus zu bestätigen, wie in MDR Art. 61 und Anhang XIV Teil B gefordert. Das ist keine Routinekorrespondenz. Ein Serious Concern kann zum vorläufigen Aussetzen des CE-Zertifikats führen, was den Verkauf des Produkts in der EU de facto unmöglich macht.

Was häufig dazu führt:

  • Ein PMCF-Plan, der keine direkte Verbindung zu den im CER identifizierten Datenlücken aufweist (laut QServe Group einer der fünf häufigsten Mängelgründe)
  • Klinische Daten, die zwar vorhanden, aber nicht statistisch ausreichend für die Risikoprofilbewertung sind
  • Fehlender Abgleich der PMCF-Ergebnisse mit dem Risikoregister und den Instructions for Use
  • Unrealistische Zeitpläne im PMCF-Plan, die die Benannte Stelle als Hinweis auf fehlende Ernsthaftigkeit wertet

Was KI dabei helfen kann: KI beschleunigt die Evidenzaggregation und macht bestehende Datenlücken sichtbar, automatisch markierte Vollständigkeitslücken im Bericht sind ein echter Mehrwert. Ein gut konfiguriertes Extraktionssystem zeigt: „Für diesen klinischen Endpunkt haben wir aus der Literatur n=X Patienten aus fünf Studien, die Benannte Stelle wird das voraussichtlich für ausreichend/nicht ausreichend befunden.”

Was KI nicht leisten kann: Daten, die schlicht nicht existieren, kann keine KI erschaffen. Wenn das Produkt in einem dünnen klinischen Evidenzfeld operiert, neuartige Technologie, seltene Indikation, Produktentwicklung aus dem Äquivalenzweg, ist die Grundproblematik nicht ein Prozess-, sondern ein Evidenzproblem. In diesem Fall ist die richtige Antwort nicht ein besserer PMCF-Bericht, sondern eine eigene klinische Studie nach ISO 14155, mit Ethikkommissionsanmeldung, Studienprotokoll und Site-Management. Das ist eine andere Liga als das Literaturmanagement und kein Einsatzfeld für reine Schreib-KI.

Der Auslöser für einen Serious Concern ist selten ein schlechter Bericht. Er ist fast immer eine strukturell unzureichende Datenbasis. KI zeigt dieses Problem früher, aber sie löst es nicht.

Vier typische Einstiegsfehler

1. Elicit als vollständige Ersatz-Datenbanksuche einsetzen. Elicit ist ein nützliches Recherchetool, aber laut einer Cochrane-Vergleichsstudie (Lau et al., 2025) identifizierte es bei klassischen systematischen Reviews im Mittel nur 17,6 % der letztlich eingeschlossenen Studien. Für einen regulatorisch validen PMCF-Review nach MDR ist das kritisch: Ein KI-Tool, das fast fünf von sechs relevanten Studien übersieht, produziert keine ausreichende Evidenzbasis. Die Lösung ist nicht, Elicit zu verbannen, sondern es als Ergänzung zur klassischen Datenbanksuche (PubMed, Embase, Scopus) einzusetzen, nicht als Ersatz.

2. Den KI-generierten Berichtsentwurf ohne Verifikation einreichen. Die größte Fehlvorstellung bei KI-Berichtsgenerierung: Das System schreibt den Bericht, wir schicken ihn raus. In der Praxis halluziniert kein Literaturreview-Tool, wenn es auf echten Paper-Daten basiert, aber die Interpretation der Befunde erfordert regulatorische Expertise. Ein KI-extrahierter adverse-event-Rate-Wert aus einer Studie kann rechnerisch korrekt sein und dennoch in einem falschen klinischen Kontext stehen. Wer diese Verifikation überspringt, riskiert genau den Befund, den der Workflow eigentlich vermeiden soll: ein Deficiency Letter mit dem Hinweis auf unzureichende klinische Bewertung.

3. Den Workflow nicht intern validieren. Ein KI-gestützter Reviewprozess, der in Notified-Body-Dokumentation einfließt, ist ein computergestütztes System im GxP-Sinn. Das bedeutet: Ohne interne Validierung, dokumentierter Nachweis, dass der Workflow das tut, was er soll, reproduzierbar und nachvollziehbar, fehlt die regulatorische Grundlage für den Einsatz. Diese Validierung kostet zwei bis vier Wochen, ist aber nicht optional. Wer sie überspringt, baut die nächste Angriffsfläche für den Auditor.

4. Den PMCF-Workflow ohne Verbindung zum CER aufsetzen. Ein PMCF-Plan, der kein Mapping auf die im Clinical Evaluation Report (CER) identifizierten Datenlücken enthält, ist laut QServe Group „eine Non-Conformity, die nur darauf wartet, gefunden zu werden.” KI kann die Verbindung zwischen CER-Gap-Analyse und PMCF-Evidenzerhebung strukturieren, aber nur, wenn dieser Zusammenhang im Workflow explizit abgebildet ist. Ein automatisiertes System, das Literatur aggregiert, ohne zu wissen, welche Datenlücken es schließen soll, produziert riesige Berichte ohne regulatorischen Mehrwert.

Was mit der Einführung wirklich passiert, und was nicht

Der häufigste Widerstand kommt nicht von der Technik, sondern von zwei Richtungen.

Die regulatorischen Skeptiker: Clinical Affairs Teams, die seit Jahren mit einer bestimmten Suchstrategie und einem bewährten Berichtsformat arbeiten, reagieren auf KI-gestützte Workflows oft mit: „Wir wissen nicht, ob die Benannte Stelle das akzeptiert.” Das ist eine legitime Sorge, keine Ausrede. Die Lösung ist Transparenz im Bericht: Ein KI-gestützter Workflow, der seinen Screening-Prozess vollständig dokumentiert (welche Datenbanken, welche Suchbegriffe, welcher KI-Algorithmus mit welchen Parametern, welche menschliche Review-Ebene), ist für Benannte Stellen akzeptabler als eine undokumentierte Excel-Selektion. Die Akzeptanzfrage löst sich durch Dokumentationsqualität, nicht durch Tool-Vermeidung.

Die Qualitätssicherung: Wer für den PMCF-Bericht unterschreibt, will wissen, dass die Datenextraktion stimmt. Das ist das Richtige, und der Grund, warum regulatorisch akzeptable KI-Tools wie DistillerSR jeden KI-Vorschlag unter menschlicher Verifikationspflicht stellen. Diese Pflicht ist nicht ein Ineffizienzproblem des Tools, sondern die regulatorische Grundlage, die den Einsatz überhaupt ermöglicht. Wer das erklären kann, nimmt der Sorge die Schärfe.

Was in der Praxis hilft:

  • Ersten Pilot-Review parallel zur manuellen Methode durchführen, beide Ergebnisse vergleichen, Unterschiede dokumentieren. Das schafft Vertrauen, nicht durch Überzeugung, sondern durch Evidenz.
  • Die Benannte Stelle frühzeitig informieren, dass ein automatisiertes Screening-Tool eingesetzt wird, nicht um Erlaubnis zu fragen, sondern um proaktiv zu zeigen, dass der Audit-Trail vollständig ist.
  • Einen internen SOP für den KI-gestützten PMCF-Workflow dokumentieren, bevor der erste regulatorisch verwendete Review startet.

Was nicht passiert: Der manuelle Medical Writer verschwindet nicht. Wer das erwartet, wird enttäuscht. KI beschleunigt den Prozess; sie übernimmt nicht die regulatorische Verantwortung. Wer das klar kommuniziert, vermeidet falsche Erwartungen in beide Richtungen.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Bestandsaufnahme & PlanungWoche 1–2PMCF-pflichtige Produktfamilien priorisieren, bestehende Suchstrategien sichten, Tool-Auswahl finalisierenMehr Produkte als erwartet, Scope zu früh zu groß; lieber mit einer Produktfamilie beginnen
Suchstrategie & Tool-SetupWoche 3–5PICO-Kriterien formalisieren, Suchbegriffe mit Datenbankspezialisten abstimmen, Extraktionsfelder konfigurierenFehlende Expertise für PICO-Formalisierung, externe Beratung einplanen
Pilot-Review erste ProduktfamilieWoche 6–10Literaturdurchsuchung, KI-Screening, manuelle Verifikation, Datenextraktion, Berichtsentwurf erstellenKI-Treffermenge weicht von manueller Erwartung ab, Ursache analysieren, Suchstrategie anpassen
Interne ValidierungWoche 10–14Workflow gegen SOPs prüfen, Audit-Trail dokumentieren, Freigabe durch RA-LeitungValidierung dauert länger als geplant, kein Abkürzen; das ist regulatorisch nicht verhandelbar
Ausweitung auf weitere ProduktfamilienAb Woche 14Suchstrategie anpassen, zweiten Review starten, Lessons Learned einfließen lassenTempoerwartung zu hoch, auch Folgereviews brauchen manuelle Verifikationszeit

Häufige Einwände, und was dahintersteckt

„Wir wissen nicht, ob die Benannte Stelle KI-gestützte Reviews akzeptiert.” Benannte Stellen bewerten nicht das Tool, sondern den Audit-Trail und die Reproduzierbarkeit. Ein vollständig dokumentierter KI-Workflow, welche Datenbanken, welcher Algorithmus, welche menschliche Review-Ebene, ist in der Regel akzeptabler als ein undokumentierter manueller Prozess, bei dem nicht nachvollziehbar ist, nach welchen Kriterien Treffer ausgeschlossen wurden. Die Frage ist nicht „KI oder nicht?”, sondern „ist der Prozess transparent und reproduzierbar?”

„Wir haben nur ein PMCF-pflichtiges Produkt, lohnt sich das?” Ehrliche Antwort: Möglicherweise nicht. Ein einzelner Produktfamilien-Review mit einem CRO kostet 15.000–30.000 Euro, die Tool-Infrastruktur kostet in der Einrichtung ähnlich viel, mit dem Unterschied, dass die CRO sofort loslegen kann und ihr nicht monatelang aufbauen müsst. Der Business Case für interne KI-gestützte Workflows beginnt bei zwei bis drei PMCF-pflichtigen Produktfamilien, die regelmäßige Berichtszyklen haben.

„Unsere Medical Writer beherrschen den Prozess bereits sehr gut.” Stimmt, und das ist kein Argument gegen den Ansatz, sondern dafür. Ein:e erfahrene:r Medical Writer, der/die KI-Tools für Screening und Extraktion nutzt, ist deutlich produktiver als ein:e Medical Writer ohne diese Unterstützung. Der Einsatz von DistillerSR verändert den Job nicht, er entfernt den aufwendigsten, repetitivsten Teil davon.

Woran du merkst, dass das zu dir passt

  • Du hast zwei oder mehr Klasse-IIb- oder Klasse-III-Produkte mit laufender PMCF-Pflicht und der nächste Berichtszyklus ist in weniger als sechs Monaten
  • Dein Clinical-Affairs-Team verbringt mehrere Wochen pro Jahr mit manueller Literaturrecherche für PMCF-Berichte, und das Volumen wächst mit jedem neuen Produkt
  • Ihr habt bereits einen CER und einen PMCF-Plan, der die Datenlücken benennt, aber die systematische Evidenzerhebung fehlt noch oder ist manuell kaum skalierbar
  • Eine Benannte Stelle hat euch bereits Deficiency-Hinweise zu PMCF-Evidenz gegeben, und ihr wollt beim nächsten Zyklus proaktiv Vollständigkeit nachweisen können
  • Ihr outsourct PMCF-Berichte an CROs für mehr als 20.000 Euro pro Zyklus, und wollt wissen, ob sich das internalisieren lässt

Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:

  1. Unter zehn Mitarbeitenden ohne dediziertes Clinical-Affairs-Know-how. Der Einsatz von Tools wie DistillerSR setzt voraus, dass jemand Suchstrategien nach PICO formalisieren, Extraktionsfelder korrekt konfigurieren und Audit-Trails regulatorisch bewerten kann. Ohne diese Fachkompetenz produziert das Tool zwar Berichte, aber keine, die regulatorisch tragfähig sind. Wer kein Clinical-Affairs-Personal hat, braucht erst das Know-how, dann das Tool.

  2. Nur ein einziges PMCF-pflichtiges Produkt mit niedrigem Risikoprofil (Klasse IIa, kein aktives Implantat). Der Setup-Aufwand für eine vollständig validierte KI-Workflow-Umgebung, Suchstrategie, Tool-Konfiguration, interne Validierung, SOP, rentiert sich nicht für einen einzigen Berichtszyklus alle drei Jahre. Hier ist CRO-Outsourcing wirtschaftlich sinnvoller.

  3. Kein dokumentierter PMCF-Plan, der Datenlücken aus dem CER benennt. Ein KI-Tool beschleunigt die Evidenzerhebung für bereits definierte PMCF-Ziele. Wenn der PMCF-Plan fehlt, unvollständig oder nicht mit dem CER verknüpft ist, löst das Tool das Grundproblem nicht, es beschleunigt lediglich die Produktion eines regulatorisch unzureichenden Berichts. Erst den Plan in Ordnung bringen, dann das Tool einsetzen.

Das kannst du heute noch tun

Öffne Elicit, kostenlos, kein Setup, sofort nutzbar. Formuliere die PMCF-Kernfrage für ein eurer Produkte als englische Forschungsfrage (Beispiel: „What are the complication rates and clinical outcomes of [device type] in [target population] at [follow-up period]?”) und lass Elicit die ersten 50–100 Paper dazu liefern, mit automatischer Extraktion von Stichprobengröße, Follow-up-Dauer und primären Outcomes.

Das dauert 20 Minuten. Was du danach weißt: Wie dünn oder dicht das klinische Evidenzfeld für dein Produkt ist, und ob der nächste PMCF-Review eher ein Screeningproblem (zu viele Treffer) oder ein Evidenzproblem (zu wenige valide Studien) haben wird.

Für den regulatorisch validen Einsatz brauchst du eine strukturierte Suchstrategie nach dem Muster unten:

Prompt: PMCF-Evaluierungsbericht-Abschnitt generieren
Du bist Medical-Writing-Assistent für Post-Market Clinical Follow-up (PMCF) nach EU MDR Anhang XIV Teil B. Aufgabe: Erstelle einen strukturierten Entwurf für den Abschnitt "Klinische Evidenz aus systematischer Literaturrecherche" des PMCF-Evaluierungsberichts. Grundlagen (bitte ausfüllen): - Produktname und Risikoklasse: [PRODUKTNAME, KLASSE IIb/III] - PMCF-Fragestellung gemäß PMCF-Plan: [PMCF-KERNFRAGE AUS EUREM PLAN] - Einschlusskriterien (PICO): [POPULATION, INTERVENTION, COMPARATOR, OUTCOMES] - Datenbanksuche durchgeführt: [PubMed, Embase, weitere Datenbanken; Datum der Suche; Suchbegriffe] - Anzahl Treffer gesamt: [N gesamt] - Nach Duplikatbereinigung: [N nach Deduplikation] - Nach Titelscreening eingeschlossen: [N nach Titel-Abstract-Screening] - Nach Volltextprüfung eingeschlossen: [N final eingeschlossen] - Extrahierte Endpunkte der eingeschlossenen Studien: [HIER TABELLARISCHE DATEN EINFÜGEN] Erstelle für diese Daten: 1. Zusammenfassung der Evidenzlage (Gesamtzahl Patienten, Follow-up-Spanne, Studientypen) 2. Hauptbefunde zu Sicherheit (adverse events, device deficiencies, Mortalität falls relevant) 3. Hauptbefunde zu Leistung (primäre Wirksamkeitsendpunkte) 4. Vergleich mit dem State of the Art (Benchmarkdaten aus SOTA-Recherche) 5. Identifizierte Datenlücken und empfohlene nächste PMCF-Maßnahmen Format: Strukturierter Abschnitt, geeignet für technische Dokumentation nach MDR. Keine Schlussfolgerung ohne Datengrundlage. Fehlende Daten explizit als Lücke kennzeichnen.
Funktioniert mit Claude, ChatGPT
Beispiel-Ausgabe

Mitarbeiter:in

Produkt: Kniegelenk-Endoprothese Typ X, Klasse IIb. PMCF-Frage: Sind Komplikationsraten und Standzeiten mit State-of-the-Art vergleichbar? PICO: Patienten mit primärer Gonarthrose, cementierte Knieendoprothese Typ X vs. zementierte Knieendoprothesen allgemein, Standzeit ≥5 Jahre, Komplikationsrate, PROMS. Suche PubMed/Embase 2024-03-01, n=847 gesamt, n=831 nach Deduplikation, n=62 nach Titelscreening, n=14 final. Extrahierte Daten: 14 Studien, n=2.847 Patienten, Follow-up 5–12 Jahre, Revisions-Rate 2,8 % (95 % KI 1,9–3,7 %), Oxford Knee Score Mittel 42,1 (SD 4,2), keine produktspezifischen Sicherheitssignale.

KI-Assistent

## Klinische Evidenz aus systematischer Literaturrecherche **Evidenzlage, Zusammenfassung** Die systematische Datenbanksuche vom 01.03.2024 (PubMed, Embase) identifizierte 847 Publikationen; nach Deduplikation verblieben 831 Records. Titelscreening und Volltextprüfung nach PICO-Kriterien schlossen 14 Studien mit insgesamt 2.847 Patienten ein. Das Follow-up-Spektrum reicht von 5 bis 12 Jahren und deckt damit den relevanten Mittelfristzeitraum für Knieendoprothesen ab. **Sicherheit** Die Revisionsrate über alle eingeschlossenen Studien beträgt 2,8 % (95 % KI: 1,9–3,7 %). Auf Produktebene wurden keine Sicherheitssignale, Device Deficiencies oder unerwarteten adverse events identifiziert. [HINWEIS: Dieser Befund gilt für die Gesamtstudiengruppe; produktspezifische Daten aus dem eigenen PMCF-Plan (Registerdaten, Anwenderbefragungen) sind gesondert auszuwerten.] **Leistung** Der mittlere Oxford Knee Score der eingeschlossenen Studien beträgt 42,1 (SD 4,2), was als gutes funktionelles Ergebnis einzustufen ist. [State-of-the-Art-Vergleich ausstehend, SOTA-Recherche einfügen.] **Identifizierte Datenlücken** Produktspezifische Langzeitdaten >10 Jahre: derzeit nicht in ausreichender Menge vorhanden (0 eingeschlossene Studien). Empfehlung: Verlängerung der laufenden Registerdaten-Follow-up-Periode auf 15 Jahre im nächsten PMCF-Zyklus. Quelle: Systematische Literaturrecherche gemäß PRISMA 2020, Suchprotokoll als Anhang A beigefügt.

Quellen & Methodik

  • Climedo Health, Erhebung zu PMCF-Management-Aufwand (2023): Mehr als die Hälfte der befragten Medizintechnikhersteller investiert über 5 Stunden/Woche in EU-MDR-PMCF-Verwaltung; MDR-Compliance kostet viele Hersteller mehr als 5 % des Jahresumsatzes; zwei Drittel haben mindestens eine neue Stelle geschaffen. Quelle: climedo.de/en/blog/how-to-cut-costs-when-managing-your-pmcf-studies/
  • DistillerSR, NuVasive-Fallstudie (Monique Liston, Senior Medical Writer): Ca. 30 % Zeitreduktion pro CER-Literaturreview; Spreadsheet-Workflow als „fehleranfällig, nicht reproduzierbar, inkonsistent” beschrieben. Quelle: distillersr.com/resources/case-studies/nuvasive-streamlined-literature-reviews
  • DistillerSR, Philips-Fallstudie: >70 % schnelleres Screening für CER-Submissions. Quelle: distillersr.com/industries/medical-devices
  • Lau et al. (2025), Cochrane Evidence Synthesis and Methods: Vergleich Elicit AI vs. klassische Literatursuche in vier Fallstudien; Elicit identifizierte im Mittel nur 17,6 % der final eingeschlossenen Studien. Quelle: onlinelibrary.wiley.com/doi/full/10.1002/cesm.70050
  • QServe Group, „Top 5 Reasons PMCF Plans Fail Under MDR” (2024): PMCF-Pläne ohne Mapping zu CER-Datenlücken als häufigste Mängelursache bei Notified-Body-Audits. Quelle: qservegroup.com/blog/top-5-reasons-pmcf-plans-fail-under-mdr
  • MDR Anhang XIV Teil B: Regulatorische Grundlage für PMCF-Anforderungen bei Klasse-IIb- und Klasse-III-Produkten. Verordnung (EU) 2017/745 des Europäischen Parlaments und des Rates (aktuelle Fassung).
  • CRO-Preisvergleich: Erfahrungswerte aus Branchenberichten und Hersteller-Aussagen; keine repräsentative Erhebung. Bereich 15.000–50.000 Euro pro PMCF-Evaluierungsbericht entspricht der typischen Bandbreite für Klasse-IIb/III-Implantate; Einzel-Produkte mit wenig Evidenzaufwand können darunter liegen.
  • Datenschutz: DSGVO Art. 28 (Auftragsverarbeitung); EU MDR Anhang XIV Teil B; ICH E6(R3) für klinische PMCF-Studien nach ISO 14155.

Du willst wissen, ob sich ein KI-gestützter PMCF-Workflow für dein Produktportfolio lohnt, oder ob CRO-Outsourcing in eurem Fall die bessere Wahl bleibt? Das rechnen wir gemeinsam durch.

Diesen Inhalt teilen:

🤝

Wissen ist der erste Schritt. Der zweite kostet Zeit.

Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar