Usability-Testing-Dokumentation strukturieren
KI strukturiert Usability-Testprotokolle nach IEC 62366 und generiert Bewertungsberichte aus Rohdaten der Nutzerstudien.
- Problem
- Usability-Engineering-Dokumentation nach IEC 62366 ist komplex, Testprotokolle, Auswertungen und Summary Reports erfordern hohe Präzision.
- KI-Lösung
- Ein LLM-basiertes System (NLP-Klassifikation) transkribiert Testsessions via Whisper, kategorisiert Usability-Probleme nach IEC-62366-Kriterien und generiert strukturierte Bewertungsberichte für den Notified Body.
- Typischer Nutzen
- Dokumentationsaufwand um ~35% gesenkt (Schätzwert aus Praxisberichten). Konsistentere Bewertungen. Typisch: 2 Wochen Zeitersparnis pro Produkt.
- Setup-Zeit
- 10–16 Wochen bis Pilotbetrieb
- Kosteneinschätzung
- 15.000–40.000 € Einrichtung, 20–100 €/Monat laufend
Es ist Freitagabend, 18:15 Uhr.
Miriam, Human Factors Engineer bei einem Münchner Medizintechnikunternehmen, hat gerade die letzte Testsession der summativen Bewertung für ihr neues Insulinpumpen-System abgeschlossen. Drei Tage, 15 Probanden, je 90 Minuten, aufgezeichnet, notiert, beobachtet. Auf dem Tisch liegen 15 ausgefüllte Testbögen, drei Notebooks mit Beobachtungsnotizen, eine Excel-Datei mit Time-on-Task-Messungen und USB-Sticks mit 22 Stunden Videomaterial.
Der Usability Engineering Summary Report für den Notified Body soll in vier Wochen fertig sein.
Miriam öffnet ihren Laptop und fragt sich, wo sie anfangen soll. Die IEC 62366-1 verlangt für die summative Bewertung eine vollständige Darstellung aller Aufgaben, aller Fehler, aller Workarounds, der Schweregrad-Klassifizierung jedes Usability-Problems und die Schlussfolgerung, ob die Restrisiken aus Usability-Sicht akzeptabel sind. Alles rückverfolgbar auf die Risikoanalyse nach ISO 14971.
Vier Wochen für 22 Stunden Videomaterial, 15 Testbögen und einen Bericht, der vom Notified Body quer über alle Testaufgaben hinweg nachvollzogen werden kann. Ohne KI-Unterstützung: Miriam wird kaum Wochenenden sehen.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
Usability Engineering nach IEC 62366-1 ist Pflicht für alle Medizinprodukte, die unter MDR fallen, und der Aufwand für die Dokumentation ist systematisch unterschätzt.
Ein vollständiges Usability Engineering File (UEF) nach IEC 62366-1 umfasst:
- Usability Engineering Plan (Planungsdokument)
- Nutzungsprofile und Anwendungsumgebungen
- Aufgabenanalyse und -spezifikation
- Identifizierung kritischer Aufgaben
- Benutzeroberflächenspezifikation
- Formative Evaluation: Protokolle aller Iterationen
- Summative Evaluation: Testplan, Testprotokolle (je Proband), Rohdaten-Auswertung, Summary Report
- Verbindung zum Risikomanagement nach ISO 14971
Für ein Medizinprodukt mit 15–25 kritischen Aufgaben und einer summativen Bewertung mit 10–15 Probanden entstehen allein durch die Protokollauswertung 40 bis 80 Stunden Dokumentationsaufwand, ohne Testdurchführung, Vorbereitung und Freigabeprozesse.
Das eigentliche Problem ist die Heterogenität der Rohdaten: Videoaufzeichnungen müssen transkribiert oder zumindest ausgewertet werden, Beobachtungsnotizen aus verschiedenen Quellen müssen zusammengeführt werden, quantitative Daten (Task Completion Rate, Time on Task, Use Errors) müssen mit qualitativen Beobachtungen verknüpft werden, und das alles muss in einer Struktur landen, die der Notified Body in einer Tabelle mit Rückverfolgbarkeit von Aufgabe zu Risiko zu Bewertung nachvollziehen kann.
Besonders kritisch: Inkonsistente Schweregradbewertungen von Usability-Problemen sind ein häufiger Grund für Notified-Body-Rückfragen. Wenn zwei Beobachter das gleiche Usability-Problem unterschiedlich klassifizieren, weil die Bewertungskriterien nicht explizit genug dokumentiert sind, entstehen Inkonsistenzen, die den Prüfer misstrauisch machen.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-Unterstützung |
|---|---|---|
| Auswertungsaufwand summative Evaluation (15 Probanden) | 40–80 Std. | 20–40 Std. ¹ |
| Kategorisierung von Usability-Problemen | manuell, inkonsistent | standardisiert nach vordefinierten Kriterien |
| Schweregradbewertung von Use Errors | subjektiv und variabel | regelbasiert, nachvollziehbar dokumentiert |
| Erstellung Usability Engineering Summary Report | 10–20 Std. Schreibarbeit | 3–5 Std. mit KI-generiertem Entwurf ¹ |
| Rückverfolgbarkeit Aufgabe → Fehler → Risiko | manuelle Tabellen-Pflege | strukturiert und automatisch verlinkbar |
¹ Erfahrungswerte; stark abhängig von Datenqualität und Protokollstruktur der Testdurchführung.
Der Schlüssel liegt oft nicht im Schreiben selbst, sondern in der strukturierten Kategorisierung: Wenn 15 Testprotokolle in einem einheitlichen Format vorliegen, kann KI die Auswertung erheblich beschleunigen.
Einschätzung auf einen Blick
Zeitersparnis, hoch (4/5) 20 Stunden weniger pro Usability-Studie sind real und bedeutsam, besonders für kleine Teams, die Human-Factors-Engineering als Nebenaufgabe führen. Nicht ganz auf dem Niveau der Technischen Dokumentation oder der PMS-Automatisierung, weil Usability Engineering einen höheren Anteil an inhaltlichen Bewertungen hat, die echtes Fachwissen erfordern, und nicht nur strukturierte Datenaggregation.
Kosteneinsparung, niedrig (2/5) Die Einsparungen entstehen hauptsächlich über eingesparte Arbeitsstunden. Externe Usability-Consultants kosten 120–200 Euro/Stunde, und für eine vollständige Usability-Bewertung können 60–100 externe Stunden anfallen. KI-Unterstützung kann einen Teil davon ersetzen oder reduzieren. Aber die Einrichtungskosten von 15.000 bis 40.000 Euro amortisieren sich erst ab mehreren Produkten, und externe Usability-Expertise wird für die inhaltliche Bewertung weiterhin benötigt. Im Vergleich zur direkten Kostenersparnis durch beschleunigte Notified-Body-Zertifizierung (wie bei der Technischen Dokumentation) ist der finanzielle Hebel geringer.
Schnelle Umsetzung, mittel (3/5) Einfacher als die beiden anderen Anwendungsfälle in dieser Kategorie: Kein komplexes Datenbankintegrationsprojekt, keine Anbindung an EUDAMED oder Vigilanzsysteme. Das Grundprinzip ist: Testprotokolle in ein strukturiertes Format bringen, KI-Assistent konfigurieren, Kategorisierungsregeln definieren. 10 bis 16 Wochen bis zum ersten produktiven Einsatz sind realistisch, wenn die Testdokumentation bereits in einem halbwegs strukturierten Format vorliegt.
ROI-Sicherheit, hoch (4/5) Wie bei der Technischen Dokumentation: Die Metriken sind klar, Stunden für Protokollauswertung, Stunden für Berichtserstellung, Anzahl Notified-Body-Rückfragen zu Usability-Themen. Diese Zahlen kann jedes Regulatory-Team aus den letzten Projekten rekonstruieren und nach 12 Monaten vergleichen. Der ROI ist nicht so binär messbar wie bei PMS-Fristen, aber klarer als bei indirekten Prozessverbesserungen.
Skalierbarkeit, mittel (3/5) Ein konfiguriertes Usability-Engineering-System kann auf weitere Produkte übertragen werden, aber Usability Engineering ist produktspezifisch. Jedes neue Produkt hat neue Aufgaben, neue Nutzerprofile, neue kritische Interaktionen. Das System spart Zeit bei gleichartigen Produktkategorien (ähnliche Geräteklassen, ähnliche Nutzergruppen), aber die Konfiguration muss für jede neue Produktfamilie angepasst werden.
Richtwerte, stark abhängig von Produktkomplexität, Anzahl kritischer Aufgaben und Testumfang.
Was das System konkret macht
KI-Unterstützung für Usability Engineering greift an drei Stellen an:
1. Transkription und Strukturierung von Testdaten Videoaufzeichnungen und Audio-Notizen aus Usability-Tests können mit Automatisierung durch Transkriptions-KI (wie Whisper oder vergleichbare Dienste) in Text umgewandelt werden. Dieser Text kann dann nach vordefinierten Kategorien (Aufgabe, Fehlerart, Reaktion des Probanden, Workaround) sortiert werden, erheblich schneller als manuelles Durchschauen von Videomaterial.
2. Usability-Problem-Kategorisierung und Schweregradbewertung Auf Basis der strukturierten Testdaten kann ein KI-Assistent, mit klar definierten Bewertungskriterien, Usability-Probleme nach IEC 62366-1 kategorisieren: Handhabungsfehler (Use Error), Gebrauchsfehler (Use Difficulty), Anomalien. Für jeden identifizierten Fehler kann die KI einen Schweregrad-Vorschlag generieren, basierend auf den im Testprotokoll dokumentierten Konsequenzen, zur menschlichen Überprüfung und finalen Bewertung.
3. Berichtsgenerierung und Rückverfolgbarkeits-Dokumentation Der Usability Engineering Summary Report folgt einer definierten Struktur: Zusammenfassung der Testmethode, Auflistung aller kritischen Aufgaben, Ergebnisse je Aufgabe (Task Completion Rate, Use Errors), Bewertung jedes Usability-Problems, Schlussfolgerung zur Restrisikobewertung. KI kann aus den strukturierten Daten diesen Bericht als Entwurf generieren, mit direkten Verweisen auf die zugehörigen Testprotokolldaten.
Der wichtigste Effekt: Inkonsistenzen werden früher sichtbar. Wenn die KI-Kategorisierung zeigt, dass ein Use Error in Session 7 anders klassifiziert wurde als ein identisches Ereignis in Session 12, weil die Tester unterschiedliche Sprache verwenden, kann das behoben werden, bevor der Notified Body es findet.
Konkrete Werkzeuge, was wann passt
Whisper (open source von OpenAI), Für die Transkription von Videoaufzeichnungen und Audio-Notizen aus Testsessions. Läuft lokal, keine Cloud-Übertragung, EU-DSGVO-konform. Erfordert technisches Setup, aber für Datenschutz-sensible Usability-Daten mit Patientenbeteiligung die sichere Wahl.
Claude AI, Für die strukturierte Auswertung von Testprotokollen und die Erstellung von Berichtsentwürfen. Starke Fähigkeiten bei der Kategorisierung und Klassifizierung von Freitext-Daten. Für nicht-öffentliche Testdaten (Probanden-Informationen pseudonymisiert vorab): EU-Datenschutz prüfen oder Daten pseudonymisieren, bevor sie in Cloud-Dienste fließen.
Greenlight Guru, Das eQMS bietet strukturierte Workflows für Human Factors und Design Controls mit Traceability zwischen Testprotokollen und Risikoregister. Für Unternehmen, die ohnehin Greenlight Guru für ihr QMS nutzen, der naheliegendste Weg, alles in einem System. Nachteil: keine automatische Transkription oder KI-gestützte Analyse von Rohdaten.
Formwork von OpenRegulatory, Für Startups und kleine Hersteller: Das Free-Tier ermöglicht strukturierte Dokumentenführung für das Usability Engineering File, ohne Software-Kosten. Keine KI-Analyse-Features, aber als strukturiertes Dokumentenmanagement ein sinnvoller Einstieg.
Spezialisierte Human-Factors-Consulting-Dienste, Für einmalige summative Evaluationen ist es oft effizienter, eine externe Human-Factors-Firma zu beauftragen, die eigene Tools mitbringt, statt für eine einzelne Studie eine eigene Infrastruktur aufzubauen. Kalibrierung: Ab dem dritten Produkt lohnt sich typischerweise eine eigene Lösung.
Zusammenfassung: Wann welcher Ansatz
- Transkription von Testsessions, Datenschutz-sensibel → Whisper (lokal)
- Auswertung strukturierter Protokolldaten, Berichtsentwurf → Claude AI / ChatGPT
- Integriertes QMS + Human Factors + Risikoregister → Greenlight Guru
- Startup, erstes Produkt, kein Tool-Budget → Formwork (kostenlos) + KI-Assistent
- Einmalige summative Evaluation → externe Human-Factors-Consulting
Rechtliche Besonderheiten
IEC 62366-1 ist harmonisiert unter MDR, das bedeutet: Wenn ein Hersteller die Anforderungen dieser Norm erfüllt, kann er Konformität mit den grundlegenden Sicherheits- und Leistungsanforderungen der MDR unterstellen. Wer die Norm nicht vollständig erfüllt, muss einen anderen Nachweis führen. Der Notified Body prüft das UEF explizit.
Zwei Fehler, die KI-Unterstützung nicht ausgleichen kann:
-
Falsche Probandenauswahl: Die summative Bewertung muss mit tatsächlichen repräsentativen Nutzern durchgeführt werden, d. h. echte medizinische Fachpersonen oder Laienanwender, je nach Zweckbestimmung. Simulierte Nutzer oder Mitarbeitende des Herstellers sind nicht akzeptabel. KI kann die Dokumentation dieser Tests verbessern, aber nicht die Tests selbst ersetzen oder korrigieren.
-
Abgeleitete Schweregradbewertung ohne Verknüpfung zur Risikoanalyse: IEC 62366-1 verlangt, dass Usability-Probleme mit sicherheitsbezogener Relevanz mit der Risikoanalyse nach ISO 14971 verknüpft werden. Ein Usability-Problem, das das Risikobild des Produkts verändert, muss die Risikoakte aktualisieren. KI kann diese Verlinkung vorschlagen, aber die fachliche Entscheidung, ob ein Use Error eine neue Risikobewertung auslöst, liegt beim Regulatory-Team.
Pseudonymisierungspflicht bei externen KI-Diensten: Usability-Tests mit Probanden generieren personenbezogene Daten (Videoaufnahmen, Testprotokolle mit Probandenidentifikatoren). Bevor diese Daten in Cloud-KI-Dienste übertragen werden, müssen sie pseudonymisiert werden, Patientennamen, Krankenhausnamen und andere identifizierende Informationen entfernen.
Datenschutz und Datenhaltung
Usability-Tests mit medizinischen Anwendenden oder Patienten erzeugen personenbezogene Daten. Das ist der sensibelste Datenschutz-Aspekt in diesem Anwendungsfall.
Die Empfehlung lautet klar: Transkription lokal, Analyse cloud-optional
- Videomaterial und Rohaudio auf lokalen Systemen mit Whisper transkribieren, keine Übertragung in externe Cloud
- Transkripte pseudonymisieren (Probanden-IDs statt Namen, Klinikname entfernen)
- Pseudonymisierte Texte können dann ohne DSGVO-Risiko in Claude AI, ChatGPT oder vergleichbare Dienste für Analyse und Berichtserstellung übertragen werden
- Für KI-Tools, die in Firmensystemen betrieben werden (z. B. Azure OpenAI im EU-Rechenzentrum): direktere Nutzung möglich, aber AVV-Abschluss bleibt Pflicht
Mit meddevo oder Formwork als EU-basierter Dokumentationsplattform entfällt die Frage nach US-Datentransfer, aber die Pseudonymisierung der Rohdaten bleibt trotzdem sinnvoll.
Was es kostet, realistisch gerechnet
Einmalige Einrichtungskosten
- Konfiguration des Transkriptions-Workflows (Whisper lokal): 5–10 Stunden Setup, primär interne IT-Zeit
- Erstellung von Testprotokoll-Vorlagen und Kategorisierungs-Schemata: 10–20 Stunden Regulatory-Zeit
- Entwicklung des KI-Prompts für Protokollauswertung: 3–8 Stunden
- Bei eQMS-Integration (Greenlight Guru): Onboarding und Design-Controls-Konfiguration 10.000–30.000 Euro
Laufende Kosten (monatlich)
- Whisper: kostenlos (open source, selbst gehostet)
- Claude AI / ChatGPT für Auswertung: 20–100 Euro/Monat
- Greenlight Guru (wenn ohnehin im Einsatz): enthaltene Funktion, kein Aufpreis
- Externer Usability-Consultant für inhaltliche Überprüfung: 120–200 Euro/Stunde, 5–15 Stunden je Bewertungszyklus
Was du dagegenrechnen kannst Externe Human-Factors-Consulting für eine vollständige summative Bewertung: 8.000 bis 20.000 Euro je Produkt. KI-Unterstützung kann 30 bis 50 Prozent dieser Kosten einsparen (Schätzwert aus Praxisberichten), indem vorbereitende Strukturierungsarbeit intern erledigt wird. Für ein Unternehmen mit zwei bis drei Usability-Evaluationen pro Jahr liegt die Amortisation schnell unter 12 Monaten.
Wie du den Nutzen tatsächlich misst Stundenbuch führen: Wie lange dauert die Auswertung einer Testsession (Transkription, Kategorisierung, Bewertung) vor und nach der KI-Einführung? Wie viele Notified-Body-Rückfragen zu Usability-Themen gab es in den letzten 3 Produkteinreichungen? Wie viele Stunden wurden für externe Human-Factors-Consultants bezahlt? Diese Zahlen jetzt dokumentieren, und in 12 Monaten vergleichen.
Typische Einstiegsfehler
1. Die Testprotokoll-Struktur nicht vorab standardisieren. KI-Auswertung ist nur so gut wie die Eingangsdaten. Wenn jeder Beobachter in Testsessions anders protokolliert, unterschiedliche Felder, unterschiedliche Terminologie, unterschiedliche Detailtiefe, kann KI diese Heterogenität nicht zuverlässig harmonisieren. Der erste Schritt vor jeder Automatisierung: ein einheitliches Testprotokoll-Template definieren, das alle Beobachter verbindlich verwenden.
2. KI als Entscheider für die Schweregradbewertung einsetzen. Ein KI-Assistent kann Vorschläge für die Schweregradbewertung von Usability-Problemen machen, basierend auf definierten Kriterien. Aber die Entscheidung, ob ein Use Error ein sicherheitsrelevantes Risiko darstellt, ist eine inhaltliche und regulatorisch relevante Entscheidung, die eine fachkundige Person mit Kenntnis des Produkts, der Nutzergruppe und der klinischen Konsequenzen treffen muss. KI berät, Mensch entscheidet.
3. Video-Rohmaterial direkt in Cloud-Services laden. Videoaufnahmen aus Usability-Tests enthalten in der Regel Bildaufnahmen von Personen (Probanden) und potenziell klinische Umgebungen (Krankenhausräume, Geräte mit Patientendaten). Das direkte Hochladen in Cloud-Dienste verletzt in der Praxis fast immer DSGVO-Anforderungen. Schritt zwei nicht vor Schritt eins: immer zuerst pseudonymisieren und Gesichter/Identifikatoren entfernen.
4. Das UEF erst nach der Produktentwicklung schreiben. Der häufigste Fehler überhaupt im Usability Engineering: Das Usability Engineering File wird rückwirkend zusammengestellt, statt begleitend während der Entwicklung aufgebaut zu werden. IEC 62366-1 verlangt einen prozessbegleitenden Ansatz, Formative Evaluation während der Entwicklung, summative Bewertung am Ende. KI kann nachträgliche Strukturierung erleichtern, aber ein Notified Body erkennt retrospektiv erstellte Dokumente oft an fehlenden Zeitstempeln und Versionierungen.
Was mit der Einführung wirklich passiert, und was nicht
In der Praxis begegnen Human-Factors-Projekte zwei typischen Widerstands-Mustern:
Das Erfahrungs-Silo-Problem: In mittelständischen Medizintechnikunternehmen gibt es oft eine Person, die alle summativen Bewertungen durchgeführt hat und das UEF in ihrer Systematik kennt. Diese Person ist entscheidend, nicht als Widerstandspunkt, sondern als Wissensträger. Ihr Kategorisierungssystem, ihre Bewertungskriterien müssen in das KI-Prompt und die Konfiguration überführt werden. Wer das überspringt und ein generisches System einrichtet, bekommt ein System, das gut klingt, aber an den entscheidenden Stellen (Schweregradbewertung, Risikoverbindung) nicht das tut, was erfahrungsgemäß funktioniert.
Das Skeptizismus-Problem bei externen Reviewern: Wenn ein externer Notified-Body-Reviewer eine Usability-Akte sieht, die deutlich strukturierter und konsistenter aussieht als frühere Einreichungen, kann das Fragen aufwerfen: „Wurde das wirklich so sorgfältig dokumentiert, oder wurde hier nachträglich aufgeräumt?” Die Antwort liegt in der Versionierungshistorie und in der Qualität der Primärdaten. Wenn die Rohtestprotokolle gut strukturiert sind und KI transparent als Hilfsmittel dokumentiert ist, ist das kein Problem, es ist ein Vorteil.
Was konkret hilft:
- Testprotokoll-Templates gemeinsam mit der erfahrensten Human-Factors-Person entwickeln
- Die Kategorisierungslogik der KI mit einem Vergleich gegen manuell bewertete Testdaten validieren, erst dann produktiv einsetzen
- Im UEF explizit dokumentieren, dass KI-Unterstützung für bestimmte Schritte eingesetzt wurde, mit Beschreibung der manuellen Überprüfungsschritte
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Protokoll-Standardisierung | Woche 1–3 | Testprotokoll-Template entwickeln, Beobachter-Training | Widerstand gegen Änderung etablierter Workflows, frühzeitig einbinden |
| Transkriptions-Setup | Woche 2–5 | Whisper lokal einrichten, Pseudonymisierungsworkflow definieren | Technisches Setup braucht IT-Unterstützung, Kapazität einplanen |
| KI-Konfiguration und Validierung | Woche 4–12 | Auswertungs-Prompt entwickeln, mit Beispieldaten testen, Kategorisierungslogik kalibrieren | Erste Ergebnisse weichen von manuellem Standard ab, Kalibrierungsiterationen einplanen |
| Pilotauswertung | Woche 10–16 | Erste echte Testsession vollständig KI-gestützt auswerten | Datenqualität der Testprotokolle schlechter als erwartet, Protokoll-Template nachschärfen |
| Produktiver Einsatz | ab Woche 14–18 | Komplette summative Evaluation mit KI-Unterstützung | Einzelne Beobachter weichen vom Protokoll ab, regelmäßige Kalibrierungssessions nötig |
Häufige Einwände, und was dahintersteckt
„Usability Engineering ist zu komplex für KI, das erfordert echtes Human-Factors-Fachwissen.” Richtig. Aber die meisten Stunden, die für Usability-Dokumentation aufgewendet werden, sind kein Fachwissen-Einsatz, sie sind Strukturierungsarbeit: Protokolle transkribieren, Felder ausfüllen, Tabellen erstellen, Entwurfstexte schreiben. Genau das übernimmt KI. Der Fachwissen-Teil, ob ein Usability-Problem sicherheitsrelevant ist, ob die Probandengruppe repräsentativ war, bleibt beim Menschen.
„Unsere Tests werden von externen Consultants durchgeführt, das betrifft uns nicht.” Selbst wenn die Tests extern durchgeführt werden: Die Dokumentation liegt beim Hersteller. Das UEF gehört zur technischen Akte und muss vom Hersteller freigegeben werden. KI-Unterstützung bei der internen Auswertung und Einbindung externer Testergebnisse ist auch dann relevant, wenn die Tests selbst ausgelagert sind.
„Wir haben nur ein Produkt, der Aufwand für eine eigene Lösung ist zu groß.” Für ein einziges Produkt mit seltenen Usability-Evaluationen ist das möglicherweise richtig. Die Alternative: einen gut konfigurierten KI-Assistenten ad-hoc für die Protokollauswertung einsetzen, ohne feste Infrastruktur. Kosten dafür: wenige Stunden Setup, 20–50 Euro LLM-Gebühren. Kein Tool-Investment, aber deutliche Zeitersparnis bei der Auswertung.
Woran du merkst, dass das zu dir passt
- Usability-Testauswertung bindet regelmäßig mehr als 2 Wochen Kapazität pro Produktzyklus
- Das Team führt formative oder summative Evaluationen für mehr als ein Produkt pro Jahr durch
- Rückfragen vom Notified Body betrafen inkonsistente Schweregradbewertungen oder fehlende Rückverfolgbarkeit im UEF
- Das Protokollierungs-System variiert je nachdem, wer die Testsession beobachtet, keine einheitlichen Vorlagen
- Videomaterial liegt unausgewertet auf einem Server, weil die Kapazität für systematische Auswertung fehlt
Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:
-
Klasse-I-Produkte ohne sicherheitsrelevante Nutzerschnittstelle. Für einfache Klasse-I-Geräte ohne kritische Nutzungsszenarien sind die Usability-Anforderungen weniger umfangreich, der Einrichtungsaufwand eines strukturierten Systems ist dort nicht gerechtfertigt.
-
Noch keine Usability-Engineering-Prozesse etabliert. KI-Unterstützung setzt voraus, dass der Grundprozess, wer führt welche Tests durch, welche Dokumente entstehen, bereits definiert ist. Wenn das Unternehmen noch kein UEF-Template hat und nie systematisch nach IEC 62366-1 vorgegangen ist, ist die erste Priorität der Aufbau des Prozesses, nicht seine Automatisierung.
-
Kein dediziertes Human-Factors-Wissen intern oder extern. Die inhaltliche Qualität der summativen Bewertung, ob die richtigen Probanden ausgewählt wurden, ob kritische Aufgaben vollständig abgedeckt sind, ob Use Errors korrekt klassifiziert werden, kann KI nicht sicherstellen. Ohne eine fachkundige Person, die diese Entscheidungen trifft, produziert das System konsistente, aber möglicherweise inhaltlich falsche Dokumente.
Das kannst du heute noch tun
Starte mit der Auswertung von drei abgeschlossenen Testprotokollen aus einem zurückliegenden Usability-Test. Strukturiere die Rohdaten in eine einfache Tabelle und verwende diesen Prompt:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- IEC 62366-1:2015/Amd 1:2020: Internationale Norm „Medical devices, Application of usability engineering to medical devices”, verfügbar über IEC-Webstore und DIN.
- Anforderungen Usability Engineering File (UEF): Greenlight Guru, „IEC 62366: What You Need To Know About Usability Engineering” (2024); MDX CRO, „IEC 62366 Usability Engineering for Medical Devices: Complete Guide” (2026).
- Erfahrungswerte Auswertungsaufwand 40–80 Stunden: Kumuliert aus Regulatory-Consulting-Projektbeschreibungen (Metecon, custom-medical.com) und Human-Factors-Trainingsinhalten (TÜV SÜD, dekra).
- Kosten externe Human-Factors-Consultants: Erfahrungswerte aus Vergabedaten im DACH-Raum (nicht öffentlich; eigene Einschätzung auf Basis zugänglicher Tagessätze).
- Pseudonymisierungspflicht bei Probandendaten: Verordnung (EU) 2016/679 (DSGVO), Art. 4 und 25 (Privacy by Design); MDCG 2021-6 Guidance on SaMD.
- MDR-Harmonisierung IEC 62366-1: Amtsblatt der Europäischen Union, Liste harmonisierter Normen für Medizinprodukte (aktuelle Fassung 2024).
Du willst wissen, wie ihr eure bestehenden Usability-Testprotokolle schnell in eine IEC-62366-konforme Struktur bringen könnt? Meld dich, wir schauen es uns gemeinsam an.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Technische Dokumentation nach MDR erstellen
KI unterstützt bei der Erstellung technischer Dokumentationen gemäß EU MDR 2017/745. Strukturierung, Vollständigkeitsprüfung und Textgenerierung aus vorhandenen Daten.
Mehr erfahrenPost-Market Surveillance Berichte automatisieren
KI analysiert Felddaten, Beschwerden und Vigilanzmeldungen und erstellt strukturierte PMS-Berichte nach MDR-Anforderungen automatisch.
Mehr erfahrenFSCA unter Zeitdruck: 15 Tage, vier Abteilungen, kein Platz für Koordinationsfehler
Ein KI-gestütztes FSCA-System erzeugt Field-Safety-Notice-Entwürfe aus Incident-Daten, prüft sie gegen MDR-Artikel 87–89 und koordiniert die Kommunikation mit Behörden, Kunden und internen Stellen, mit lückenlosem Audit-Trail.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.