FAIR-konformen Datenmanagementplan (DMP) mit KI erstellen
KI beschleunigt die Erstellung von FAIR-konformen Datenmanagementplänen für DFG- und Horizon-Europe-Anträge von 15–20 Stunden auf 2–4 Stunden, mit fachspezifischen Repositorien-Vorschlägen und automatischer Compliance-Prüfung.
- Problem
- DFG-Anträge erfordern seit 2022 einen vollständigen Forschungsdatenmanagement-Abschnitt in Sektion 2.4. Horizon-Europe-Projekte müssen innerhalb von sechs Monaten nach Bewilligung einen detaillierten DMP einreichen. Die manuelle Erstellung dauert 10–20 Stunden und scheitert oft an fehlendem Fachwissen über FAIR-Prinzipien, Metadatenstandards und zugelassene Repositorien.
- KI-Lösung
- LLM-Assistent extrahiert die projektspezifischen Kerndaten aus der Antragsbeschreibung, befüllt DMP-Templates nach DFG-, Horizon- und NFDI-Vorgaben, schlägt passende Repositorien und Metadatenschemata vor und prüft die FAIR-Konformität der geplanten Datenablage.
- Typischer Nutzen
- DMP-Erstellung von 15–20 auf 2–4 Stunden verkürzt. Vollständigere und spezifischere Pläne, die Gutachter-Feedback seltener auslösen. Strukturelle Verbesserung der Forschungsdaten-Nachnutzbarkeit als Nebeneffekt.
- Setup-Zeit
- 6–10 Wochen inkl. Template-Konfiguration und Repositorien-Mapping
- Kosteneinschätzung
- 0–20 €/Monat laufend (ChatGPT/Claude Pro); RDMO kostenlos, kein Setup-Invest
Es ist ein Dienstagabend Mitte März. Dr. Mira Schönfeld sitzt an ihrem Schreibtisch im Büro, Deadline in vier Stunden. Die Zusammenfassung der Gutachtenrunde liegt vor ihr.
Abschnitt 2.4, Umgang mit Forschungsdaten: „Der vorliegende Datenmanagementplan genügt den Anforderungen nicht. Die Beschreibung bleibt zu allgemein und lässt keinen Bezug zu den im Antrag genannten MRT-Datensätzen erkennen. FAIR-Prinzipien werden zitiert, aber nicht auf die konkrete Datenlage angewendet. Es fehlen Angaben zu Metadatenstandards, zum Repositorium für klinische Bildgebungsdaten sowie zur langfristigen Zugänglichkeit. Eine überarbeitete Version ist bis zum Ende der laufenden Förderrunde einzureichen.”
Mira starrt auf den letzten Satz. Ende der laufenden Förderrunde: in sechs Wochen. Das Fördervolumen: 380.000 Euro über drei Jahre. Ihr Postdoc-Vertrag läuft in neun Monaten aus.
Sie hat den DMP in drei Stunden geschrieben, zwei Tage vor der Einreichung, nach einem langen Messtag. Sie hatte eine Vorlage aus dem Internet kopiert, die Feldbezeichnungen angepasst und gehofft, es würde reichen. Die Vorlage war generisch, für genomische Daten optimiert, nicht für klinische Bildgebung. Sie hatte nicht gewusst, dass es für MRT-Datensätze spezifische Metadatenstandards gibt, dass BIDS das bevorzugte Format in ihrer Community ist und dass das EBRAINS-Repositorium für Neurowissenschaften unter den zugelassenen Ablageorten der DFG steht.
Die Überarbeitungsfrist ist knapp. Wenn der zweite Entwurf ebenfalls nicht ausreicht, fällt das Projekt aus der laufenden Runde heraus, nächster regulärer Einreichungstermin: sieben Monate später.
Das ist keine Frage fehlender Sorgfalt. Es ist eine Frage fehlender Spezialisierung in einem Bereich, der plötzlich Pflicht ist, ohne dass irgendjemand das gelehrt hat.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
Der Datenmanagementplan gehört zu den jüngsten Pflichtbestandteilen wissenschaftlicher Förderanträge, und zu den am häufigsten unterschätzten.
Die Deutsche Forschungsgemeinschaft hat 2022 den Abschnitt zum Umgang mit Forschungsdaten in ihren Antragsrichtlinien konkretisiert und formalisiert. Seitdem ist der Forschungsdatenmanagement-Abschnitt Teil des regulären Begutachtungsprozesses, Gutachtende können die Bewilligung verweigern oder unter Vorbehalt stellen, wenn der Abschnitt unvollständig oder zu generisch ist. Horizon-Europe-Projekte müssen innerhalb von sechs Monaten nach Vertragsbeginn einen detaillierten Datenmanagementplan als eigenes Deliverable einreichen, mit vorgeschriebenen Update-Zeitpunkten bei Projekthalbzeit und Projektende.
Das Problem ist nicht, dass Forschende nicht guten Willens wären. Es ist, dass ordentliches Datenmanagement ein Spezialisierungsfeld ist, das in den meisten Fachcurricula nicht vorkommt:
- Welches Repositorium ist für meine Disziplin und meine Datentypen geeignet? Für klinische Bildgebung gelten andere Standards als für genomische Daten oder Umfragedaten.
- Welcher Metadatenstandard ist in meiner Community akzeptiert? Dublin Core ist generisch; BIDS (Brain Imaging Data Structure) ist für Neurowissenschaften spezifisch; DataCite ist für Forschungsdaten allgemein; DDI ist für Sozialwissenschaften.
- Wie formuliert man FAIR-Prinzipien konkret für ein spezifisches Projekt, statt sie nur abstrakt zu erwähnen?
Die Schätzungen, wie lange die Erstellung eines qualitativ hinreichenden DMP dauert, variieren erheblich: Einige Hochschulbibliotheken gehen von 8–12 Stunden für einen erfahrenen Forschenden aus, andere berichten von 15–20 Stunden bei Erstantragstellern ohne Vorwissen. Das Projekt DMP Chef (UC3 und FAIR Data Innovations Hub, 2025/2026) hat LLM-basierte DMP-Entwürfe gegen menschlich erstellte Muster getestet, und kam zu dem Ergebnis, dass die LLM-Versionen im Schnitt höhere Zufriedenheitsbewertungen erzielten (3,4 von 5) als die Referenz-DMPs menschlicher Expertinnen und Experten (3,1 von 5), bei gleichzeitig weniger berichteten Fehlern in den LLM-Versionen.
Das Risiko des Nichthandelns ist dabei konkret messbar: Ein DMP, der Gutachtende als zu generisch oder thematisch nicht passend eingestuft wird, kann zum Überarbeitungsaufwand führen, der die Einreichungsfrist gefährdet, oder schlimmstenfalls zum Ausfall aus der laufenden Förderrunde.
Anforderungen an Datenmanagementpläne ändern sich mit jeder Förderrunde und je nach Förderlinie. Prüfe die aktuellen Vorgaben direkt im Merkblatt deines Fördermittelgebers vor der Antragstellung.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit KI-Unterstützung |
|---|---|---|
| Erstellungszeit pro DMP (Erstantrag) | 15–20 Stunden | 2–4 Stunden |
| Vollständigkeit der Repositorien-Angaben | Hängt von der Eigenrecherche ab | Systematisch aus Datenbanken abgeleitet |
| FAIR-Konformität des Plans | Oft formal, selten projektspezifisch | Auf Datenpakete des Projekts angewendet |
| Konsistenz mit Antragsbeschreibung | Manuell abzugleichen | Direkt aus der Projektbeschreibung extrahiert |
| Überarbeitungsaufwand nach Gutachten | Hoch bei generischen DMPs | Niedriger bei spezifischeren Erstversionen |
Schätzwerte auf Basis von DMP-Erfahrungsberichten an Universitätsbibliotheken und des DMP-Chef-Projekts (UC3/FAIR Data Innovations Hub, 2025/2026). Keine repräsentative Studie.
FAIR-Prinzipien konkret: Was die vier Buchstaben für deinen DMP bedeuten
Das Akronym FAIR, Findable, Accessible, Interoperable, Reusable, wurde 2016 von Wilkinson et al. in Scientific Data (Nature) veröffentlicht und ist seitdem zur Grundlage der meisten Förderanforderungen geworden. Aber im DMP bedeutet FAIR nicht, die vier Buchstaben zu nennen und abzuhaken.
Findable (Auffindbar): Deine Daten bekommen einen persistenten Identifikator, typischerweise einen DOI, vergeben vom Repositorium. Metadaten werden so angelegt, dass Suchmaschinen und Datenportale sie finden. Das DMP muss beschreiben, welches Repositorium du wählst und wie du den Identifikator vergibst. „Wir werden die Daten verfügbar machen” ist keine ausreichende Antwort.
Accessible (Zugänglich): Zugänglich bedeutet nicht zwingend offen. Es bedeutet, dass der Zugang klar geregelt ist, mit Zugriffsbedingungen, die protokolliert und wiederauffindbar sind. Bei klinischen Daten oder Daten mit kommerziellem Verwertungspotenzial ist eingeschränkter Zugang möglich; aber die Zugangsbedingungen müssen transparent dokumentiert sein. Das DMP muss erklären, wer unter welchen Bedingungen Zugriff erhält.
Interoperable (Interoperabel): Das ist der Abschnitt, der am häufigsten fehlt. Interoperabel bedeutet: Die Daten verwenden standardisierte Formate und kontrollierte Vokabulare, damit andere Systeme sie verarbeiten können. Konkret heißt das: Welcher Metadatenstandard wird verwendet (BIDS, DDI, DataCite, Dublin Core, ISO 19115 für Geodaten)? Werden Ontologien für Fachbegriffe genutzt (MeSH, Gene Ontology, SNOMED CT)?
Reusable (Nachnutzbar): Nachnutzbar bedeutet, dass die Daten mit einer klaren Lizenz versehen werden und ausreichend dokumentiert sind, dass andere Forschende sie ohne Rückfrage an dich verwenden können. Das DMP muss Angaben zur Lizenz (Creative Commons, Open Data Commons) und zur beigelegten Dokumentation enthalten.
Ein KI-Assistent kann diesen Durcharbeitungsprozess erheblich beschleunigen, aber er kann die projektspezifischen Entscheidungen nicht an deiner Stelle treffen. Er schlägt Optionen vor; du entscheidest und begründest.
Einschätzung auf einen Blick
Zeitersparnis, hoch (4/5)
Wer einen DMP erstmals von Grund auf schreibt, investiert ohne Unterstützung 15–20 Stunden. Mit einem gut konfigurierten KI-Prompting-Workflow, der auf die Projektbeschreibung zugreift und aus Repositorien-Datenbanken ergänzt, lässt sich das auf 2–4 Stunden verkürzen. Das entspricht einer Einsparung von 73–80 Prozent, real, messbar und besonders bei mehreren Anträgen im Jahr spürbar. Die höheren Zeitersparnis-Werte dieser Kategorie (5/5) erzielen Use Cases, die vollständig repetitive Schreibarbeit automatisieren. Der DMP braucht immer noch projektspezifische Entscheidungen, daher 4 statt 5.
Kosteneinsparung, niedrig (2/5)
Die Tool-Kosten sind gering: RDMO ist Open Source und über viele Hochschulen kostenlos nutzbar. ChatGPT Plus oder Claude Pro kosten 18–20 Euro pro Monat. Der Hauptnutzen entsteht durch eingesparte Personalzeit, aber diese Zeit ist für Forschende typischerweise nicht direkt verrechenbar. Es gibt kein direkt messbares Kostenziel wie bei der Rechnungsverarbeitung. ROI entsteht hier über Compliance und Antragsqualität, nicht über direkte Budgeteinsparung.
Schnelle Umsetzung, mittel (3/5)
Ein funktionsfähiger KI-unterstützter DMP-Workflow ist in 2–3 Wochen einsatzbereit. Die 6–10 Wochen Gesamtzeit entstehen, wenn du erstmalig das Repositorien-Mapping für deine Disziplin aufbaust, fachspezifische Metadatenstandards recherchierst und den Prompt für die spezifische Förderlinie kalibrierst. Wer die Infrastruktur einmal aufgesetzt hat, kann folgende DMPs deutlich schneller erstellen.
ROI-Sicherheit, sehr hoch (5/5)
Das ist der Kern der Argumentation: Ein DMP ist für DFG-Anträge und Horizon-Europe-Projekte keine Option, sondern eine Pflichtanforderung. Ohne einen qualitativ hinreichenden DMP riskierst du die Ablehnung des Gesamtantrags oder eine Überarbeitungsanforderung, die die Einreichungsfrist gefährdet. Das Fördervolumen typischer DFG-Sachbeihilfen liegt zwischen 150.000 und 500.000 Euro; ERC-Grants überschreiten diese Summen deutlich. Die Kosten eines unzureichenden DMPs sind damit im besten Fall Zeitverlust durch Überarbeitung, im schlechtesten Fall der Ausfall aus der laufenden Förderrunde. Dieser Use Case ist in der forschung-Kategorie der einzige, bei dem die Konsequenz des Nichthandelns so direkt und quantifizierbar ist.
Skalierbarkeit, mittel (3/5)
Einmal aufgebaute Prompt-Templates und Repositorien-Mappings lassen sich für Folgeanträge wiederverwenden, das ist echter Skalierungseffekt. Aber jedes Forschungsprojekt hat andere Datenpakete, andere Metadatenanforderungen und andere Repositorien-Logiken. Ein DMP für genomische Daten ist nicht wiederverwendbar für ein Projekt mit ethnografischen Beobachtungsdaten. Die Skalierung ist damit begrenzt auf die Disziplin und den Datentyp, für breit aufgestellte Forschungsgruppen hilft das, für sehr heterogene Forschungsbereiche weniger.
Richtwerte, stark abhängig von Fachrichtung, Datentyp und vorhandener institutioneller Infrastruktur.
Was der KI-DMP-Assistent konkret macht
Der technische Ansatz kombiniert zwei Schritte.
Schritt 1, Extraktion: Du gibst deine Projektbeschreibung oder das Abstract deines Antrags in den KI-Assistenten. Der Prompt weist ihn an, spezifisch nach Datenpaketen zu suchen: Welche Arten von Daten werden erhoben? In welchen Formaten? Wer erhebt sie wann? Wie groß werden die Datenpakete voraussichtlich sein? Das Ergebnis ist eine strukturierte Liste der Datenpakete deines Projekts, die Grundlage des DMP.
Schritt 2, Template-Befüllung: Ein zweiter Prompt befüllt das entsprechende DMP-Template (DFG-Checkliste, Horizon-Europe-Template) mit den extrahierten Datenpaketen und ergänzt sie durch standardisierte Angaben: geeignete Repositorien für den Datentyp, übliche Metadatenstandards in der Disziplin, Standard-Lizenzoptionen, Aufbewahrungsfristen.
Was der KI-Assistent dabei nicht kann: Er kennt die spezifische institutionelle Infrastruktur deiner Hochschule nicht. Er weiß nicht, welche Vereinbarungen deine Einrichtung mit spezifischen Repositorien hat. Er kann nicht beurteilen, ob deine Daten klinisch-sensitiv sind und besondere Datenschutzregeln auslösen. Diese Entscheidungen musst du selbst treffen, oder in Rücksprache mit der Forschungsdatenstelle deiner Bibliothek.
Das Ergebnis ist kein fertig einreichbarer DMP, sondern ein strukturierter Entwurf, der deutlich projektspezifischer ist als eine generisch kopierte Vorlage, und den du in 1–2 Stunden zur Einreichungsreife bringst statt in 15–20 Stunden von Grund auf.
Welche Repositorien für welche Disziplinen
Die Wahl des Repositoriums ist einer der häufigsten Schwachpunkte in eingereichten DMPs. Eine Liste häufiger Disziplin-Repositorien-Kombinationen:
| Disziplin / Datentyp | Repositorium | Metadatenstandard |
|---|---|---|
| Sozialwissenschaften, Umfragedaten | GESIS Datenarchiv, CESSDA | DDI (Data Documentation Initiative) |
| Neurowissenschaften, Bildgebung | EBRAINS, OpenNeuro | BIDS (Brain Imaging Data Structure) |
| Genomik, Molekularbiologie | ENA, NCBI, ArrayExpress | INSDC-Standards, MIAME |
| Klima, Geodaten | PANGAEA, Copernicus | ISO 19115, CF Conventions |
| Kulturerbe, Geisteswissenschaften | CLARIN, DARIAH | TEI, Dublin Core |
| Allgemeine Forschungsdaten | Zenodo, Dryad | DataCite Metadata Schema |
Anforderungen an Datenmanagementpläne ändern sich mit jeder Förderrunde und je nach Förderlinie. Prüfe die aktuellen Vorgaben direkt im Merkblatt deines Fördermittelgebers vor der Antragstellung.
Konkrete Werkzeuge, was wann passt
RDMO (Research Data Management Organiser), Das bevorzugte Werkzeug für Forschende an deutschen Hochschulen. Open Source, selbst hostbar, enthält fertige Fragebögen für DFG-Checkliste und Horizon-Europe-Template. Viele Universitätsbibliotheken betreiben institutionelle Instanzen, die kostenlos zugänglich sind. RDMO hat alleine keine KI-Funktionalität, es strukturiert die Fragen, du beantwortest sie. Sinnvoll: RDMO für die Struktur, KI-Assistent für das Befüllen. 56+ Instanzen an deutschsprachigen Hochschulen (Stand: November 2023, CODATA Data Science Journal 2024).
DMPonline, Die britische Alternative, webbasiert ohne lokalen Setup. Enthält Templates für über 30 Fördergeber inklusive Horizon Europe. Besonders nützlich für internationale Konsortien, bei denen institutionelle RDMO-Instanzen nicht für alle Partner verfügbar sind. Keine KI-Integration eingebaut, aber gut als strukturierte Vorlage für KI-unterstütztes Befüllen.
ChatGPT (Plus/Team), Für die Extraktion und das Entwurf-Befüllen des DMP. Der Plus-Plan (20 USD/Monat) reicht für gelegentliche DMP-Arbeit. Wichtig: Antragsdaten, die projektspezifische Informationen über noch unveröffentlichte Forschung enthalten, sollten nicht im Free-Plan eingegeben werden (kein standardmäßiges Training-Opt-out). Ab Team-Plan kein Training auf Eingaben.
Claude (Pro), Für längere Projektbeschreibungen und die Befüllung mehrseitiger DMP-Templates. Das 200.000-Token-Kontextfenster erlaubt das gleichzeitige Einspeisen des vollständigen Antrags und des DMP-Templates ohne Informationsverlust. Stärke bei strukturierter Textproduktion, die konsistent auf den Quelltext zurückverweist.
OpenAIRE ARGOS, Teil der OpenAIRE-Toolchain, speziell für maschinenlesbare DMPs entwickelt. Unterstützt den RDA DMP Common Standard und ist mit Zenodo und anderen EOSC-Repositorien verknüpft. Für Horizon-Europe-Projekte besonders interessant, weil die Anbindung an die europäische Open-Science-Infrastruktur direkt vorhanden ist. Komplett kostenlos.
Zusammenfassung: Wann welcher Ansatz
- Institutionelle Instanz vorhanden → RDMO als Struktur + ChatGPT/Claude für Entwurf
- Internationales Konsortium → DMPonline als Struktur + ChatGPT/Claude für Entwurf
- Horizon-Europe-Projekt mit EOSC-Fokus → OpenAIRE ARGOS
- Alle Szenarien: KI-Assistent für Extraktion und Formulierung, nie als alleiniges Werkzeug
Datenschutz und Datenhaltung
Anträge enthalten oft vertrauliche Informationen: noch unveröffentlichte Forschungsideen, Kooperationspartner, geplante Methoden, manchmal auch Vorabdaten. Das muss bei der Wahl des KI-Werkzeugs bedacht werden.
DSGVO-Relevanz: Wenn die Antragsdaten keine personenbezogenen Daten enthalten (bei den meisten naturwissenschaftlichen Anträgen der Fall), ist das primäre Risiko die vertrauliche Behandlung der Forschungsidee, nicht die DSGVO. Für medizinische Projekte mit Patientendaten oder sozialwissenschaftliche Projekte mit Personenbezug gilt: Keine Rohdaten in den KI-Assistenten, nur die beschreibende Projektdarstellung.
Training-Opt-out beachten:
- ChatGPT Free und Plus nutzen Eingaben standardmäßig für Modell-Training (Opt-out ist in den Einstellungen möglich, aber kein Default). Ab dem Team-Plan kein Training.
- Claude Pro nutzt Eingaben standardmäßig nicht für Training; AVV über Anthropic verfügbar.
- Institutionelle Hochschul-KI-Plattformen (z. B. über GWDG oder RZG) bieten häufig DSGVO-konforme Alternativen, bei der IT-Abteilung oder Bibliothek nachfragen.
Repositorien-Wahl für die Daten selbst:
Zenodo (CERN, Genf) und GESIS (Köln) sind EU-gehostet und DSGVO-konform. NCBI und ArrayExpress (EMBL-EBI) sind international, aber für genomische Daten branchenüblich, für personenbezogene genomische Daten gelten besondere Anforderungen (GDPR-Artikel 9, genetische Daten als besondere Kategorie).
Was es kostet, realistisch gerechnet
Tool-Kosten:
- RDMO: Kostenlos (open-source, institutionell gehostet)
- DMPonline: Kostenlos
- ChatGPT Plus: 18–20 Euro/Monat (alternativ ChatGPT Team ab 25 USD/Nutzer/Monat für besseren Datenschutz)
- Claude Pro: 18 Euro/Monat
Personalzeit:
- Erstmaliger Aufbau des Prompting-Workflows: 4–8 Stunden (einmalig)
- Repositorien-Mapping für die eigene Disziplin: 2–4 Stunden (einmalig)
- DMP-Erstellung pro Antrag danach: 2–4 Stunden statt 15–20 Stunden
Was du dagegenrechnen kannst:
Ein wissenschaftlicher Mitarbeitender mit Postdoc-Qualifikation hat einen Bruttostundensatz von ca. 30–50 Euro (inkl. Arbeitgeberanteil, basierend auf TV-L E13/E14 Bayern/NRW, Destatis 2024). Die Einsparung von 12–16 Stunden pro DMP entspricht 360–800 Euro Personalkosten. Bei drei bis fünf Anträgen pro Jahr ergibt das 1.000–4.000 Euro eingesparte Personalzeit, bei Tool-Kosten von 200–250 Euro pro Jahr.
Dieser Vergleich ist konservativ und berücksichtigt nicht den Wert eines qualitativ besseren DMP, der seltener zur Überarbeitung zurückkommt, und erst recht nicht den Wert eines Antrags, der durch einen hinreichenden DMP nicht in der Begutachtung gestoppt wird.
Wie du den Nutzen misst:
Zähl, wie viele DMP-Abschnitte in deinen letzten drei Anträgen Gutachterkommentare ausgelöst haben. Ein KI-unterstützter DMP-Prozess sollte diesen Wert gegen Null bringen.
Typische Einstiegsfehler
1. Den KI-Assistenten ohne Projektkontext verwenden.
Der häufigste Fehler: Man gibt nur den Förderer an und bittet ChatGPT, einen DMP zu schreiben. Das Ergebnis ist generisch, das Gleiche, das du auch mit einer kopierten Vorlage produziert hättest. Der Unterschied liegt darin, dass du deine Projektbeschreibung, deine Datenpakete und deine Methoden explizit eingibst. Ein KI-Assistent kann nur so spezifisch sein wie der Input, den er erhält.
2. Das KI-Ergebnis ungeprüft einreichen.
LLM-generierte DMPs neigen dazu, bei unbekannten Disziplinen falsche Repositorien oder veraltete Metadatenstandards zu empfehlen. Das DMP-Chef-Projekt (2025/2026) zeigt zwar, dass LLMs im Durchschnitt besser abschneiden als generische menschliche Entwürfe, aber einzelne Fehler kommen vor, und diese Fehler landen dann vor Gutachtenden. Jede Angabe zum Repositorium und zum Metadatenstandard muss verifiziert werden, bevor sie eingereicht wird. Zehn Minuten Überprüfung können Wochen Überarbeitungsaufwand ersparen.
3. FAIR als Checkliste abarbeiten, statt konkret zu werden.
Viele DMPs enthalten Sätze wie „Die Daten werden nach FAIR-Prinzipien verwaltet.” Das ist kein DMP, das ist eine Absichtserklärung. Gutachtende erwarten: welches Repositorium konkret, welcher persistente Identifikator, welcher Metadatenstandard, welche Lizenz. Der KI-Assistent muss explizit angewiesen werden, diese Konkretisierung für jedes Datenpaket vorzunehmen.
4. Den DMP nach Einreichung vergessen.
Horizon-Europe-Projekte müssen den DMP mindestens einmal bei Projekthalbzeit aktualisieren und bei Projektende final abgeben. DFG-Projekte berücksichtigen den Umgang mit Forschungsdaten auch im Verwendungsnachweis. Ein DMP, der zum Zeitpunkt der Einreichung korrekt war, aber nie an die tatsächliche Datenerhebung angepasst wurde, ist beim ersten Update-Termin wertlos. Das ist der gefährlichste Fehler, weil er silent passiert: Das System läuft scheinbar, bis der erste Review-Termin enthüllt, dass der Plan zwei Jahre in der Schublade lag.
Was mit der Einführung wirklich passiert, und was nicht
Der KI-unterstützte DMP-Prozess funktioniert sofort, und scheitert trotzdem in zwei typischen Konstellationen.
Die Reaktion der Forschungsdatenstelle: Universitätsbibliotheken und Forschungsdatenstellen haben in den letzten Jahren erhebliche Expertise zu Datenmanagementplänen aufgebaut. Einige reagieren auf KI-generierte DMPs skeptisch, weil sie befürchten, dass Forschende die Spezifik ihrer Daten nicht mehr selbst reflektieren. Diese Skepsis ist berechtigt, aber sie richtet sich gegen den Fehler 1 (Prompt ohne Kontext), nicht gegen den KI-Ansatz insgesamt. Wenn du die Forschungsdatenstelle frühzeitig einbeziehst und den KI-Assistenten als Formulierungshilfe positionierst, nicht als Entscheidungsinstanz, ist die Reaktion in der Regel kooperativ.
Die fehlenden Vorentscheidungen: Ein KI-Assistent kann keinen DMP schreiben, wenn noch nicht entschieden ist, in welchem Format die Daten erhoben werden, wer die Rechte an den Rohdaten hat oder ob klinische Daten unter Datenschutzanforderungen fallen. Diese Vorentscheidungen müssen vor der DMP-Erstellung getroffen sein, der KI-Assistent macht sie nicht. Wenn sie noch nicht getroffen sind, hilft der KI-Assistent dabei, die offenen Fragen strukturiert zu formulieren, was wiederum das Gespräch mit der Forschungsdatenstelle produktiver macht.
Was konkret hilft:
- Führ den KI-Prompting-Prozess gemeinsam mit einer Person aus der Forschungsdatenstelle durch (einmalig, als Lernprozess)
- Hinterlege das Repositorien-Mapping für deine Disziplin als gespeichertes Dokument, das spart bei jedem folgenden DMP Zeit
- Prüfe nach der KI-Erstellung immer die fachspezifischen Repositorien-Empfehlungen anhand der aktuellen Listen deines Fördergebers
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Orientierung & Infrastruktur | Woche 1–2 | Zugang zu RDMO oder DMPonline einrichten; aktuelles DFG/Horizon-Template laden; ChatGPT Team oder Claude Pro einrichten | Kein Zugang zu institutionellem RDMO, Alternative DMPonline oder ChatGPT Projects nutzen |
| Repositorien-Mapping | Woche 2–3 | Für die eigene Disziplin die passenden Repositorien und Metadatenstandards recherchieren; als Referenzdokument speichern | Zu viele Optionen, keine klare Empfehlung, Rücksprache mit Forschungsdatenstelle nötig |
| Prompt-Entwicklung | Woche 3–4 | Ersten Test-DMP aus Antragsentwurf erstellen; mit Originalvorgaben vergleichen; Prompt iterieren | KI-Output zu generisch, mehr Kontext über Datenpakete in den Prompt einbringen |
| Pilotbetrieb | Woche 4–8 | Ersten echten DMP für aktuellen Antrag erstellen; Feedback von Forschungsdatenstelle einholen | Gutachtende erwarten förderspezifische Sprache, Template-Mapping nachjustieren |
| Routine | Ab Woche 8 | Folgeanträge mit deutlich reduziertem Aufwand bearbeiten; DMP bei Projekthalbzeit aktualisieren | DMP veraltet während des Projekts, Erinnerung für Update-Termin eintragen |
Häufige Einwände, und was dahintersteckt
„Die KI kennt doch die DFG-Anforderungen gar nicht.”
Teilweise richtig, LLMs haben kein aktives Wissen über den aktuellen Stand der DFG-Richtlinien. Aber das ist lösbar: Du gibst das aktuelle DFG-Template und die Checkliste (verfügbar auf dfg.de) direkt in den Prompt. Dann arbeitet der Assistent nicht aus einem unsicheren Gedächtnis, sondern aus dem Text, den du ihm gibst. Das gleiche gilt für das Horizon-Europe-DMP-Template.
„Das kostet doch trotzdem viel Zeit, erst den Prompt aufsetzen, dann prüfen.”
Beim ersten DMP stimmt das, der Einmal-Aufwand für Setup und Repositorien-Mapping liegt bei 6–12 Stunden. Das ist ähnlich wie bei einem ersten Antragsschreiben nach einem neuen Muster. Beim zweiten DMP ist der Aufwand auf 2–4 Stunden gesunken. Ab dem dritten DMP ist der Break-even erreicht. Wer weniger als einen DMP pro Jahr schreibt, profitiert kaum; wer zwei oder mehr schreibt, ist im Vorteil.
„Meine Daten sind zu komplex für KI.”
Die Datenkomplexität ist kein Ausschlusskriterium, sie ist der Grund, warum der KI-Assistent besonders nützlich ist. Komplexe Datenpakete mit mehreren Metadatenstandards, Repositorien und Zugangsbeschränkungen sind genau die Szenarien, in denen ein strukturierter Prompting-Ansatz mehr leistet als eine kopierte Vorlage. Allerdings: Bei Projekten mit klinischen Daten oder besonderen Datenschutzanforderungen muss der rechtliche Rahmen vorab mit einem Datenschutzbeauftragten geklärt sein, das ist keine KI-Aufgabe.
Woran du merkst, dass das zu dir passt
- Du stellst mehr als einen Förderantrag pro Jahr und der DMP-Abschnitt ist jedes Mal aufwändig
- Du wechselst das Förderinstrument (erstmals DFG, oder erstmals Horizon Europe) und weißt nicht sicher, was in diesem spezifischen Template gefordert ist
- Dein letzter DMP hat Gutachterkommentare ausgelöst, die auf zu geringe Spezifik hingewiesen haben
- Du hast eine Nachwuchsgruppe oder Arbeitsgruppe, in der unterschiedliche Forschende regelmäßig eigene Anträge schreiben und jedes Mal von vorne anfangen
- Deine Hochschule betreibt eine RDMO-Instanz, du hast sie aber noch nie genutzt
Wann es (noch) nicht passt, drei harte Ausschlusskriterien:
-
Die Methodik des Projekts ist noch nicht definiert. Ein DMP beschreibt, welche Daten du erhebst, in welchem Format, in welchem Umfang. Wenn das noch nicht feststeht, kann kein hinreichender DMP geschrieben werden, weder mit noch ohne KI. Der KI-Assistent kann dabei helfen, die offenen Fragen zu strukturieren, aber er kann die inhaltlichen Entscheidungen nicht ersetzen.
-
Die Daten unterliegen rechtlichen Sonderanforderungen, die noch ungeklärt sind. Klinische Patientendaten, vertrauliche Kooperationsdaten oder Daten mit kommerziellem Schutz (Betriebsgeheimnisse, Drittrechte) brauchen rechtliche Vorabklärung durch Datenschutzbeauftragte oder Technologietransfer-Büros. Ein KI-Assistent kann diese Fragen nicht beantworten, und ein DMP, der rechtliche Fragen ungeklärt lässt, wird von Gutachtenden zurückgewiesen.
-
Du hast weniger als zwei Stunden Zeit bis zur Einreichung. Dieser Use Case beschleunigt den DMP-Prozess erheblich, aber er ist kein Zauberwerk. Ein vollständiger DMP braucht nach der KI-Befüllung noch eine inhaltliche Überprüfung. Wer versucht, einen DMP in 45 Minuten mit KI zu schreiben und direkt einzureichen, produziert genau das, was Gutachtende als zu generisch markieren.
Das kannst du heute noch tun
Öffne ChatGPT Plus oder Claude Pro und lege ein neues Project/Konversation an. Lade das aktuelle DFG-Merkblatt zu Forschungsdaten (als PDF von dfg.de, Sektion 2.4) als Referenzdokument hoch. Dann formuliere einen ersten Prompt mit drei bis fünf Sätzen aus deiner Antragsskizze, und lass den Assistenten die Datenpakete des Projekts identifizieren.
Das dauert 20 Minuten. Was du danach weißt: ob der KI-Assistent aus deiner Projektbeschreibung spezifische Datenpakete extrahieren kann, das ist der entscheidende Test für die Qualität des Gesamtansatzes.
Für den produktiven Einsatz verwende diesen zweistufigen Prompt:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- DFG-Anforderungen an Forschungsdaten in Antragsabschnitt 2.4: Deutsche Forschungsgemeinschaft, „Konkretisierung der Anforderungen zum Umgang mit Forschungsdaten in Förderanträgen”, März 2022 (dfg.de/de/aktuelles/neuigkeiten-themen/info-wissenschaft/2022/info-wissenschaft-22-25). DFG-Checkliste zum Forschungsdatenmanagement, Version 21.12.2021 (dfg.de/resource/blob/174732/…/forschungsdaten-checkliste-de-data.pdf).
- Horizon-Europe-DMP-Pflicht: Europäische Kommission, Horizon Europe Model Grant Agreement, Annex 5 (Open Science requirements). Einreichungspflicht: DMP-Deliverable innerhalb von 6 Monaten nach Vertragsbeginn, Update bei Projekthalbzeit und Projektende.
- DMP Chef, LLM-generierte DMPs: UC3 (University of California Curation Center) und FAIR Data Innovations Hub, Projektergebnisse vorgestellt bei RDA Plenary 2025; Testresultate: LLM-DMPs 3,4/5 Zufriedenheit vs. 3,1/5 menschliche Referenz-DMPs (GPT-4.1, publiziert auf blog.dmptool.org, Februar 2026).
- RDMO-Adoptionsstatistik: Möller et al., „The Research Data Management Organiser (RDMO), a Strong Community Behind an Established Software for DMPs and Much More”, Data Science Journal, 2024 (doi:10.5334/dsj-2024-028). 56 produktive und Test-Instanzen an deutschen Hochschulen (Stand November 2023).
- FAIR-Prinzipien: Wilkinson, M.D. et al., „The FAIR Guiding Principles for scientific data management and stewardship”, Scientific Data 3, 160018 (2016). DOI: 10.1038/sdata.2016.18.
- Personalkosten Wissenschaftlicher Mittelbau: TV-L Entgelttabellen 2024 (E13/E14), Stundensatz-Berechnung auf Basis Destatis-Verdienstdaten 2024.
Willst du wissen, wie ein DMP-Prompting-Workflow für deine spezifische Disziplin und Förderlinie aussieht, oder welche Repositorien für deine Datenpakete infrage kommen? Meld dich, das klären wir gemeinsam in einem kurzen Gespräch.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
Literaturrecherche automatisieren
KI durchsucht Datenbanken wie PubMed, Scopus und Semantic Scholar und liefert relevante Paper mit Zusammenfassungen. Spart Wochen manueller Recherche.
Mehr erfahrenGrant-Antrag Schreibassistent
KI unterstützt beim Verfassen von Drittmittelanträgen: strukturiert Projektbeschreibungen, passt Sprache an Fördergeber an und prüft Vollständigkeit.
Mehr erfahrenForschungsdaten-Auswertung mit KI
KI analysiert große Mengen Messdaten, Umfrageergebnisse oder Textkorpora und identifiziert Muster, Ausreißer und Zusammenhänge, die manuell nicht erkennbar wären.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.