Forschung & Entwicklung forschungsdatendmpfair

FAIR-konformen Datenmanagementplan (DMP) mit KI erstellen

KI beschleunigt die Erstellung von FAIR-konformen Datenmanagementplänen für DFG- und Horizon-Europe-Anträge von 15–20 Stunden auf 2–4 Stunden, mit fachspezifischen Repositorien-Vorschlägen und automatischer Compliance-Prüfung.

⚡ Auf einen Blick

Problem: DFG-Anträge erfordern seit 2022 einen vollständigen Forschungsdatenmanagement-Abschnitt in Sektion 2.4. Horizon-Europe-Projekte müssen innerhalb von sechs Monaten nach Bewilligung einen detaillierten DMP einreichen. Die manuelle Erstellung dauert 10–20 Stunden und scheitert oft an fehlendem Fachwissen über FAIR-Prinzipien, Metadatenstandards und zugelassene Repositorien.
KI-Lösung: LLM-Assistent extrahiert die projektspezifischen Kerndaten aus der Antragsbeschreibung, befüllt DMP-Templates nach DFG-, Horizon- und NFDI-Vorgaben, schlägt passende Repositorien und Metadatenschemata vor und prüft die FAIR-Konformität der geplanten Datenablage.
Typischer Nutzen: DMP-Erstellung von 15–20 auf 2–4 Stunden verkürzt. Vollständigere und spezifischere Pläne, die Gutachter-Feedback seltener auslösen. Strukturelle Verbesserung der Forschungsdaten-Nachnutzbarkeit als Nebeneffekt.
Setup-Zeit: 6–10 Wochen inkl. Template-Konfiguration und Repositorien-Mapping
Kosteneinschätzung: 0–20 €/Monat laufend (ChatGPT/Claude Pro); RDMO kostenlos, kein Setup-Invest

LLM-Prompt mit DFG/Horizon-Template in ChatGPT/ClaudeRDMO als institutionelle StrukturierungsplattformOpenAIRE ARGOS für maschinenlesbare DMPs (EOSC)

Worum geht's?

Es ist ein Dienstagabend Mitte März. Dr. Mira Schönfeld sitzt an ihrem Schreibtisch im Büro, Deadline in vier Stunden. Die Zusammenfassung der Gutachtenrunde liegt vor ihr.

Abschnitt 2.4, Umgang mit Forschungsdaten: „Der vorliegende Datenmanagementplan genügt den Anforderungen nicht. Die Beschreibung bleibt zu allgemein und lässt keinen Bezug zu den im Antrag genannten MRT-Datensätzen erkennen. FAIR-Prinzipien werden zitiert, aber nicht auf die konkrete Datenlage angewendet. Es fehlen Angaben zu Metadatenstandards, zum Repositorium für klinische Bildgebungsdaten sowie zur langfristigen Zugänglichkeit. Eine überarbeitete Version ist bis zum Ende der laufenden Förderrunde einzureichen.”

Mira starrt auf den letzten Satz. Ende der laufenden Förderrunde: in sechs Wochen. Das Fördervolumen: 380.000 Euro über drei Jahre. Ihr Postdoc-Vertrag läuft in neun Monaten aus.

Sie hat den DMP in drei Stunden geschrieben, zwei Tage vor der Einreichung, nach einem langen Messtag. Sie hatte eine Vorlage aus dem Internet kopiert, die Feldbezeichnungen angepasst und gehofft, es würde reichen. Die Vorlage war generisch, für genomische Daten optimiert, nicht für klinische Bildgebung. Sie hatte nicht gewusst, dass es für MRT-Datensätze spezifische Metadatenstandards gibt, dass BIDS das bevorzugte Format in ihrer Community ist und dass das EBRAINS-Repositorium für Neurowissenschaften unter den zugelassenen Ablageorten der DFG steht.

Die Überarbeitungsfrist ist knapp. Wenn der zweite Entwurf ebenfalls nicht ausreicht, fällt das Projekt aus der laufenden Runde heraus, nächster regulärer Einreichungstermin: sieben Monate später.

Das ist keine Frage fehlender Sorgfalt. Es ist eine Frage fehlender Spezialisierung in einem Bereich, der plötzlich Pflicht ist, ohne dass irgendjemand das gelehrt hat.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Der Datenmanagementplan gehört zu den jüngsten Pflichtbestandteilen wissenschaftlicher Förderanträge, und zu den am häufigsten unterschätzten.

Die Deutsche Forschungsgemeinschaft hat 2022 den Abschnitt zum Umgang mit Forschungsdaten in ihren Antragsrichtlinien konkretisiert und formalisiert. Seitdem ist der Forschungsdatenmanagement-Abschnitt Teil des regulären Begutachtungsprozesses, Gutachtende können die Bewilligung verweigern oder unter Vorbehalt stellen, wenn der Abschnitt unvollständig oder zu generisch ist. Horizon-Europe-Projekte müssen innerhalb von sechs Monaten nach Vertragsbeginn einen detaillierten Datenmanagementplan als eigenes Deliverable einreichen, mit vorgeschriebenen Update-Zeitpunkten bei Projekthalbzeit und Projektende.

Das Problem ist nicht, dass Forschende nicht guten Willens wären. Es ist, dass ordentliches Datenmanagement ein Spezialisierungsfeld ist, das in den meisten Fachcurricula nicht vorkommt:

Welches Repositorium ist für meine Disziplin und meine Datentypen geeignet? Für klinische Bildgebung gelten andere Standards als für genomische Daten oder Umfragedaten.
Welcher Metadatenstandard ist in meiner Community akzeptiert? Dublin Core ist generisch; BIDS (Brain Imaging Data Structure) ist für Neurowissenschaften spezifisch; DataCite ist für Forschungsdaten allgemein; DDI ist für Sozialwissenschaften.
Wie formuliert man FAIR-Prinzipien konkret für ein spezifisches Projekt, statt sie nur abstrakt zu erwähnen?

Die Schätzungen, wie lange die Erstellung eines qualitativ hinreichenden DMP dauert, variieren erheblich: Einige Hochschulbibliotheken gehen von 8–12 Stunden für einen erfahrenen Forschenden aus, andere berichten von 15–20 Stunden bei Erstantragstellern ohne Vorwissen. Das Projekt DMP Chef (UC3 und FAIR Data Innovations Hub, 2025/2026) hat LLM-basierte DMP-Entwürfe gegen menschlich erstellte Muster getestet, und kam zu dem Ergebnis, dass die LLM-Versionen im Schnitt höhere Zufriedenheitsbewertungen erzielten (3,4 von 5) als die Referenz-DMPs menschlicher Expertinnen und Experten (3,1 von 5), bei gleichzeitig weniger berichteten Fehlern in den LLM-Versionen.

Das Risiko des Nichthandelns ist dabei konkret messbar: Ein DMP, der Gutachtende als zu generisch oder thematisch nicht passend eingestuft wird, kann zum Überarbeitungsaufwand führen, der die Einreichungsfrist gefährdet, oder schlimmstenfalls zum Ausfall aus der laufenden Förderrunde.

Anforderungen an Datenmanagementpläne ändern sich mit jeder Förderrunde und je nach Förderlinie. Prüfe die aktuellen Vorgaben direkt im Merkblatt deines Fördermittelgebers vor der Antragstellung.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI-Unterstützung	Mit KI-Unterstützung
Erstellungszeit pro DMP (Erstantrag)	15–20 Stunden	2–4 Stunden
Vollständigkeit der Repositorien-Angaben	Hängt von der Eigenrecherche ab	Systematisch aus Datenbanken abgeleitet
FAIR-Konformität des Plans	Oft formal, selten projektspezifisch	Auf Datenpakete des Projekts angewendet
Konsistenz mit Antragsbeschreibung	Manuell abzugleichen	Direkt aus der Projektbeschreibung extrahiert
Überarbeitungsaufwand nach Gutachten	Hoch bei generischen DMPs	Niedriger bei spezifischeren Erstversionen

Schätzwerte auf Basis von DMP-Erfahrungsberichten an Universitätsbibliotheken und des DMP-Chef-Projekts (UC3/FAIR Data Innovations Hub, 2025/2026). Keine repräsentative Studie.

FAIR-Prinzipien konkret: Was die vier Buchstaben für deinen DMP bedeuten

Das Akronym FAIR, Findable, Accessible, Interoperable, Reusable, wurde 2016 von Wilkinson et al. in Scientific Data (Nature) veröffentlicht und ist seitdem zur Grundlage der meisten Förderanforderungen geworden. Aber im DMP bedeutet FAIR nicht, die vier Buchstaben zu nennen und abzuhaken.

Findable (Auffindbar): Deine Daten bekommen einen persistenten Identifikator, typischerweise einen DOI, vergeben vom Repositorium. Metadaten werden so angelegt, dass Suchmaschinen und Datenportale sie finden. Das DMP muss beschreiben, welches Repositorium du wählst und wie du den Identifikator vergibst. „Wir werden die Daten verfügbar machen” ist keine ausreichende Antwort.

Accessible (Zugänglich): Zugänglich bedeutet nicht zwingend offen. Es bedeutet, dass der Zugang klar geregelt ist, mit Zugriffsbedingungen, die protokolliert und wiederauffindbar sind. Bei klinischen Daten oder Daten mit kommerziellem Verwertungspotenzial ist eingeschränkter Zugang möglich; aber die Zugangsbedingungen müssen transparent dokumentiert sein. Das DMP muss erklären, wer unter welchen Bedingungen Zugriff erhält.

Interoperable (Interoperabel): Das ist der Abschnitt, der am häufigsten fehlt. Interoperabel bedeutet: Die Daten verwenden standardisierte Formate und kontrollierte Vokabulare, damit andere Systeme sie verarbeiten können. Konkret heißt das: Welcher Metadatenstandard wird verwendet (BIDS, DDI, DataCite, Dublin Core, ISO 19115 für Geodaten)? Werden Ontologien für Fachbegriffe genutzt (MeSH, Gene Ontology, SNOMED CT)?

Reusable (Nachnutzbar): Nachnutzbar bedeutet, dass die Daten mit einer klaren Lizenz versehen werden und ausreichend dokumentiert sind, dass andere Forschende sie ohne Rückfrage an dich verwenden können. Das DMP muss Angaben zur Lizenz (Creative Commons, Open Data Commons) und zur beigelegten Dokumentation enthalten.

Ein KI-Assistent kann diesen Durcharbeitungsprozess erheblich beschleunigen, aber er kann die projektspezifischen Entscheidungen nicht an deiner Stelle treffen. Er schlägt Optionen vor; du entscheidest und begründest.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5)
Wer einen DMP erstmals von Grund auf schreibt, investiert ohne Unterstützung 15–20 Stunden. Mit einem gut konfigurierten KI-Prompting-Workflow, der auf die Projektbeschreibung zugreift und aus Repositorien-Datenbanken ergänzt, lässt sich das auf 2–4 Stunden verkürzen. Das entspricht einer Einsparung von 73–80 Prozent, real, messbar und besonders bei mehreren Anträgen im Jahr spürbar. Die höheren Zeitersparnis-Werte dieser Kategorie (5/5) erzielen Use Cases, die vollständig repetitive Schreibarbeit automatisieren. Der DMP braucht immer noch projektspezifische Entscheidungen, daher 4 statt 5.

Kosteneinsparung, niedrig (2/5)
Die Tool-Kosten sind gering: RDMO ist Open Source und über viele Hochschulen kostenlos nutzbar. ChatGPT Plus oder Claude Pro kosten 18–20 Euro pro Monat. Der Hauptnutzen entsteht durch eingesparte Personalzeit, aber diese Zeit ist für Forschende typischerweise nicht direkt verrechenbar. Es gibt kein direkt messbares Kostenziel wie bei der Rechnungsverarbeitung. ROI entsteht hier über Compliance und Antragsqualität, nicht über direkte Budgeteinsparung.

Schnelle Umsetzung, mittel (3/5)
Ein funktionsfähiger KI-unterstützter DMP-Workflow ist in 2–3 Wochen einsatzbereit. Die 6–10 Wochen Gesamtzeit entstehen, wenn du erstmalig das Repositorien-Mapping für deine Disziplin aufbaust, fachspezifische Metadatenstandards recherchierst und den Prompt für die spezifische Förderlinie kalibrierst. Wer die Infrastruktur einmal aufgesetzt hat, kann folgende DMPs deutlich schneller erstellen.

ROI-Sicherheit, sehr hoch (5/5)
Das ist der Kern der Argumentation: Ein DMP ist für DFG-Anträge und Horizon-Europe-Projekte keine Option, sondern eine Pflichtanforderung. Ohne einen qualitativ hinreichenden DMP riskierst du die Ablehnung des Gesamtantrags oder eine Überarbeitungsanforderung, die die Einreichungsfrist gefährdet. Das Fördervolumen typischer DFG-Sachbeihilfen liegt zwischen 150.000 und 500.000 Euro; ERC-Grants überschreiten diese Summen deutlich. Die Kosten eines unzureichenden DMPs sind damit im besten Fall Zeitverlust durch Überarbeitung, im schlechtesten Fall der Ausfall aus der laufenden Förderrunde. Dieser Use Case ist in der forschung-Kategorie der einzige, bei dem die Konsequenz des Nichthandelns so direkt und quantifizierbar ist.

Skalierbarkeit, mittel (3/5)
Einmal aufgebaute Prompt-Templates und Repositorien-Mappings lassen sich für Folgeanträge wiederverwenden, das ist echter Skalierungseffekt. Aber jedes Forschungsprojekt hat andere Datenpakete, andere Metadatenanforderungen und andere Repositorien-Logiken. Ein DMP für genomische Daten ist nicht wiederverwendbar für ein Projekt mit ethnografischen Beobachtungsdaten. Die Skalierung ist damit begrenzt auf die Disziplin und den Datentyp, für breit aufgestellte Forschungsgruppen hilft das, für sehr heterogene Forschungsbereiche weniger.

Richtwerte, stark abhängig von Fachrichtung, Datentyp und vorhandener institutioneller Infrastruktur.

Was der KI-DMP-Assistent konkret macht

Der technische Ansatz kombiniert zwei Schritte.

Schritt 1, Extraktion: Du gibst deine Projektbeschreibung oder das Abstract deines Antrags in den KI-Assistenten. Der Prompt weist ihn an, spezifisch nach Datenpaketen zu suchen: Welche Arten von Daten werden erhoben? In welchen Formaten? Wer erhebt sie wann? Wie groß werden die Datenpakete voraussichtlich sein? Das Ergebnis ist eine strukturierte Liste der Datenpakete deines Projekts, die Grundlage des DMP.

Schritt 2, Template-Befüllung: Ein zweiter Prompt befüllt das entsprechende DMP-Template (DFG-Checkliste, Horizon-Europe-Template) mit den extrahierten Datenpaketen und ergänzt sie durch standardisierte Angaben: geeignete Repositorien für den Datentyp, übliche Metadatenstandards in der Disziplin, Standard-Lizenzoptionen, Aufbewahrungsfristen.

Was der KI-Assistent dabei nicht kann: Er kennt die spezifische institutionelle Infrastruktur deiner Hochschule nicht. Er weiß nicht, welche Vereinbarungen deine Einrichtung mit spezifischen Repositorien hat. Er kann nicht beurteilen, ob deine Daten klinisch-sensitiv sind und besondere Datenschutzregeln auslösen. Diese Entscheidungen musst du selbst treffen, oder in Rücksprache mit der Forschungsdatenstelle deiner Bibliothek.

Das Ergebnis ist kein fertig einreichbarer DMP, sondern ein strukturierter Entwurf, der deutlich projektspezifischer ist als eine generisch kopierte Vorlage, und den du in 1–2 Stunden zur Einreichungsreife bringst statt in 15–20 Stunden von Grund auf.

Welche Repositorien für welche Disziplinen

Die Wahl des Repositoriums ist einer der häufigsten Schwachpunkte in eingereichten DMPs. Eine Liste häufiger Disziplin-Repositorien-Kombinationen:

Disziplin / Datentyp	Repositorium	Metadatenstandard
Sozialwissenschaften, Umfragedaten	GESIS Datenarchiv, CESSDA	DDI (Data Documentation Initiative)
Neurowissenschaften, Bildgebung	EBRAINS, OpenNeuro	BIDS (Brain Imaging Data Structure)
Genomik, Molekularbiologie	ENA, NCBI, ArrayExpress	INSDC-Standards, MIAME
Klima, Geodaten	PANGAEA, Copernicus	ISO 19115, CF Conventions
Kulturerbe, Geisteswissenschaften	CLARIN, DARIAH	TEI, Dublin Core
Allgemeine Forschungsdaten	Zenodo, Dryad	DataCite Metadata Schema

Konkrete Werkzeuge, was wann passt

RDMO (Research Data Management Organiser), Das bevorzugte Werkzeug für Forschende an deutschen Hochschulen. Open Source, selbst hostbar, enthält fertige Fragebögen für DFG-Checkliste und Horizon-Europe-Template. Viele Universitätsbibliotheken betreiben institutionelle Instanzen, die kostenlos zugänglich sind. RDMO hat alleine keine KI-Funktionalität, es strukturiert die Fragen, du beantwortest sie. Sinnvoll: RDMO für die Struktur, KI-Assistent für das Befüllen. 56+ Instanzen an deutschsprachigen Hochschulen (Stand: November 2023, CODATA Data Science Journal 2024).

~~DMPonline~~, Die britische Alternative, webbasiert ohne lokalen Setup. Enthält Templates für über 30 Fördergeber inklusive Horizon Europe. Besonders nützlich für internationale Konsortien, bei denen institutionelle RDMO-Instanzen nicht für alle Partner verfügbar sind. Keine KI-Integration eingebaut, aber gut als strukturierte Vorlage für KI-unterstütztes Befüllen.

ChatGPT (Plus/Team), Für die Extraktion und das Entwurf-Befüllen des DMP. Der Plus-Plan (20 USD/Monat) reicht für gelegentliche DMP-Arbeit. Wichtig: Antragsdaten, die projektspezifische Informationen über noch unveröffentlichte Forschung enthalten, sollten nicht im Free-Plan eingegeben werden (kein standardmäßiges Training-Opt-out). Ab Team-Plan kein Training auf Eingaben.

Claude (Pro), Für längere Projektbeschreibungen und die Befüllung mehrseitiger DMP-Templates. Das 200.000-Token-Kontextfenster erlaubt das gleichzeitige Einspeisen des vollständigen Antrags und des DMP-Templates ohne Informationsverlust. Stärke bei strukturierter Textproduktion, die konsistent auf den Quelltext zurückverweist.

OpenAIRE ARGOS, Teil der OpenAIRE-Toolchain, speziell für maschinenlesbare DMPs entwickelt. Unterstützt den RDA DMP Common Standard und ist mit Zenodo und anderen EOSC-Repositorien verknüpft. Für Horizon-Europe-Projekte besonders interessant, weil die Anbindung an die europäische Open-Science-Infrastruktur direkt vorhanden ist. Komplett kostenlos.

Zusammenfassung: Wann welcher Ansatz

Institutionelle Instanz vorhanden → RDMO als Struktur + ChatGPT/Claude für Entwurf
Internationales Konsortium → DMPonline als Struktur + ChatGPT/Claude für Entwurf
Horizon-Europe-Projekt mit EOSC-Fokus → OpenAIRE ARGOS
Alle Szenarien: KI-Assistent für Extraktion und Formulierung, nie als alleiniges Werkzeug

Datenschutz und Datenhaltung

Anträge enthalten oft vertrauliche Informationen: noch unveröffentlichte Forschungsideen, Kooperationspartner, geplante Methoden, manchmal auch Vorabdaten. Das muss bei der Wahl des KI-Werkzeugs bedacht werden.

DSGVO-Relevanz: Wenn die Antragsdaten keine personenbezogenen Daten enthalten (bei den meisten naturwissenschaftlichen Anträgen der Fall), ist das primäre Risiko die vertrauliche Behandlung der Forschungsidee, nicht die DSGVO. Für medizinische Projekte mit Patientendaten oder sozialwissenschaftliche Projekte mit Personenbezug gilt: Keine Rohdaten in den KI-Assistenten, nur die beschreibende Projektdarstellung.

Training-Opt-out beachten:

ChatGPT Free und Plus nutzen Eingaben standardmäßig für Modell-Training (Opt-out ist in den Einstellungen möglich, aber kein Default). Ab dem Team-Plan kein Training.
Claude Pro nutzt Eingaben standardmäßig nicht für Training; AVV über Anthropic verfügbar.
Institutionelle Hochschul-KI-Plattformen (z. B. über GWDG oder RZG) bieten häufig DSGVO-konforme Alternativen, bei der IT-Abteilung oder Bibliothek nachfragen.

Repositorien-Wahl für die Daten selbst:
Zenodo (CERN, Genf) und GESIS (Köln) sind EU-gehostet und DSGVO-konform. NCBI und ArrayExpress (EMBL-EBI) sind international, aber für genomische Daten branchenüblich, für personenbezogene genomische Daten gelten besondere Anforderungen (GDPR-Artikel 9, genetische Daten als besondere Kategorie).

Was es kostet, realistisch gerechnet

Tool-Kosten:

RDMO: Kostenlos (open-source, institutionell gehostet)
DMPonline: Kostenlos
ChatGPT Plus: 18–20 Euro/Monat (alternativ ChatGPT Team ab 25 USD/Nutzer/Monat für besseren Datenschutz)
Claude Pro: 18 Euro/Monat

Personalzeit:

Erstmaliger Aufbau des Prompting-Workflows: 4–8 Stunden (einmalig)
Repositorien-Mapping für die eigene Disziplin: 2–4 Stunden (einmalig)
DMP-Erstellung pro Antrag danach: 2–4 Stunden statt 15–20 Stunden

Was du dagegenrechnen kannst:
Ein wissenschaftlicher Mitarbeitender mit Postdoc-Qualifikation hat einen Bruttostundensatz von ca. 30–50 Euro (inkl. Arbeitgeberanteil, basierend auf TV-L E13/E14 Bayern/NRW, Destatis 2024). Die Einsparung von 12–16 Stunden pro DMP entspricht 360–800 Euro Personalkosten. Bei drei bis fünf Anträgen pro Jahr ergibt das 1.000–4.000 Euro eingesparte Personalzeit, bei Tool-Kosten von 200–250 Euro pro Jahr.

Dieser Vergleich ist konservativ und berücksichtigt nicht den Wert eines qualitativ besseren DMP, der seltener zur Überarbeitung zurückkommt, und erst recht nicht den Wert eines Antrags, der durch einen hinreichenden DMP nicht in der Begutachtung gestoppt wird.

Wie du den Nutzen misst:
Zähl, wie viele DMP-Abschnitte in deinen letzten drei Anträgen Gutachterkommentare ausgelöst haben. Ein KI-unterstützter DMP-Prozess sollte diesen Wert gegen Null bringen.

Typische Einstiegsfehler

1. Den KI-Assistenten ohne Projektkontext verwenden.
Der häufigste Fehler: Man gibt nur den Förderer an und bittet ChatGPT, einen DMP zu schreiben. Das Ergebnis ist generisch, das Gleiche, das du auch mit einer kopierten Vorlage produziert hättest. Der Unterschied liegt darin, dass du deine Projektbeschreibung, deine Datenpakete und deine Methoden explizit eingibst. Ein KI-Assistent kann nur so spezifisch sein wie der Input, den er erhält.

2. Das KI-Ergebnis ungeprüft einreichen.
LLM-generierte DMPs neigen dazu, bei unbekannten Disziplinen falsche Repositorien oder veraltete Metadatenstandards zu empfehlen. Das DMP-Chef-Projekt (2025/2026) zeigt zwar, dass LLMs im Durchschnitt besser abschneiden als generische menschliche Entwürfe, aber einzelne Fehler kommen vor, und diese Fehler landen dann vor Gutachtenden. Jede Angabe zum Repositorium und zum Metadatenstandard muss verifiziert werden, bevor sie eingereicht wird. Zehn Minuten Überprüfung können Wochen Überarbeitungsaufwand ersparen.

3. FAIR als Checkliste abarbeiten, statt konkret zu werden.
Viele DMPs enthalten Sätze wie „Die Daten werden nach FAIR-Prinzipien verwaltet.” Das ist kein DMP, das ist eine Absichtserklärung. Gutachtende erwarten: welches Repositorium konkret, welcher persistente Identifikator, welcher Metadatenstandard, welche Lizenz. Der KI-Assistent muss explizit angewiesen werden, diese Konkretisierung für jedes Datenpaket vorzunehmen.

4. Den DMP nach Einreichung vergessen.
Horizon-Europe-Projekte müssen den DMP mindestens einmal bei Projekthalbzeit aktualisieren und bei Projektende final abgeben. DFG-Projekte berücksichtigen den Umgang mit Forschungsdaten auch im Verwendungsnachweis. Ein DMP, der zum Zeitpunkt der Einreichung korrekt war, aber nie an die tatsächliche Datenerhebung angepasst wurde, ist beim ersten Update-Termin wertlos. Das ist der gefährlichste Fehler, weil er silent passiert: Das System läuft scheinbar, bis der erste Review-Termin enthüllt, dass der Plan zwei Jahre in der Schublade lag.

Was mit der Einführung wirklich passiert, und was nicht

Der KI-unterstützte DMP-Prozess funktioniert sofort, und scheitert trotzdem in zwei typischen Konstellationen.

Die Reaktion der Forschungsdatenstelle: Universitätsbibliotheken und Forschungsdatenstellen haben in den letzten Jahren erhebliche Expertise zu Datenmanagementplänen aufgebaut. Einige reagieren auf KI-generierte DMPs skeptisch, weil sie befürchten, dass Forschende die Spezifik ihrer Daten nicht mehr selbst reflektieren. Diese Skepsis ist berechtigt, aber sie richtet sich gegen den Fehler 1 (Prompt ohne Kontext), nicht gegen den KI-Ansatz insgesamt. Wenn du die Forschungsdatenstelle frühzeitig einbeziehst und den KI-Assistenten als Formulierungshilfe positionierst, nicht als Entscheidungsinstanz, ist die Reaktion in der Regel kooperativ.

Die fehlenden Vorentscheidungen: Ein KI-Assistent kann keinen DMP schreiben, wenn noch nicht entschieden ist, in welchem Format die Daten erhoben werden, wer die Rechte an den Rohdaten hat oder ob klinische Daten unter Datenschutzanforderungen fallen. Diese Vorentscheidungen müssen vor der DMP-Erstellung getroffen sein, der KI-Assistent macht sie nicht. Wenn sie noch nicht getroffen sind, hilft der KI-Assistent dabei, die offenen Fragen strukturiert zu formulieren, was wiederum das Gespräch mit der Forschungsdatenstelle produktiver macht.

Was konkret hilft:

Führ den KI-Prompting-Prozess gemeinsam mit einer Person aus der Forschungsdatenstelle durch (einmalig, als Lernprozess)
Hinterlege das Repositorien-Mapping für deine Disziplin als gespeichertes Dokument, das spart bei jedem folgenden DMP Zeit
Prüfe nach der KI-Erstellung immer die fachspezifischen Repositorien-Empfehlungen anhand der aktuellen Listen deines Fördergebers

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Orientierung & Infrastruktur	Woche 1–2	Zugang zu RDMO oder DMPonline einrichten; aktuelles DFG/Horizon-Template laden; ChatGPT Team oder Claude Pro einrichten	Kein Zugang zu institutionellem RDMO, Alternative DMPonline oder ChatGPT Projects nutzen
Repositorien-Mapping	Woche 2–3	Für die eigene Disziplin die passenden Repositorien und Metadatenstandards recherchieren; als Referenzdokument speichern	Zu viele Optionen, keine klare Empfehlung, Rücksprache mit Forschungsdatenstelle nötig
Prompt-Entwicklung	Woche 3–4	Ersten Test-DMP aus Antragsentwurf erstellen; mit Originalvorgaben vergleichen; Prompt iterieren	KI-Output zu generisch, mehr Kontext über Datenpakete in den Prompt einbringen
Pilotbetrieb	Woche 4–8	Ersten echten DMP für aktuellen Antrag erstellen; Feedback von Forschungsdatenstelle einholen	Gutachtende erwarten förderspezifische Sprache, Template-Mapping nachjustieren
Routine	Ab Woche 8	Folgeanträge mit deutlich reduziertem Aufwand bearbeiten; DMP bei Projekthalbzeit aktualisieren	DMP veraltet während des Projekts, Erinnerung für Update-Termin eintragen

Häufige Einwände, und was dahintersteckt

„Die KI kennt doch die DFG-Anforderungen gar nicht.”
Teilweise richtig, LLMs haben kein aktives Wissen über den aktuellen Stand der DFG-Richtlinien. Aber das ist lösbar: Du gibst das aktuelle DFG-Template und die Checkliste (verfügbar auf dfg.de) direkt in den Prompt. Dann arbeitet der Assistent nicht aus einem unsicheren Gedächtnis, sondern aus dem Text, den du ihm gibst. Das gleiche gilt für das Horizon-Europe-DMP-Template.

„Das kostet doch trotzdem viel Zeit, erst den Prompt aufsetzen, dann prüfen.”
Beim ersten DMP stimmt das, der Einmal-Aufwand für Setup und Repositorien-Mapping liegt bei 6–12 Stunden. Das ist ähnlich wie bei einem ersten Antragsschreiben nach einem neuen Muster. Beim zweiten DMP ist der Aufwand auf 2–4 Stunden gesunken. Ab dem dritten DMP ist der Break-even erreicht. Wer weniger als einen DMP pro Jahr schreibt, profitiert kaum; wer zwei oder mehr schreibt, ist im Vorteil.

„Meine Daten sind zu komplex für KI.”
Die Datenkomplexität ist kein Ausschlusskriterium, sie ist der Grund, warum der KI-Assistent besonders nützlich ist. Komplexe Datenpakete mit mehreren Metadatenstandards, Repositorien und Zugangsbeschränkungen sind genau die Szenarien, in denen ein strukturierter Prompting-Ansatz mehr leistet als eine kopierte Vorlage. Allerdings: Bei Projekten mit klinischen Daten oder besonderen Datenschutzanforderungen muss der rechtliche Rahmen vorab mit einem Datenschutzbeauftragten geklärt sein, das ist keine KI-Aufgabe.

Woran du merkst, dass das zu dir passt

Du stellst mehr als einen Förderantrag pro Jahr und der DMP-Abschnitt ist jedes Mal aufwändig
Du wechselst das Förderinstrument (erstmals DFG, oder erstmals Horizon Europe) und weißt nicht sicher, was in diesem spezifischen Template gefordert ist
Dein letzter DMP hat Gutachterkommentare ausgelöst, die auf zu geringe Spezifik hingewiesen haben
Du hast eine Nachwuchsgruppe oder Arbeitsgruppe, in der unterschiedliche Forschende regelmäßig eigene Anträge schreiben und jedes Mal von vorne anfangen
Deine Hochschule betreibt eine RDMO-Instanz, du hast sie aber noch nie genutzt

Wann es (noch) nicht passt, drei harte Ausschlusskriterien:

Die Methodik des Projekts ist noch nicht definiert. Ein DMP beschreibt, welche Daten du erhebst, in welchem Format, in welchem Umfang. Wenn das noch nicht feststeht, kann kein hinreichender DMP geschrieben werden, weder mit noch ohne KI. Der KI-Assistent kann dabei helfen, die offenen Fragen zu strukturieren, aber er kann die inhaltlichen Entscheidungen nicht ersetzen.
Die Daten unterliegen rechtlichen Sonderanforderungen, die noch ungeklärt sind. Klinische Patientendaten, vertrauliche Kooperationsdaten oder Daten mit kommerziellem Schutz (Betriebsgeheimnisse, Drittrechte) brauchen rechtliche Vorabklärung durch Datenschutzbeauftragte oder Technologietransfer-Büros. Ein KI-Assistent kann diese Fragen nicht beantworten, und ein DMP, der rechtliche Fragen ungeklärt lässt, wird von Gutachtenden zurückgewiesen.
Du hast weniger als zwei Stunden Zeit bis zur Einreichung. Dieser Use Case beschleunigt den DMP-Prozess erheblich, aber er ist kein Zauberwerk. Ein vollständiger DMP braucht nach der KI-Befüllung noch eine inhaltliche Überprüfung. Wer versucht, einen DMP in 45 Minuten mit KI zu schreiben und direkt einzureichen, produziert genau das, was Gutachtende als zu generisch markieren.

Das kannst du heute noch tun

Öffne ChatGPT Plus oder Claude Pro und lege ein neues Project/Konversation an. Lade das aktuelle DFG-Merkblatt zu Forschungsdaten (als PDF von dfg.de, Sektion 2.4) als Referenzdokument hoch. Dann formuliere einen ersten Prompt mit drei bis fünf Sätzen aus deiner Antragsskizze, und lass den Assistenten die Datenpakete des Projekts identifizieren.

Das dauert 20 Minuten. Was du danach weißt: ob der KI-Assistent aus deiner Projektbeschreibung spezifische Datenpakete extrahieren kann, das ist der entscheidende Test für die Qualität des Gesamtansatzes.

Für den produktiven Einsatz verwende diesen zweistufigen Prompt:

Zweistufiger DMP-Prompt für DFG und Horizon Europe

**Schritt 1, Datenpaket-Extraktion:** Analysiere die folgende Projektbeschreibung und extrahiere alle Datenpakete, die im Forschungsprojekt entstehen werden. Für jedes Datenpaket benötige ich: - Art der Daten (Messdaten, Befragungsdaten, Bilddaten, Texte, etc.) - Erhebungsmethode - Erwartetes Format und Dateityp - Geschätztes Volumen (grob) - Besondere Charakteristika (personenbezogen, sensitiv, kommerzielle Relevanz) [PROJEKTBESCHREIBUNG ODER ANTRAGSSKIZZE HIER EINFÜGEN] **Schritt 2, DMP-Entwurf:** Erstelle auf Basis dieser Datenpakete einen Entwurf für Abschnitt 2.4 (Umgang mit Forschungsdaten) eines DFG-Sachmittelantrags. Orientiere dich an der DFG-Checkliste. Schlage für jeden Datentyp folgendes vor: - Geeignetes Repositorium (fachspezifisch, nicht nur Zenodo als Default) - Metadatenstandard (fachspezifisch) - Lizenzempfehlung - Zugangsregelung (offen / eingeschränkt / gesperrt mit Begründung) - Aufbewahrungsfrist Formuliere die Vorschläge als Entwurfstext, nicht als Liste. Weise explizit auf alle Punkte hin, die ich vor der Einreichung selbst verifizieren muss. [FÖRDERLINIE: DFG Sachbeihilfe / Horizon Europe / anderes] [DISZIPLIN: deine Fachrichtung]

Funktioniert mit ChatGPT Plus/Team, Claude Pro

Beispiel-Ausgabe

Mitarbeiter:in

Projekt: Längsschnittstudie zur Schlafqualität bei Schichtarbeitenden. Wir erheben polysomnographische Daten (EEG, EMG, Augenbewegungen), Fragebögen (Schlaftagebuch, Chronotyp-Assessment) und Aktigraphie-Daten über 12 Monate bei 80 Teilnehmenden. Einige Teilnehmende sind Patienten einer kooperierenden Klinik. Förderlinie: DFG Sachbeihilfe. Disziplin: Schlafmedizin / Psychologie.

KI-Assistent

**Extrahierte Datenpakete:** 1. Polysomnographie-Rohdaten (EEG, EMG, EOG): Zeitreihendaten im EDF-Format, ca. 8–12 GB pro Person über 12 Monate → ca. 800 GB gesamt. Sensitiv: medizinische Gerätedaten mit personenbezugsfähigen Schlafprofilen. 2. Fragebogendaten: Strukturierte Antworten (Schlaftagebuch täglich, Chronotyp-Assessment 4-mal), CSV/SPSS. Ca. 150–200 Variablen × 80 Personen × 12 Monate. 3. Aktigraphie-Daten: Zeitreihendaten (Bewegungs- und Lichtsensor), proprietäres Gerätformat + CSV-Export, ca. 50 GB gesamt. **DMP-Entwurf (Abschnitt 2.4, DFG-Sachbeihilfe):** Im Rahmen des Projekts entstehen drei Kategorien von Forschungsdaten: physiologische Messdaten (Polysomnographie und Aktigraphie), strukturierte Befragungsdaten sowie verarbeitete Analysedaten. *Physiologische Messdaten* werden im standardisierten EDF-Format (European Data Format) erhoben, das für elektrophysiologische Daten als Austauschstandard etabliert ist. Nach Abschluss des Projekts werden anonymisierte Datensätze im Brain MRI Data Structure (BIDS) angereichert... [weiter mit Repositorium: EBRAINS Research Infrastructure oder PhysioNet, Lizenz: CC BY 4.0 nach De-Identifizierung, Zugangsbedingung: eingeschränkt für die ersten 24 Monate nach Projektende, danach offen] **Punkte zur Verifikation vor Einreichung:** - Bestätigung durch Datenschutzbeauftragte: Sind die geplanten De-Identifizierungsmaßnahmen für klinische Schlafdaten ausreichend? - EBRAINS-Registrierung: Hat eure Institution Zugang zum EBRAINS-Repositorium? - Kooperationsvereinbarung mit Klinik: Wer ist datenschutzrechtlich verantwortlich für die Patientendaten?

Quellen & Methodik

DFG-Anforderungen an Forschungsdaten in Antragsabschnitt 2.4: Deutsche Forschungsgemeinschaft, „Konkretisierung der Anforderungen zum Umgang mit Forschungsdaten in Förderanträgen”, März 2022 (dfg.de/de/aktuelles/neuigkeiten-themen/info-wissenschaft/2022/info-wissenschaft-22-25). DFG-Checkliste zum Forschungsdatenmanagement, Version 21.12.2021 (dfg.de/resource/blob/174732/…/forschungsdaten-checkliste-de-data.pdf).
Horizon-Europe-DMP-Pflicht: Europäische Kommission, Horizon Europe Model Grant Agreement, Annex 5 (Open Science requirements). Einreichungspflicht: DMP-Deliverable innerhalb von 6 Monaten nach Vertragsbeginn, Update bei Projekthalbzeit und Projektende.
DMP Chef, LLM-generierte DMPs: UC3 (University of California Curation Center) und FAIR Data Innovations Hub, Projektergebnisse vorgestellt bei RDA Plenary 2025; Testresultate: LLM-DMPs 3,4/5 Zufriedenheit vs. 3,1/5 menschliche Referenz-DMPs (GPT-4.1, publiziert auf blog.dmptool.org, Februar 2026).
RDMO-Adoptionsstatistik: Möller et al., „The Research Data Management Organiser (RDMO), a Strong Community Behind an Established Software for DMPs and Much More”, Data Science Journal, 2024 (doi:10.5334/dsj-2024-028). 56 produktive und Test-Instanzen an deutschen Hochschulen (Stand November 2023).
FAIR-Prinzipien: Wilkinson, M.D. et al., „The FAIR Guiding Principles for scientific data management and stewardship”, Scientific Data 3, 160018 (2016). DOI: 10.1038/sdata.2016.18.
Personalkosten Wissenschaftlicher Mittelbau: TV-L Entgelttabellen 2024 (E13/E14), Stundensatz-Berechnung auf Basis Destatis-Verdienstdaten 2024.

Willst du wissen, wie ein DMP-Prompting-Workflow für deine spezifische Disziplin und Förderlinie aussieht, oder welche Repositorien für deine Datenpakete infrage kommen? Meld dich, das klären wir gemeinsam in einem kurzen Gespräch.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Forschung & Entwicklung vergleichen

Weitere Use Cases

Literaturrecherche automatisieren

KI durchsucht Datenbanken wie PubMed, Scopus und Semantic Scholar und liefert relevante Paper mit Zusammenfassungen. Spart Wochen manueller Recherche.

Mehr erfahren

Grant-Antrag Schreibassistent

KI unterstützt beim Verfassen von Drittmittelanträgen: strukturiert Projektbeschreibungen, passt Sprache an Fördergeber an und prüft Vollständigkeit.

Mehr erfahren

Forschungsdaten-Auswertung mit KI

KI analysiert große Mengen Messdaten, Umfrageergebnisse oder Textkorpora und identifiziert Muster, Ausreißer und Zusammenhänge, die manuell nicht erkennbar wären.

Mehr erfahren

Zurück zu Forschung & Entwicklung

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

FAIR-konformen Datenmanagementplan (DMP) mit KI erstellen

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

FAIR-Prinzipien konkret: Was die vier Buchstaben für deinen DMP bedeuten

Einschätzung auf einen Blick

Was der KI-DMP-Assistent konkret macht

Welche Repositorien für welche Disziplinen

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Literaturrecherche automatisieren

Grant-Antrag Schreibassistent

Forschungsdaten-Auswertung mit KI

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI