Forschung & Entwicklung jahresberichtberichtswesenhochschule

Forschungsbericht und Jahresbericht automatisieren

KI aggregiert Publikationen, Projekte und Kennzahlen aus verschiedenen Quellen und erstellt automatisch strukturierte Jahresberichte für Hochschule oder Institut.

⚡ Auf einen Blick

Problem: Jahresberichte binden 65–100 Personalstunden in Verwaltung und Redaktion. Daten liegen in verschiedenen Systemen verteilt und müssen manuell zusammengeführt werden.
KI-Lösung: Automatische Datenaggregation aus Forschungsinformationssystem, Bibliotheksdatenbank und Drittmitteldatenbank. LLM-gestützte Textgenerierung nach Bericht-Template.
Typischer Nutzen: Berichtserstellung von 2–3 Wochen auf 2–3 Tage reduziert. Konsistentere Daten. Kapazitäten für inhaltliche Arbeit freigesetzt.
Setup-Zeit: 12–20 Wochen inkl. Systemintegration
Kosteneinschätzung: 8.000–20.000 € Einrichtung (Datenpipeline); 240 €/Jahr LLM-Lizenz + ab 108 €/Jahr Automatisierung

ChatGPT/Claude mit VorjahresvorlagePower Automate + M365 CopilotDatenpipeline + LLM-Berichtsgenerator

Worum geht's?

Es ist der 14. Oktober.

Carolin Herbst leitet die Forschungskoordination an einem mittelgroßen universitären Institut für Materialwissenschaften, 38 Professorinnen und Professoren, 140 Mitarbeitende in Projekten, jährlich rund 220 Publikationen. Der Jahresbericht muss am 30. November beim Rektorat eingereicht werden. Carolin kennt das Spiel seit acht Jahren.

Was jetzt beginnt: Sie schickt heute per E-Mail eine Erinnerung an alle Arbeitsgruppen, mit der Bitte, bis Ende Oktober ihre Projektbeschreibungen, Personaldaten und Kooperationspartner zu aktualisieren. Erfahrungsgemäß kommen 30 bis 40 Prozent der Daten gar nicht, zu spät oder im falschen Format. Dann beginnt das Nachfassen, Telefonate, doppelte E-Mails, einzelne Excel-Tabellen zusammenklicken. Publikationen zieht sie aus dem institutseigenen CRIS-System, aber das ist nie vollständig: Drei Professoren tragen ihre Paper grundsätzlich nicht selbst ein, zwei weitere nutzen andere Datenbanken. Sie gleicht händisch mit Web of Science ab. Drittmittelzahlen kommen aus SAP, aber die Kostenstellen sind nicht einheitlich beschriftet. Die Grafiken erstellt eine studentische Hilfskraft in Excel. Das Lektorat schreibt ein externer Dienstleister.

Wenn alles gut läuft, ist der Bericht Ende November fertig, drei Wochen Vollzeitarbeit für Carolin, verteilt auf sechs Wochen neben dem normalen Betrieb. Wenn eine Abteilung zu spät kommt oder die Drittmittelzahlen nicht stimmen, schiebt sich alles.

Das ist kein Organisationsproblem. Das ist eine Datenaggregationsaufgabe mit zwölf heterogenen Quellen, die niemand je automatisiert hat.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Wer noch nie einen Hochschul-Jahresbericht oder institutionellen Forschungsbericht koordiniert hat, unterschätzt den Aufwand systematisch. Er sieht das fertige 80-seitige PDF und denkt: Das schreibt jemand in ein paar Tagen. Die Wahrheit: Der fertige Text ist ungefähr zwanzig Prozent der Arbeit.

Der Rest sind Datenaggregation, Qualitätskontrolle und Abgleich. Die typische Aufwandsverteilung in deutschen Forschungseinrichtungen mittlerer Größe sieht laut Praxisberichten so aus:

25–35 Stunden für Datenaggregation: Publikationen aus CRIS, Web of Science, PubMed und institutionellen Archiven; Drittmittelzahlen aus SAP oder Kosten-Leistungs-Rechnungssystem; Personaldaten aus HR-System; Projektbeschreibungen per E-Mail bei Arbeitsgruppen einsammeln
15–25 Stunden für Qualitätssicherung: Doppelungen bereinigen, fehlende Einträge recherchieren, widersprüchliche Zahlen klären
20–30 Stunden für Textredaktion und Lektorat: Einzelbeiträge zusammenführen, stilistisch vereinheitlichen, Vorjahresvergleiche formulieren
5–10 Stunden für Layout, Grafiken und Abstimmungsschleifen

Das macht zusammen 65–100 Personalstunden pro Berichtszyklus, typisch verteilt auf vier bis sieben Wochen. Für Hochschulen, die mehrere solcher Berichte produzieren (Institut, Fakultät, Hochschule gesamt, ggf. zusätzliche Drittmittelberichte), multipliziert sich dieser Aufwand.

Das Heimtückische ist, dass dieser Aufwand jedes Jahr entsteht, für einen Bericht, der strukturell immer gleich aussieht. Die Kapitelstruktur ist dieselbe, die Kennzahlen sind dieselben, nur die Zahlen ändern sich. Trotzdem fängt die Redaktion jedes Jahr von vorne an.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI	Mit KI-Unterstützung
Personalaufwand gesamt	65–100 Stunden	10–15 Stunden ¹
Datenaggregation	25–35 Stunden manuell	3–5 Stunden (Pipeline übernimmt Hauptteil)
Erstredaktion aller Kapitel	20–30 Stunden	2–4 Stunden (Textentwürfe werden überarbeitet, nicht geschrieben)
Nachfassquote bei Arbeitsgruppen	30–50 % der Daten unvollständig	15–25 % (automatische Reminder, standardisierte Formulare)
Fehlerquote beim Publikationsabgleich	5–15 % nicht oder falsch erfasst	2–5 % ¹
Wiederverwendung für Folgejahr	Minimal (Struktur wird neu aufgebaut)	Hoch (Template + Datenpipeline bleiben erhalten)

¹ Schätzwerte aus Praxisberichten und veröffentlichten Erfahrungen mit automatisierter Berichterstellung; keine repräsentative Studie.

Die Zeitersparnis bei der Datenaggregation ist am verlässlichsten: Eine Datenpipeline, die Publikationen aus dem CRIS-System, Drittmittelzahlen aus dem Finanzsystem und Projektdaten zusammenführt, erledigt in 30 Minuten, was vorher zwei Arbeitstage kostete. Größere Varianz besteht beim Redaktionsaufwand, wie stark ein LLM-generierter Textentwurf nachbearbeitet werden muss, hängt stark von der Qualität der Eingabedaten und der Vorlage ab.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5) Der Jahresbericht ist einer der zeitintensivsten Verwaltungsprozesse in Forschungseinrichtungen, und gleichzeitig einer der wenigen, bei denen KI wirklich strukturell entlastet, nicht nur einzelne Aufgaben beschleunigt. 50–80 Stunden auf 10–15 Stunden zu reduzieren ist kein Ausnahmefall, sondern das realistisch erreichbare Ziel bei einer gut umgesetzten Pipeline. Der Effekt ist dennoch etwas geringer als bei der Literaturrecherche, die täglich anfällt und deshalb mehr Gesamtvolumen hat.

Kosteneinsparung, mittel (3/5) Die Einsparung entsteht fast vollständig über Personalkosten, weniger Verwaltungszeit von gut ausgebildetem Fachpersonal. Das ist real und gut belegbar, aber die Einrichtungskosten für eine funktionierende Datenpipeline (8.000–20.000 Euro einmalig, je nach Systemlandschaft) verbrauchen einen Teil des ersten Jahres an Erspartem. Ab dem zweiten Zyklus rechnet sich das System deutlich.

Schnelle Umsetzung, niedrig (2/5) Hier liegt die eigentliche Herausforderung dieses Use Cases: Die Automatisierung des Textes ist einfach. Die Automatisierung der Datenaggregation aus CRIS, SAP, bibliothekarischen Systemen und Hochschul-ERP ist aufwendig. 12–20 Wochen bis zum ersten produktiven Einsatz sind realistisch, mehr als beim Grant-Antrag-Schreibassistenten oder bei der Wissenschaftsartikel-Zusammenfassung.

ROI-Sicherheit, hoch (4/5) Der Nutzen ist konkret messbar: Du weißt vorher, wie viele Stunden der letzte Jahresbericht gekostet hat, und nachher, wie viele er noch kostet. Es gibt keine Diskussion über weiche Faktoren. Das macht diesen Use Case investitionsvergleichsweise sicher, ähnlich dem Drittmittel-Monitoring.

Skalierbarkeit, mittel (3/5) Die Pipeline skaliert gut innerhalb eines Instituts über mehrere Jahre. Der jährliche Zusatzaufwand nach Einrichtung ist gering. Die Skalierung auf ein zweites Institut oder eine Fakultät erfordert aber spürbare Anpassungsarbeit, weil jede Einrichtung eine andere Systemlandschaft hat. Deutlich weniger skalierbar als die Forschungsdaten-Auswertung, die institutionsübergreifend einsetzbar ist.

Richtwerte, stark abhängig von Systemlandschaft, Institutsgröße und vorhandener Datenqualität im CRIS.

Was der Berichtsgenerator konkret macht

Das System besteht aus zwei klar getrennten Teilen, und es ist wichtig, die beiden nicht zu verwechseln.

Teil 1: Datenaggregation (der schwierige Teil)
Ein automatisierter Workflow sammelt die Rohdaten aus allen relevanten Quellen: Publikationen aus dem Forschungsinformationssystem (CRIS), ergänzt durch API-Abfragen bei CrossRef oder OpenAlex für fehlende Einträge; Drittmittelzahlen aus dem Finanz- oder ERP-System; Personalzahlen aus HR; Projektbeschreibungen aus einem strukturierten Eingabeformular, das an die Arbeitsgruppen versendet wird. Die Daten werden zusammengeführt, offensichtliche Duplikate entfernt, Fehlende markiert und in eine strukturierte Übersicht exportiert, typisch eine JSON-Datei oder ein Excel-Sheet, das als Eingabe für Teil 2 dient.

Teil 2: Textgenerierung (der einfache Teil)
Ein LLM, ChatGPT oder Claude, erhält das strukturierte Daten-Sheet und eine Vorlage des Vorjahresberichts und generiert daraus Textentwürfe für alle Kapitel. Das Modell vergleicht Vorjahreswerte mit aktuellen Zahlen, formuliert Entwicklungslinien, beschreibt Highlights und produziert einen strukturierten ersten Entwurf. Dieser Entwurf ist kein Endprodukt, er ist die Grundlage, die ein Mensch überprüft, inhaltlich ergänzt und für die institutionelle Sprache verfeinert.

Der entscheidende Punkt: Das LLM erfindet keine Zahlen. Es formuliert, was ihm übergeben wird. Wenn die Datenaggregation in Teil 1 sauber ist, gibt es im Bericht keine halluzinierten Werte, das System greift nur auf das zu, was ihm explizit bereitgestellt wurde. Das ist der strukturelle Unterschied zu einem LLM, dem man einfach sagt: „Schreib mir einen Forschungsjahresbericht 2024.”

Was das Modell liefert, und was nicht

Das Modell produziert: Fließtexte zu Kennzahlen und ihrer Entwicklung, Beschreibungen von Projekthöhepunkten auf Basis der eingetragenen Projektdaten, Vorjahresvergleiche, Zusammenfassungen der Drittmittelsituation.

Das Modell produziert nicht: inhaltliche Bewertungen der Forschungsqualität, eigenständige Einschätzungen zur strategischen Ausrichtung, Texte, die über die bereitgestellten Daten hinausgehen. Ein gut konfiguriertes System hält sich strikt an das Material und signalisiert, wenn Informationen fehlen, statt zu raten.

Die Integrations-Realität, wo CRIS und KI aufeinandertreffen

Wer diesen Use Case implementiert, lernt schnell: Der schwierigste Schritt ist nicht das Prompting. Er ist der API-Zugang zum Forschungsinformationssystem.

CRIS-Systeme wie Pure (Elsevier), Converis (Clarivate) oder HIS-InHouse-Lösungen wurden nicht mit KI-Integration im Sinn gebaut. API-Zugang ist in der Regel möglich, aber er erfordert IT-Koordination, manchmal Lizenzklärungen und fast immer eine Phase der Datenbereinigung. Was in CRIS-Systemen steht, spiegelt häufig nicht das wider, was tatsächlich publiziert wurde, fehlende Einträge, veraltete Projektstati, Duplikate durch verschiedene Namensvarianten.

Konkrete Hürden, auf die du dich einstellen solltest:

CRIS-Datenlücken: In den meisten deutschen Hochschulinstituten sind zwischen 10 und 25 Prozent aller Publikationen nicht oder nicht korrekt im eigenen CRIS erfasst (Schätzwert aus Erfahrungsberichten; je nach Disziplin variiert das stark). Dieser Prozentsatz macht die API-Abfrage allein unzuverlässig. Sinnvoll ist ein zweistufiger Ansatz: CRIS als Basisquelle, ergänzt durch eine automatische Abfrage bei OpenAlex oder CrossRef für die letzten 12 Monate, gefiltert nach den institutionellen DOI-Präfixen oder Autorennamen.

Finanzsystem-Zugang: SAP und vergleichbare ERP-Systeme haben in der Regel gut dokumentierte APIs, aber der Zugang ist intern oft restriktiv. Wer die Pipeline aufbauen will, braucht eine Besprechung mit der IT und dem Controlling. Erfahrungsgemäß dauert allein diese Freigabe 3–6 Wochen.

Formular-Chaos in den Arbeitsgruppen: Freie Texteingaben funktionieren schlecht als KI-Input. Eine der wichtigsten Investitionen vor dem ersten Berichtszyklus ist ein strukturiertes Eingabeformular für alle Arbeitsgruppen, mit Pflichtfeldern für Projektname, Laufzeit, Budget, Kooperationspartner und maximal drei Highlights. Was strukturiert reinkommt, kommt strukturiert raus. Was als Freitext reinkommt, muss nachbearbeitet werden.

Versionskonflikte zwischen Systemen: Es ist normal, dass Drittmittelzahlen aus SAP und aus der CRIS-Drittmitteldatenbank um einige Tausend Euro abweichen, wegen unterschiedlicher Stichtage, Buchungszeitpunkte oder Abgrenzungsregeln. Das System muss markieren, wenn solche Abweichungen auftreten, und einen Menschen einschalten, nicht automatisch einen Mittelwert bilden.

Konkrete Werkzeuge, was wann passt

NotebookLM, für Synthese und Vorjahresvergleich Wenn du Jahresberichte der letzten drei Jahre hochlädst und dann fragst, welche Entwicklungslinien erkennbar sind, welche Projekte besonders prominent waren und welche Kennzahlen sich konsistent entwickelt haben, bekommst du eine quellengebundene Analyse mit Textstellenverweisen. Kostenlos, kein Setup. Der Haken: US-Datenhaltung, für öffentlich verfügbare Jahresberichte unproblematisch, für interne Vorabversionen mit unveröffentlichten Daten die falsche Wahl.

ChatGPT oder Claude, für Textgenerierung Sobald die strukturierten Daten vorliegen, ist ChatGPT oder Claude das richtige Werkzeug. Du übergibst das Daten-Sheet und eine Kapitelvorlage und erhältst einen Erstentwurf. Claude ist dabei oft die bessere Wahl für längere, konsistente Dokumente, das 200.000-Token-Kontextfenster erlaubt es, den gesamten Bericht inkl. Vorjahresversion und Datenmaterial auf einmal zu übergeben, ohne Kohärenz zu verlieren. ChatGPT Plus ist gleichwertig für kürzere Kapitel. Kosten: je ca. 20 €/Monat.

Gamma, für die Kurzfassung und Präsentationsversion Viele Jahresberichte brauchen eine zweite Version: eine Präsentation für den Senat, das Ministerium oder externe Partner. Gamma wandelt das strukturierte Datenmaterial in ein designtes Slide-Deck um. Das ist kein Ersatz für inhaltliche Arbeit, aber erheblich schneller als das manuelle Aufbereiten in PowerPoint. Freemium, kein Setup.

Make.com oder Microsoft Power Automate, für die Automatisierungspipeline Für die Datenaggregation, automatische Erinnerungs-E-Mails an Arbeitsgruppen und den Daten-Export aus CRIS und ERP brauchst du eine Workflow-Automatisierung. Make.com ist flexibler und günstiger für kleinere Setups; Power Automate ist die richtige Wahl, wenn das Institut bereits auf Microsoft 365 läuft. Beide verbinden per API verschiedene Systeme ohne eigene Serverinfrastruktur.

Microsoft 365 Copilot, für M365-native Umgebungen Wer den Jahresbericht in Word schreibt und alle Daten in SharePoint oder Teams ablegt, kann Microsoft 365 Copilot direkt für Textgenerierung und Zusammenfassungen nutzen, ohne separate LLM-Integration. Copilot versteht die Struktur vorhandener Word-Dokumente und kann darauf aufbauend neue Kapitel schreiben. Ca. 30 €/Person/Monat zusätzlich zur M365-Lizenz.

Workiva, nur für sehr große Einrichtungen Workiva ist die professionelle Plattform für Finanz- und Nachhaltigkeitsberichte großer Unternehmen, mit Konnektoren für SAP, Audit-Trail und ESRS-Vorlagen. Für Hochschulinstitute ohne komplexe Compliance-Anforderungen ist das mit Einstiegspreisen um 20.000 USD/Jahr pro Jahr eine überdimensionierte und zu teure Wahl. Relevant wird Workiva für Universitäten, die gleichzeitig CSRD-Berichtspflichten oder externe Prüfanforderungen erfüllen müssen.

Zusammenfassung, wann welcher Ansatz

CRIS-Daten existieren, M365 ist im Einsatz → Power Automate + Microsoft 365 Copilot
Daten aus verschiedenen Systemen, flexible Integration gewünscht → Make.com + ChatGPT oder Claude
Kein separates Budget, Pilottest gewünscht → NotebookLM (öffentliche Vorjahresberichte) + Claude Free
Präsentation der Ergebnisse nötig → Gamma als Ergänzung

Datenschutz und Datenhaltung

Jahresberichte enthalten typischerweise zwei Arten von Daten: öffentliche Forschungsergebnisse (Publikationslisten, Projekttitel, Kooperationspartner) und interne Verwaltungsdaten (Personalzahlen, Drittmittelstände, unveröffentlichte Projektergebnisse).

Für öffentliche Daten gilt: NotebookLM und Gamma mit US-Datenhaltung sind akzeptabel, solange nur finalisierte, ohnehin öffentliche Inhalte verarbeitet werden.

Für interne Verwaltungsdaten gilt die DSGVO: Wer unveröffentlichte Projektdaten, Personalkennzahlen oder Drittmittelstände an externe KI-Dienste übergibt, benötigt einen Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO, mit jedem eingesetzten Anbieter. OpenAI und Anthropic stellen AVV-Vorlagen bereit, aber die Datenhaltung bleibt auf US-Servern. Für Einrichtungen mit strengen Datenschutzanforderungen (Beamtenrecht, sensible Drittmitteldaten, personenbezogene Forschungsdaten) sind zwei Alternativen sauber:

Claude über AWS Bedrock (Frankfurt): Alle Anfragen bleiben in der EU-Region, AVV über AWS verfügbar.
Microsoft 365 Copilot mit EU Data Boundary: Daten bleiben in europäischen Rechenzentren, EU Data Boundary-Konfiguration erforderlich.

Beide Optionen erfordern IT-Koordination, sind aber für Hochschuleinrichtungen in der Regel etablierte Wege. Die Hochschule hat i.d.R. einen Datenschutzbeauftragten, dieser muss in die Entscheidung eingebunden werden, bevor interne Rohdaten an externe Dienste übermittelt werden.

Was es kostet, realistisch gerechnet

Einmalige Einrichtungskosten

Datenpipeline (CRIS + ERP-Konnektoren, Formularstruktur, Testläufe): 8.000–20.000 Euro, abhängig von Systemkomplexität und ob externe Entwicklungsunterstützung nötig ist
Prompt-Engineering und Template-Entwicklung für alle Kapitel: 2–4 Tage interner Aufwand oder externer Dienstleister (1.500–3.000 Euro)
Pilottest und Abnahme mit IT und Datenschutzbeauftragtem: 3–6 Wochen Projektlaufzeit

Laufende Kosten (jährlich)

LLM-Lizenz: ChatGPT Plus oder Claude Pro, ca. 20 €/Monat × 12 = 240 €/Jahr
Make.com oder Power Automate: ab 9 €/Monat für kleine Setups
Wartung der Pipeline: ca. 5–10 Stunden/Jahr, wenn sich Systemschnittstellen ändern

Was du dagegenrechnen kannst Ein wissenschaftlicher Referent oder eine Forschungskoordinatorin kostet das Institut je nach Vergütungsgruppe zwischen 35 und 60 Euro pro Stunde (Brutto inkl. Nebenkosten). 60 eingesparte Stunden bedeuten 2.100 bis 3.600 Euro jährlich, nur durch den verringerten Personalaufwand. Hinzu kommt oft ein externer Dienstleister für Lektorat und Layout, dessen Aufwand sich halbiert, wenn die Textentwürfe konsistenter und vollständiger ankommen.

Im konservativen Szenario (30 Stunden Zeitersparnis, niedrigerer Stundensatz, 50 % Lektoratsreduzierung) amortisiert sich die Einrichtungsinvestition nach 2–3 Berichtszyklen. Im realistischen Hauptszenario nach einem bis zwei Jahren.

Wie du den Nutzen tatsächlich misst Erfasse vor der Einführung einmalig den tatsächlichen Zeitaufwand des letzten Berichtszyklus, aufgeschlüsselt auf Datenaggregation, Redaktion, Abstimmungen und Lektorat. Nach dem ersten automatisierten Zyklus machst du dieselbe Aufzeichnung. Der Unterschied ist dein ROI.

Typische Einstiegsfehler

1. Mit dem Text anfangen, nicht mit den Daten. Der häufigste Fehler: Man testet, wie gut ChatGPT einen Jahresbericht schreiben kann, bekommt einen beeindruckend strukturierten Text, und merkt erst Wochen später, dass dieser Text auf keinen echten Daten basiert, sondern auf allgemeinem Training. Das LLM formuliert plausibel, was ein Forschungsinstitut schreiben würde. Für einen echten Jahresbericht ist das wertlos. Der richtige Einstiegspunkt ist immer die Datenaggregation, erst wenn die strukturierten Daten verlässlich vorliegen, hat Textgenerierung einen Sinn.

2. CRIS als einzige Quelle behandeln. Wer davon ausgeht, dass das Forschungsinformationssystem vollständig ist, produziert einen Bericht, der 10–25 Prozent der echten Publikationen nicht enthält. Das ist in Forschungseinrichtungen die Regel, nicht die Ausnahme. Eine automatische Kreuzprüfung mit OpenAlex oder CrossRef kostet einen Tag Einrichtungsaufwand und verhindert, dass der Bericht unvollständig ist.

3. Zahlen ungeprüft aus dem LLM übernehmen. Wenn das LLM zur Laufzeit Zugang zu Vordaten hat, kann es Berechnungen vornehmen, und Rechenfehler machen. Jede Zahl im fertigen Bericht muss gegen die Quelldaten zurückverfolgt werden. Das klingt aufwendig, ist es mit einem klaren Protokoll nicht: Jeder Wert wird in der Datei mit der Quellenzeile verknüpft, und eine abschließende Stichprobenkontrolle prüft fünf bis zehn Kennzahlen im Detail. Ohne diese Prüfung riskiert man, einen Bericht mit falschen Zahlen ans Rektorat zu schicken, mit Vertrauensverlust, der schwer zu reparieren ist.

4. Den jährlichen Pflegeaufwand unterschätzen. Die Datenpipeline läuft nach Einrichtung nicht wartungsfrei. CRIS-Systeme werden aktualisiert, API-Strukturen ändern sich, Forschungsschwerpunkte und damit Kapitelstrukturen verschieben sich. Wer nach dem ersten erfolgreichen Berichtszyklus annimmt, es läuft im zweiten Jahr von selbst, erlebt typischerweise einen Überraschungsmoment im Oktober. Ein halber Tag Pflege pro Jahr ist realistisch, bei sauber dokumentiertem System. Ohne Dokumentation verdoppelt sich das schnell.

Was mit der Einführung wirklich passiert, und was nicht

Das erste Jahr ist immer ein Hybridjahr. Die Pipeline läuft, liefert strukturierte Daten, aber Carolin wird die Textentwürfe intensiver nachbearbeiten als geplant, weil sie die Grenzen des Systems noch nicht kennt und weil manche Daten besser in das System eingegeben wurden als andere.

Das ist keine Fehlfunktion. Das ist die Lernphase.

Was in fast jeder Einführung auftritt:

Die Datenlücken-Entdeckung. Zum ersten Mal wird dokumentiert sichtbar, wie lückenhaft das CRIS wirklich ist. Das erzeugt Diskussionen, nicht über das KI-System, sondern über Datenhygiene und Eingabedisziplin. Diese Diskussion ist wertvoll und ist eine der bleibenden Gewinne aus der Einführung, auch wenn sie unbequem ist.

Die Formulardebatte. Wenn du Arbeitsgruppen bittest, Projektdaten in strukturierte Formulare einzutragen statt in Freitexte, gibt es Widerstand. “Wir beschreiben unsere Forschung nicht in drei Bullet Points, das wird unserem Profil nicht gerecht.” Das ist ein legitimer Einwand, und der Weg durch ihn hindurch ist: die Formulare gemeinsam mit einer oder zwei Arbeitsgruppen entwickeln, nicht diktieren. Die Leute, die das Formular mitgestaltet haben, füllen es besser aus.

Die Qualitätsfrage beim LLM-Text. Die ersten Textentwürfe klingen generisch, weil die Eingabedaten generisch sind. Wenn die Highlights einer Arbeitsgruppe aus dem Formular “3 Drittmittelprojekte genehmigt, 12 Publikationen, 2 Gastwissenschaftler” bestehen, schreibt das LLM einen generischen Text. Wenn darin steht “Kooperation mit Toyota Central R&D Labs, gemeinsames Paper in Nature Materials, ERC-Consolidator-Stipendium für Prof. Müller”, schreibt das LLM etwas Lesbares. Die Qualität der KI-Texte ist eine direkte Funktion der Datenqualität.

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Systemanalyse & Anforderungen	Woche 1–3	CRIS-API prüfen, Finanzsystem-Zugang klären, IT und Datenschutzbeauftragten einbinden	API-Freigabe dauert länger als geplant, frühzeitig anstoßen
Datenquellen-Integration	Woche 4–8	CRIS-Connector aufbauen, ERP-Export konfigurieren, Eingabeformular für Arbeitsgruppen entwickeln	CRIS-Datenqualität schlechter als erwartet, Bereinigungsaufwand einplanen
Pilottest mit Vorjahresdaten	Woche 9–12	Pipeline mit Daten des Vorjahres testen, LLM-Output mit echtem Bericht vergleichen, Prompts verfeinern	LLM-Texte zu generisch, Template-Qualität und Eingabedaten nachbessern
Erster produktiver Berichtszyklus	Woche 13–20	Echte Daten aggregieren, Entwürfe generieren, Nachbearbeitung durch Koordination, Abgabe	Datenlücken bei einzelnen Arbeitsgruppen, Puffer einplanen
Retrospektive & Optimierung	Nach Abgabe	Zeitaufwand dokumentieren, Pipeline-Schwachstellen identifizieren, Formular für nächstes Jahr anpassen	Optimierungsmaßnahmen werden aufgeschoben, festen Termin einplanen

Häufige Einwände, und was dahintersteckt

„Wir produzieren kein Fließband-Dokument. Ein Jahresbericht ist auch ein Aushängeschild.” Das stimmt, und das ändert nichts. Niemand schlägt vor, den Bericht ungekürzt aus dem LLM zu übernehmen. Der Prozess ist: Datenaggregation automatisieren, Erstentwürfe erzeugen, Redaktion und inhaltliche Überarbeitung durch Menschen. Die wissenschaftliche Koordination, die heute 60 Stunden für Datenzusammenklicken verbringt, hat nach der Einführung 45 Stunden mehr Zeit für genau das inhaltliche Aushängeschild-Qualitätswerk, das sie bisher nicht leisten konnte.

„Unsere Daten sind zu sensibel für externe Cloud-KI.” Das ist ein lösbares Problem. Claude über AWS Bedrock (Frankfurt) und Microsoft 365 Copilot mit EU Data Boundary halten die Daten in Europa und bieten DSGVO-konforme AVV. Beide Wege erfordern IT-Koordination, aber sie sind in Hochschulumgebungen etablierte Pfade, keine Ausnahmen. Wenn das Haus bereits Microsoft 365 nutzt, ist M365 Copilot der naheliegendste Schritt ohne neue Datenschutzdiskussion.

„Der Aufwand für die Einrichtung lohnt sich nicht, wir erstellen den Bericht nur einmal im Jahr.” Stimmt für das erste Jahr, wenn man nur den Einrichtungsaufwand gegen den ersten Berichtszyklus rechnet. Die Rechnung ändert sich ab dem zweiten Jahr: Die Pipeline steht, die Templates sind getestet, der Aufwand sinkt weiter. Nach drei Jahren hat man den Einrichtungsaufwand mehrfach hereingeholt, in einer Einrichtung, in der der Jahresbericht regelmäßig 80 Personalstunden bindet.

Woran du merkst, dass das zu dir passt

Dein Jahresbericht bindet regelmäßig mehr als 40 Personalstunden, über Koordination, Datenaggregation, Redaktion und Abstimmungen verteilt
Daten aus mindestens drei verschiedenen Systemen müssen manuell zusammengeführt werden (CRIS, Finanzsystem, Projektsystem)
Die Kapitelstruktur des Berichts ist jährlich stabil, nicht jedes Jahr komplett neu. Wenn die Grundstruktur sich jedes Jahr grundlegend ändert, lohnt sich Automatisierung weniger
Du hast oder kannst IT-Unterstützung für die API-Integration bekommen, auch in kleinen Instituten reichen oft externe Dienstleister für 2–3 Tage

Wann es sich noch nicht lohnt, drei harte Ausschlusskriterien:

Institut mit weniger als 20 Mitarbeitenden und unter 50 Publikationen jährlich. Der Einrichtungsaufwand von 8.000–20.000 Euro und 12–20 Wochen Projektlaufzeit ist für einen Bericht, der ohnehin in einer Woche manuell zu erstellen ist, nicht gerechtfertigt. Für kleine Institute reicht ein gut strukturiertes Template in Word und ein Formular für Arbeitsgruppen.
Kein funktionierendes CRIS oder keine strukturierten Datenquellen. Wenn Publikationen, Projekte und Drittmittel nicht in irgendeiner Form digital erfasst sind, gibt es für die Datenpipeline keine Grundlage. Der erste Schritt wäre dann nicht Automatisierung, sondern Datenerfassung. KI kann keine Ordnung aus Chaos aggregieren, sie braucht strukturierte Eingaben.
Keine Möglichkeit, IT-seitig APIs freizugeben. An manchen Hochschulen ist der IT-Betrieb so restriktiv konfiguriert, dass externe API-Verbindungen zu CRIS oder SAP nicht genehmigt werden. Ohne diese Verbindungen bleibt nur manuelle Dateneingabe, und dann ist die Automatisierung auf Textgenerierung reduziert, was allein den Aufwand nicht wesentlich verringert.

Das kannst du heute noch tun

Der einfachste erste Test kostet dich 30 Minuten und kein Budget: Öffne NotebookLM, lade die letzten zwei Jahresberichte deines Instituts hoch (beide sind vermutlich ohnehin öffentlich verfügbar), und stelle die Frage: „Welche Entwicklungen sind zwischen diesen beiden Berichten erkennbar? Was sind die stärksten Wachstumsbereiche und was ist stagniert?” Du bekommst eine quellengebundene Analyse, mit Textstellenverweisen, damit du prüfen kannst, ob die Aussagen zutreffen.

Wenn du siehst, dass das Modell valide Aussagen auf Basis deiner echten Daten trifft, weißt du: Das Konzept funktioniert für deinen Kontext.

Für den nächsten Schritt, die Textgenerierung aus strukturierten Daten, brauchst du ein Template. Hier ist ein Prompt, den du direkt in Claude oder ChatGPT übernehmen kannst:

Fertiger Prompt für deinen Berichtskapitel-Generator

Du bist der Assistent der Forschungskoordination von [INSTITUTIONSNAME]. Erstelle auf Basis der folgenden strukturierten Daten den Textentwurf für Kapitel "[KAPITELNAME]" des Jahresberichts [JAHR]. Orientiere dich an Stil und Struktur des beigefügten Vorjahreskapitels. VORGABEN: - Verbleib strikt bei den bereitgestellten Daten. Erfinde keine Zahlen, keine Projektnamen, keine Kooperationspartner. - Wenn eine Information fehlt, markiere die Lücke mit [FEHLENDE INFORMATION: Beschreibung] statt zu raten. - Formuliere im Präteritum für abgeschlossene Projekte, im Präsens für laufende. - Verwende keinen Superlative-Stil. Sachlich und präzise. - Zielumfang: ca. [ANZAHL] Wörter. AKTUELLE DATEN: [HIER STRUKTURIERTE DATEN AUS DER PIPELINE EINFÜGEN, z. B. JSON, Tabelle oder Stichpunkte] VORJAHRESKAPITEL ZUM STILABGLEICH: [HIER TEXT DES ENTSPRECHENDEN KAPITELS AUS DEM VORJAHRESBERICHT EINFÜGEN]

Funktioniert mit ChatGPT, Claude

Beispiel-Ausgabe

Mitarbeiter:in

KAPITEL: Drittmittelentwicklung 2024 DATEN: DFG: 2.340.000 € (Vorjahr: 2.100.000 €, +11,4 %), BMBF: 890.000 € (Vorjahr: 1.200.000 €, -25,8 %), EU Horizon: 450.000 € (neu seit 2024), Industriedrittmittel: 340.000 € (Vorjahr: 280.000 €). Neue Projekte: 3 DFG-Sachbeihilfen, 1 EU Horizon-Verbund. Abgeschlossen: 2 BMBF-Verbundprojekte. VORJAHRESKAPITEL: "Im Jahr 2023 stiegen die Drittmitteleinnahmen des Instituts auf insgesamt 3,58 Millionen Euro..."

KI-Assistent

Im Berichtsjahr 2024 verzeichnete das Institut Drittmitteleinnahmen von insgesamt 4.020.000 Euro. Gegenüber dem Vorjahr (3.580.000 Euro) entspricht das einem Anstieg von 12,3 Prozent. Die DFG bleibt mit 2.340.000 Euro (58,2 % des Gesamtvolumens) der bedeutendste Drittmittelgeber. Das DFG-Fördervolumen stieg gegenüber dem Vorjahr um 11,4 Prozent; drei neue Sachbeihilfen wurden im Berichtszeitraum bewilligt. Die BMBF-Förderung ging auf 890.000 Euro zurück (Vorjahr: 1.200.000 Euro, -25,8 %), da zwei Verbundprojekte planmäßig ausliefen und keine unmittelbaren Nachfolgeprojekte beantragt wurden. [FEHLENDE INFORMATION: Sind neue BMBF-Anträge in Vorbereitung? Falls ja, Erwähnung als Ausblick sinnvoll.] Erstmals konnte das Institut 2024 EU-Horizon-Mittel in Höhe von 450.000 Euro einwerben, ein Verbundprojekt mit Partnern in Frankreich und Polen. Industrielle Drittmittel stiegen auf 340.000 Euro (+21,4 % gegenüber Vorjahr).

Quellen & Methodik

Zeitaufwand Datenaggregation und Berichtserstellung: Erfahrungsberichte aus Forschungskoordinationen mehrerer deutschen Hochschulinstitutionen (mittlere Größe, 100–300 Mitarbeitende; Stand 2024). Keine repräsentative Studie, Schätzwerte aus Praxisgesprächen.
CRIS-Datenvollständigkeit (10–25 % Lückenquote): Basierend auf Erfahrungsberichten aus der Hochschulinformatik; bestätigt durch Positionspapier des Zentrums für Bibliotheks- und Informationswissenschaftliche Weiterbildung, Hochschulen und Forschungseinrichtungen (ZBW/HRK, 2014), das auf strukturelle Erfassungsprobleme in Forschungsinformationssystemen hinweist.
Zeitersparnis durch automatische Berichtsgenerierung: ki-trainingszentrum.com, „Berichte automatisch erstellen mit KI” (2024): Wöchentliche Berichte von 4 Stunden auf 15 Minuten; jährliche Einsparung ca. 180 Stunden; finanzielle Einsparung ca. 17.100 Euro/Jahr pro Berichtsprozess.
Halluzinationsrisiko durch unverankerte LLM-Nutzung: Atlan, „LLM Hallucinations” (2025/2026); Lakera, „Guide to Hallucinations in LLMs” (2025). Zentrale Erkenntnis: Datenbankfehler oder fehlende Kontextanbindung, nicht Modellschwäche, sind die häufigste Ursache für numerische Fehler in automatisierten Berichten.
Preisinformationen Tools: Veröffentlichte Tarife der Anbieter (OpenAI, Anthropic, Microsoft, Make.com, Gamma), Stand Mai 2026.
AWS Bedrock Frankfurt / M365 EU Data Boundary: Offizielle Dokumentation AWS und Microsoft (Stand Mai 2026).

Du willst abschätzen, ob der Einrichtungsaufwand für euer spezifisches Institut realistisch ist, welche Systemkonnektoren wirklich nötig sind und was das kostet? Meld dich, das klären wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Forschung & Entwicklung vergleichen

Weitere Use Cases

Literaturrecherche automatisieren

KI durchsucht Datenbanken wie PubMed, Scopus und Semantic Scholar und liefert relevante Paper mit Zusammenfassungen. Spart Wochen manueller Recherche.

Mehr erfahren

Grant-Antrag Schreibassistent

KI unterstützt beim Verfassen von Drittmittelanträgen: strukturiert Projektbeschreibungen, passt Sprache an Fördergeber an und prüft Vollständigkeit.

Mehr erfahren

Forschungsdaten-Auswertung mit KI

KI analysiert große Mengen Messdaten, Umfrageergebnisse oder Textkorpora und identifiziert Muster, Ausreißer und Zusammenhänge, die manuell nicht erkennbar wären.

Mehr erfahren

Zurück zu Forschung & Entwicklung

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

Forschungsbericht und Jahresbericht automatisieren

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was der Berichtsgenerator konkret macht

Was das Modell liefert, und was nicht

Die Integrations-Realität, wo CRIS und KI aufeinandertreffen

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Literaturrecherche automatisieren

Grant-Antrag Schreibassistent

Forschungsdaten-Auswertung mit KI

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI