Zum Inhalt springen
Medien & Verlag datenjournalismusdatenanalysestatistik

Datenjournalismus mit KI beschleunigen

KI analysiert große Datensätze — Statistiken, Behördendaten, Unternehmensberichte — und extrahiert journalistisch relevante Muster. Was früher Wochen brauchte, geht heute in Tagen. Aber nur, wenn die Daten sauber sind.

⚡ Auf einen Blick
Problem
Datenjournalismus erfordert statistisches Know-how und viel Zeit für Datenbereinigung, Analyse und Visualisierung. Nur wenige Redaktionen haben Datenjournalisten — und die sind chronisch überlastet.
KI-Lösung
Ein LLM mit integriertem Code-Interpreter (Python-Ausführung) analysiert strukturierte Datensätze auf Ausreißer, Trends und erzählenswerte Muster in natürlicher Sprache. Journalisten geben den Kontext und die Fragestellung, die KI rechnet, filtert und erklärt.
Typischer Nutzen
Datenanalyse: 3–5 Tage → 4–8 Stunden pro Datensatz; AP-Praxisbeleg: Fehlerquote von 7 % auf 1 % gesenkt; mehr datengestützte Geschichten ohne Teamausbau.
Setup-Zeit
Einfache Analysen sofort; publikationsreif nach 2–3 Wochen Einarbeitung
Kosteneinschätzung
Julius AI ~18 €/Monat, ChatGPT Plus ~20 USD/Monat; Datawrapper Free 0 €; einmalig 0 € für Einarbeitung
Julius AI oder ChatGPT (ab 20 $/Monat)Kombination mit Datawrapper für VisualisierungPython-Skripte für reproduzierbare Analysen
Worum geht's?

Es ist Montag, 8:14 Uhr.

Nele Hartmann sitzt vor einem Excel-Export des Stadtkämmerers — 47 Tabellenblätter, Haushaltsdaten der vergangenen zwölf Jahre, Formatierungskonventionen, die sich irgendwann zwischen 2017 und 2021 still verändert haben. Die Geschichte soll schon nächste Woche erscheinen: Wohin fließt das Geld, wenn die Stadt spart? Sie ist die einzige Person in der Redaktion, die überhaupt versucht, solche Datensätze zu lesen.

Bis zum Mittag hat sie drei Tabellenblätter normalisiert. Zehn Stunden für die Datenbereinigung, dann erst die eigentliche Analyse — ein Stück, das am Ende vielleicht drei Visualisierungen und eine Kernaussage trägt, ist in drei bis vier Arbeitswochen kaum zu schaffen.

Das ist kein Einzelfall in deutschen Redaktionen. Das ist der Alltag von jedem Datenjournalisten, der mit Behördendaten, Unternehmensberichten oder amtlichen Statistiken arbeitet.

Das echte Ausmaß des Problems

Datenjournalismus ist in deutschen Redaktionen trotz hohem Anspruch ein knappes Gut. Laut einer Umfrage des BDZV unter deutschen Verlagen aus 2024 investieren zwar 73 Prozent in KI — aber der Schwerpunkt liegt auf Texterstellung und Distribution, nicht auf Analyse. Dedizierte Datenjournalismus-Teams gibt es nur bei größeren Häusern wie BR Data (Bayerischer Rundfunk), CORRECTIV oder Der Spiegel — und selbst dort klagen Datenjournalisten über strukturelle Engpässe.

Das Problem hat drei Ebenen:

Zeitaufwand für Datenbereinigung. Ein realistischer Datenjournalismus-Workflow sieht so aus: 60–70 Prozent der Zeit gehen in Rohdaten-Normalisierung, Fehlerbereinigung und Formatkonvertierung. Das eigentliche Analysieren und Storytelling kostet die restlichen 30–40 Prozent. Wer mit Behördendaten oder Unternehmensberichten arbeitet, bekommt selten saubere, maschinenlesbare CSVs — sondern Excel-Exporte, die für menschliche Leser formatiert wurden, nicht für Analysewerkzeuge.

Fehlende Kapazität. Die Associated Press hat 2014 begonnen, Quartalsberichte mit automatisierten Textsystemen zu erstellen — vorher entstanden rund 300 Artikel pro Quartal, danach über 3.000. Das Volumen hat sich verzehnfacht, die Fehlerquote sank dabei von rund sieben auf etwa ein Prozent. Das Prinzip funktioniert — aber die AP hat Ressourcen, die die meisten deutschen Regional- und Fachredaktionen nicht haben.

Zu wenig Menschen, die Statistiken lesen können. Viele Datenstücke entstehen gar nicht, weil niemand in der Redaktion weiß, wie man eine Regressionsanalyse interpretiert oder einen Datensatz auf Ausreißer prüft. Das bedeutet: Wichtige öffentliche Daten — Behördentransparenz, Haushaltsdaten, Umweltstatistiken — werden nicht journalistisch aufgearbeitet, weil das Know-how fehlt.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit KI-gestützter Analyse
Zeit für erste Datenanalyse (ein Datensatz, 50.000 Zeilen)3–5 Tage (inkl. Bereinigung)4–8 Stunden ¹
Voraussetzung beim JournalistenStatistik-Grundkenntnisse, Python oder Excel-ExpertiseFragestellungskompetenz, kritische Urteilsfähigkeit
Erkennung von Ausreißern und AnomalienManuell, fehleranfällig, zufälligSystematisch, auf Nachfrage erklärbar
Visualisierung für Veröffentlichung2–4 Stunden zusätzlich30–60 Minuten mit Datawrapper
Skalierung auf mehrere DatensätzeLinearer MehraufwandDeutlich geringer — Prompt-Templates wiederverwendbar

¹ Setzt voraus, dass die Daten einigermaßen maschinenlesbar vorliegen. Bei stark verschachtelten Excel-Dateien mit Sonderformatierungen kann allein die Bereinigung noch einmal 2–4 Stunden dauern, auch mit KI-Unterstützung.

Einschätzung auf einen Blick

Zeitersparnis — mittel (3/5)
Wer regelmäßig Datenprojekte bearbeitet, spart real Wochen pro Projekt — aber die Einsparung tritt nicht täglich auf wie bei der Automatisierten Transkription oder der KI-gestützten Recherche. Ein Datenstück entsteht vielleicht zwei- bis viermal im Monat. Die Zeitersparnis pro Projekt ist erheblich, der tägliche Effekt für das Gesamtteam geringer.

Kosteneinsparung — hoch (4/5)
Hier liegt der unterschätzte Hebel: Julius AI kostet $20/Monat im Plus-Plan, Datawrapper ist für Einzelnutzer kostenlos. Das ist wenig im Vergleich zu dem, was eine externe Datenanalyse kostet: Selbst ein halbtägiger Einsatz eines Freiberuflers mit Data-Science-Background schlägt mit 500–1.200 Euro zu Buche. Redaktionen, die bisher externe Analysen eingekauft haben oder auf fachfremde Teams angewiesen waren, sehen schnell, dass sich die Toolkosten bei einem einzigen eingesparten Fremdauftrag pro Quartal amortisieren.

Schnelle Umsetzung — mittel (3/5)
Eine erste explorative Datenanalyse gelingt mit Julius AI oder ChatGPT Code Interpreter in einer Stunde. Publikationsreife Ergebnisse — mit verifizierten Zahlen, klarer Methodik und erzählenswerten Mustern — brauchen deutlich mehr Übung. Rechne mit zwei bis drei Wochen, bis ein Journalist ohne Programmierhintergrund zuverlässig von der Rohdatei zur prüfbaren Analyse kommt.

ROI-Sicherheit — niedrig (2/5)
Das ist die ehrlichste Einschätzung: Ob ein datengestütztes Stück die Reichweite erhöht, Abonnenten gewinnt oder redaktionelle Glaubwürdigkeit stärkt — das lässt sich kaum sauber isolieren. Gute Datenjournalismus-Stücke werden oft viel geteilt und haben Langzeitwirkung, aber ob das Tool oder das journalistische Handwerk diesen Effekt erzeugt hat, ist im Nachhinein schwer zu trennen. Kleines Trost: Fehlerraten sind messbar, und die sinken nachweislich.

Skalierbarkeit — mittel (3/5)
Mit etablierten KI-Workflows kann ein Team deutlich mehr datengestützte Stücke produzieren. Aber die Skalierung stößt schnell an die Grenze der Datenqualität: Mehr Werkzeuge helfen nicht, wenn die Rohdaten strukturell schlecht sind. Prompt-Templates und Analyse-Workflows lassen sich zwar intern teilen, aber jede neue Datenquelle braucht angepasste Fragestellungen.

Richtwerte — stark abhängig von Größe und Spezialisierung der Redaktion sowie von der Qualität der verfügbaren Datensätze.

Was KI im Datenjournalismus konkret macht

Wenn du einen Datensatz — zum Beispiel den Jahresabschluss eines kommunalen Unternehmens im PDF oder einen CSV-Export von einer Behördenstatistik — in ein KI-System lädst, passiert im Hintergrund folgendes: Das System liest die Daten, erkennt Spaltenstrukturen und Datentypen, und generiert auf deine Frage hin Machine Learning-gestützt eine Antwort. Bei einfacheren Systemen wie Julius AI wird dazu im Hintergrund Python-Code geschrieben und ausgeführt — du siehst nur das Ergebnis in natürlicher Sprache.

Explorative Analyse — Du fragst: “Welche drei Kostenpositionen sind zwischen 2019 und 2024 am stärksten gestiegen?” Das System rechnet die Veränderungsraten aus und nennt dir die Antwort, ohne dass du SVERWEIS oder XVERWEIS brauchst.

Anomalieerkennung — Du fragst: “Gibt es Ausreißer in den Auszahlungsbeträgen — Werte, die deutlich vom Mittelwert abweichen?” Das System markiert Ausreißer und erklärt, warum sie auffällig sind.

Mustererkennung — Du fragst: “Welche Gemeinden haben überdurchschnittlich oft von dieser Förderlinie profitiert?” Das System aggregiert, gruppiert und sortiert — Aufgaben, die manuell Stunden dauern.

Visualisierungsvorbereitung — Du fragst: “Erstelle mir eine bereinigte Tabelle nur mit den Spalten X, Y und Z für die Jahre 2018–2024.” Das Ergebnis kopierst du in Datawrapper und hast in zehn Minuten ein embeddable Chart.

Was KI nicht macht: Sie interpretiert nicht im journalistischen Sinne. Sie sagt dir nicht, ob die Anomalie politisch relevant ist, ob hinter dem Ausreißer Korruption oder ein Erfassungsfehler steckt, oder welche Geschichte es wert ist, erzählt zu werden. Das ist die Aufgabe des Journalisten — und der schwierigere Teil.

Datenqualität als Voraussetzung

Das ist der Teil, den Anbieter-Demos verschweigen: Die meisten Datenprojekte scheitern nicht an der KI-Kompetenz, sondern an der Datenqualität.

Woran du dich orientierst, bevor du eine Analyse startest:

Ist die Datenquelle maschinenlesbar?
Ein PDF-Bericht mit eingebetteten Tabellen ist für KI-Systeme nur bedingt verwendbar. Wenn Tabellen als Bild gespeichert sind, ist der Datensatz für automatische Analyse unbrauchbar — du brauchst eine Texterkennung vorgelagert. Ein CSV mit sauberen Spaltenköpfen ist die beste Ausgangslage.

Sind die Einheiten und Definitionen konsistent?
Behördendaten wechseln manchmal Definitionen zwischen Erhebungsjahren. Wenn “Einwohner” in 2015 die Hauptwohnbevölkerung meint und in 2020 die Meldebevölkerung, sind die Zahlen nicht direkt vergleichbar — auch ein KI-System wird das nicht automatisch erkennen und könnte falsche Trends ausweisen.

Gibt es offensichtliche Codierungsartefakte?
Umlaute als Fragezeichen, unterschiedliche Dezimaltrennzeichen (Punkt vs. Komma), gemischte Datumsformate — all das verursacht stille Fehler. In großen Datensätzen merkt man sie oft erst, wenn ein Ergebnis nicht zur Erwartung passt.

Sind Datenlücken dokumentiert?
Fehlende Werte, die als 0 codiert sind statt als leer, verzerren Durchschnitte und Summen. Frag das KI-System explizit: “Wie viele fehlende Werte gibt es in dieser Spalte? Zeig mir die betroffenen Zeilen.”

Praktische Konsequenz: Plane für jeden Datensatz, den du noch nicht kennst, ein bis zwei Stunden “Data Reconnaissance” ein — bevor du anfängst, Analysen zu interpretieren. Die Fragen “Was ist das Maximum und Minimum? Wo sind Lücken? Was sind die zehn häufigsten Werte in dieser Spalte?” kosten dich mit Julius AI fünf Minuten und ersparen dir potenzielle Faktenfehler in der Veröffentlichung.

Verifizierungspflicht vor der Veröffentlichung

Dieser Abschnitt fehlt in den meisten KI-Guides — dabei ist er für journalistische Anwendungen entscheidend.

Eine EBU-Studie (Europäische Rundfunkunion) aus dem Jahr 2025, an der ARD und ZDF beteiligt waren, hat ergeben: In 45 Prozent der Fälle geben KI-Systeme Nachrichteninhalte fehlerhaft wieder. Bei Datenfragen ist das Risiko besonders heimtückisch, weil KI-Systeme falsche Zahlen mit derselben Selbstsicherheit präsentieren wie korrekte. Halluzination bei Datenanalysen bedeutet nicht Fantasiezahlen aus dem Nichts — es bedeutet oft: falsche Aggregation, falsch angewandte Formel, falsch interpretiertes Vorzeichen.

Vor jeder Veröffentlichung gilt daher eine dreistufige Prüfpflicht:

1. Plausibilitätsprüfung. Liegt das Ergebnis im erwartbaren Bereich? Wenn die KI dir sagt, dass eine Gemeinde 2022 doppelt so viel Steuereinnahmen hatte wie 2021, ist das möglich — oder ist das ein Summierfehler? Jede überraschende Zahl ist zunächst verdächtig.

2. Quellenprüfung. Frag das System: “Zeige mir die genauen Zeilen aus dem Datensatz, aus denen du diese Zahl errechnet hast.” Wenn das System keine konkreten Quelldaten nennen kann, ist die Zahl nicht publikationsreif.

3. Nachrechnung. Bei zentralen Zahlen — die in der Überschrift stehen oder die Hauptaussage tragen — rechne manuell nach. Eine einfache Formelfunktion in Excel reicht, um eine Summe oder einen Durchschnitt zu verifizieren. Das dauert zwei Minuten und rettet deinen Ruf.

Verleger, die diese Prüfpflicht ignorieren, riskieren mehr als einen Faktenfehler: Laut einer Studie sinkt das Vertrauen von 42 Prozent der Leserinnen und Leser dauerhaft in das Originalmedium, wenn eine KI-generierte Angabe sich nachträglich als falsch herausstellt.

Konkrete Werkzeuge — was wann passt

Die richtige Toolwahl hängt davon ab, wo du in der Analyse bist und was du mit den Ergebnissen machst.

Julius AI — für explorative Analyse ohne Programmierkenntnisse
Du lädst einen CSV- oder Excel-Datensatz hoch und stellst Fragen in normaler Sprache (Englisch funktioniert besser als Deutsch). Julius schreibt im Hintergrund Python-Code, führt ihn aus und zeigt dir das Ergebnis. Besonders stark bei: Ausreißer-Erkennung, Aggregationen, einfachen Visualisierungen. Einschränkung: Oberfläche auf Englisch, US-Hosting — für sensible personenbezogene Daten nicht geeignet. Kostenloser Plan (100 Credits/Monat) für gelegentliche Tests; Plus-Plan für $20/Monat.

ChatGPT mit Advanced Data Analysis (Code Interpreter) — für strukturiertere Analysen
ChatGPT Plus (20 USD/Monat) enthält den Code Interpreter, der ähnlich wie Julius funktioniert, aber mit stärkerem Python-Basis-Modell und mehr Kontrolle über den generierten Code. Du kannst den Code einsehen und bei Bedarf korrigieren — das ist für Datenjournalisten mit minimalen Programmierkenntnissen ein relevanter Vorteil. OpenAI hat EU-Verarbeitungsoptionen für Unternehmenskonten, aber die Standard-API läuft in den USA.

Datawrapper — für publikationsreife Visualisierungen
Sobald deine Analyse steht, willst du die Geschichte visualisieren. Datawrapper ist das De-facto-Standardtool für Datenjournalismus in deutschen und europäischen Redaktionen — von der ARD bis zu kleinen Lokalmedien. Kostenlos für Einzelnutzer, responsiv, barrierefrei, EU-Hosting. Du kopierst deine bereinigte Tabelle aus Julius oder Excel, wählst einen Charttyp und konfigurierst Farben und Beschriftungen. Ergebnis: ein iFrame-Code, den du ins CMS einfügst.

NotebookLM — für dokumentenbasierte Recherche parallel zur Analyse
Wenn du neben dem Datensatz auch Berichte, Gutachten oder Pressemitteilungen auswerten willst, lädst du diese in NotebookLM. Während Julius die Zahlen bearbeitet, beantwortet NotebookLM Fragen zu den narrativen Quellen — “Was sagt der Jahresbericht 2023 zur Rücklagenentwicklung?”. Die Kombination macht aus zahlengestützter Analyse eine vollständigere Geschichte.

Python (Pandas, Matplotlib) — für reproduzierbare, komplexe Analysen
Für Datenjournalisten, die regelmäßig mit ähnlichen Datensätzen arbeiten, lohnt sich der Einstieg in NLP-gestützte Datenverarbeitung via Python. Einmal geschriebene Skripte laufen auf jedem neuen Datensatz desselben Typs — ohne dass du jemals wieder eine KI befragen musst. Hohe Einstiegshürde, aber maximale Kontrolle und Reproduzierbarkeit.

Wann welcher Ansatz:

  • Einmalige Analyse ohne Programmierkenntnisse → Julius AI oder ChatGPT Code Interpreter
  • Publikationsreife Visualisierungen → Datawrapper
  • Dokumentenbasierte Quellen parallel zu Datensätzen → NotebookLM
  • Reproduzierbare, wiederkehrende Datenanalysen → Python

Datenschutz und Datenhaltung

Datenjournalismus arbeitet oft mit Daten, die im öffentlichen Raum liegen: Haushaltsdaten, Fördermittellisten, Umweltstatistiken, Unternehmensregister-Abzüge. In diesen Fällen ist die DSGVO-Frage weniger komplex — öffentliche Verwaltungsdaten sind zur Veröffentlichung bestimmt.

Kritisch wird es, wenn:

  • Personenbezogene Daten in den Rohdaten stecken — Förderlisten mit Empfängernamen, Vergabeentscheidungen mit Auftragnehmer-Kontaktdaten, Sozialstatistiken auf Einzelpersonenebene. Solche Datensätze dürfen nicht ungefiltert in US-gehostete Cloud-KI hochgeladen werden.
  • Unternehmensgeheimnisse aus zugespielten Dokumenten — Dokumente aus Whistleblower-Quellen sind keine öffentlichen Daten; hier gelten besondere Sorgfaltspflichten.
  • Journalistische Quellenschutzpflicht — Wenn aus Daten indirekt auf Informantinnen oder Informanten geschlossen werden kann, ist besondere Vorsicht geboten.

Für öffentliche, anonymisierte Datensätze ohne Personenbezug: Julius AI und ChatGPT sind praktikabel, wenn du die Terms of Service des Anbieters kennst und keine vertragliche DSGVO-Bindung vorausgesetzt ist. Einen Auftragsverarbeitungsvertrag (AVV) gemäß Art. 28 DSGVO brauchst du in jedem Fall, wenn auch nur entfernt personenbezogene Daten verarbeitet werden.

Für vertrauliche Datensätze empfiehlt sich eine lokal laufende Lösung. Das bedeutet in der Praxis: Python mit Pandas lokal, kein Cloud-Upload. Oder: NotebookLM ist Google-gehostet in den USA — hier gelten dieselben Einschränkungen wie bei anderen US-Cloud-Diensten.

Datawrapper selbst verarbeitet deine Datensätze kurzfristig für die Chart-Erstellung, hält sie aber nicht dauerhaft vor. Als deutsche GmbH mit EU-Hosting ist das datenschutzrechtlich unkomplizierter als US-Dienste.

Was es kostet — realistisch gerechnet

Toolkosten monatlich:

  • Julius AI Plus: $20/Monat pro Nutzer (~18 Euro)
  • ChatGPT Plus: $20/Monat pro Nutzer
  • Datawrapper Free: 0 Euro (mit Datawrapper-Branding)
  • Datawrapper Custom: $599/Monat für 10 Nutzer — rentiert sich ab mittelgroßen Redaktionen mit Publikations-Branding-Anforderungen
  • NotebookLM: kostenlos

Einmalige Einarbeitungskosten:
Realistische Einarbeitung für einen nicht-technischen Journalisten: zwei bis drei Wochen, um einen verlässlichen Workflow von der Rohdatei zur verifizierten Analyse zu entwickeln. Das entspricht drei bis fünf Tagen echter Arbeitszeit — kein Kurs, kein externer Support nötig, nur Zeit.

Was du gegenstaffierst:
Ein typischer Auftrag an einen externen Data-Science-Freelancer für die Analyse eines behördlichen Datensatzes (Bereinigung, Aggregation, Visualisierungsvorbereitung): 600–1.800 Euro, je nach Komplexität und Datengröße. Drei solcher Aufträge pro Jahr bedeuten 1.800–5.400 Euro — wesentlich mehr als ein Jahr Julius AI.

Wie du den Nutzen wirklich misst:
Der ehrlichste Beleg sind nicht gesparte Stunden, sondern Stücke, die ohne KI-Unterstützung nicht entstanden wären. Führe eine einfache Liste: “Diese drei Datenstücke hätten wir früher nicht machen können — zu aufwendig.” Das ist sowohl intern als auch für Redaktionsleitung das überzeugendste Argument.

Drei typische Einstiegsfehler

1. Mit zu großen Datensätzen starten.
Der Impuls ist verständlich: Lade den kompletten Datensatz hoch und frag nach allem. Das führt zu ungenauen Antworten — weil zu große Datensätze das Kontextfenster überfordern oder weil die KI falsche Aggregationen vornimmt, ohne dass du es bemerkst. Das Tückische: falsche Summen oder Prozentwerte klingen genauso überzeugend wie richtige — und landen dann in der Überschrift. Bei Datensätzen mit mehr als 20.000 Zeilen steigt die Rate stiller Rechenfehler in der Praxis spürbar, weil das Modell Spalten verwechselt oder Zwischensummen falsch anwendet. Lösung: Beginne mit einer repräsentativen Teilmenge (2.000–5.000 Zeilen), validiere die Ergebnisse manuell, und skaliere dann.

2. KI-Ergebnisse ohne Quellenprüfung übernehmen.
Das ist der gefährlichste Fehler — und er ist nicht sofort sichtbar. Ein KI-System, das 3+4=7 ausrechnet und dabei versehentlich eine falsche Spalte summiert, gibt dir 7 als Antwort — korrekt formuliert, falsch berechnet. Frag immer: “Zeig mir die Zeilen, aus denen du das errechnet hast.” Wenn das System keine konkreten Quelldaten nennen kann, ist das Ergebnis nicht publikationsreif.

3. Den Workflow einrichten und dann nicht pflegen.
Die meisten Datenjournalismus-Workflows degradieren nach ein paar Monaten — weil sich Behörden-Formate ändern, weil ein Datensatz auf einmal anders codiert ist oder weil die KI-Oberfläche ein Update bekam. Einmal eingerichtet und nie wieder angeschaut ist eine typische Falle. Lösung: Jeden Datensatz, den du regelmäßig analysierst, einmal jährlich komplett neu laufen lassen und das Ergebnis mit dem Vorjahr vergleichen — das zeigt Drift sofort.

Was mit der Einführung wirklich passiert — und was nicht

Die technische Einrichtung ist nicht das Problem. Die meisten Datenjournalisten, die Julius AI oder ChatGPT Code Interpreter testen, sind innerhalb einer Stunde bei ihren ersten Ergebnissen. Was danach kommt, ist schwieriger.

Der Methodenstreit. In Redaktionen mit traditionellem Handwerk gibt es meistens jemanden, der fragt: “Wie wissen wir, dass das stimmt?” Das ist eine berechtigte Frage — und sie tut gut. Behandle sie nicht als Widerstand, sondern als Qualitätsmechanismus. Dokumentiere deinen Verifikationsweg offen: “Ich hab die Ergebnisse mit dieser Methode nachgerechnet.” Das schafft Vertrauen auch bei KI-Skepikern.

Die “Ich mach das mal schnell”-Falle. KI-gestützte Datenanalyse ist schneller als manuell — aber “schneller” bedeutet nicht “beliebig schnell”. Wer nach 90 Minuten Analyse ein Stück ohne Verifikation publiziert, hat dasselbe Risiko wie ein Journalist, der einen einzigen Informanten nicht gegencheckt. Die Werkzeuge verkürzen die Analysezeit, nicht die journalistische Sorgfaltspflicht.

Was konkret hilft:

  • Lege für jede KI-gestützte Analyse eine kurze Methodik-Notiz an (zwei bis drei Sätze, intern): Was wurde analysiert, wie wurde verifiziert, wer hat gegengeprüft. Das dauert drei Minuten und schützt dich bei Rückfragen
  • Teile erste Ergebnisse intern mit einer Person ohne Datenhintergrund — wenn die Geschichte nicht klar wird, ist die Analyse noch nicht fertig
  • Nutze den ersten Datensatz eines neuen Typs als Lernprojekt: nicht veröffentlichen, sondern mit dem tatsächlich korrekten Ergebnis (aus anderen Quellen bekannt) vergleichen

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Werkzeug-EvaluationWoche 1Julius AI und ChatGPT Code Interpreter mit einem bekannten Datensatz testen; Stärken und Grenzen verstehenZu schnell skalieren — lieber einen Datensatz gut kennen als drei oberflächlich
Erste echte AnalyseWoche 2–3Einen realen Redaktionsdatensatz analysieren, Ergebnisse manuell verifizieren, Workflow dokumentierenDatensatz zu unstrukturiert — Bereinigung dauert länger als die Analyse
Visualisierung einrichtenWoche 3–4Datawrapper in den Workflow integrieren, Standardvorlagen anlegen, CMS-Einbettung testenBranding und Responsivität mit dem CMS kompatibel machen kostet Zeit
Erstes veröffentlichtes StückWoche 4–6Kompletter Workflow von Rohdaten bis Publikation, intern dokumentiertDeadline-Druck führt dazu, Verifikationsschritt zu überspringen — das ist der häufigste Fehler
RoutinebetriebAb Monat 2–3Wiederkehrende Datensätze mit Prompt-Templates bearbeiten, Workflow an neue Kolleginnen und Kollegen weitergebenWissenstransfer scheitert ohne schriftliche Dokumentation des Workflows

Häufige Einwände — und was dahintersteckt

„KI macht Fehler — das ist für Journalismus zu riskant.”
Das stimmt — und genau deshalb gibt es die Verifizierungspflicht. Der relevante Vergleich ist nicht “KI vs. fehlerfrei”, sondern “KI mit Verifikation vs. manuell ohne Verifikation”. Die AP hat nach der Einführung automatisierter Finanzmeldungen die Fehlerquote von sieben auf ein Prozent gesenkt, weil das System konsistenter als menschliche Tipper arbeitet. Risiko lässt sich mit dem richtigen Prüfprozess managen, nicht eliminieren — genauso wie bei anderen journalistischen Methoden.

„Wir haben keinen Datenjournalisten — das ist nichts für uns.”
Das war früher ein gültiger Einwand. Julius AI hat die Einstiegshürde erheblich gesenkt: Wer Excel-Tabellen lesen und journalistische Fragen stellen kann, kann heute einfache Datenanalysen durchführen. Der Anspruch, ein Python-Skript schreiben zu können, ist nicht mehr Voraussetzung. Was bleibt: statistische Grundkenntnisse und die Fähigkeit, falsche Ergebnisse zu erkennen — das lässt sich in zwei Wochen aufbauen.

„Die Behördendaten sind so schlecht, dass KI nichts hilft.”
Das hängt von der Datenquelle ab. Für neuere Bundesstatistiken und EU-Datensätze stimmt das nicht mehr — die sind oft gut strukturiert. Für ältere kommunale Daten kann es zutreffen: Dann ist der erste Schritt die Bereinigung, nicht die Analyse. KI kann auch dabei helfen — aber sie löst strukturelle Datenqualitätsprobleme nicht automatisch.

Woran du merkst, dass das zu dir passt

  • Du oder jemand in deiner Redaktion bringt regelmäßig Datensätze nach Hause — amtliche Statistiken, Behördenanfragen, zugängliche Unternehmensberichte — und die Analyse ist der Engpass, nicht die Beschaffung
  • Datengestützte Stücke entstehen bei euch, aber sehr selten, weil sie unverhältnismäßig viel Zeit kosten im Vergleich zu anderen Storys
  • Du hast Excel-Grundkenntnisse, kannst eine Pivottabelle bedienen und weißt, was ein Mittelwert ist — darüber hinaus ist kein technisches Vorwissen nötig
  • Ihr arbeitet mit wiederkehrenden Datensätzen: Jahresberichten, Quartalsdaten, statistischen Jahrbüchern — je öfter derselbe Typ vorkommt, desto mehr amortisiert sich der Workflow

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Weniger als ein bis zwei Datenjournalismus-Projekte pro Quartal. Wenn Datenstücke in deiner Redaktion strukturell kaum vorkommen — weil es kein Interesse gibt, kein Publikum dafür oder keine passenden Quellen — dann ist der Aufwand des Workflow-Aufbaus nicht gerechtfertigt. Für einzelne Gelegenheitsprojekte reicht ChatGPT Plus im Einzelfall.

  2. Keine Person mit Zeit für Datenarbeit. KI beschleunigt, ersetzt aber kein menschliches Urteil. Wenn niemand die Ergebnisse prüfen und einordnen kann, weil alle Kapazitäten in tagesaktuellem Betrieb gebunden sind, wird eine KI-Analyse im besten Fall ungenutzt bleiben — und im schlechtesten Fall unreflektiert publiziert werden.

  3. Datensätze fast ausschließlich als nicht-maschinenlesbare Formate. Wenn eure typischen Quellen gescannte PDFs, handgeschriebene Tabellen oder Bilder von Dokumenten sind, lösen die beschriebenen KI-Analyse-Tools das Problem nicht. Hier wäre der erste Schritt eine OCR-Infrastruktur (automatische Texterkennung) — das ist ein eigenes Projekt vor dem Datenjournalismus-Workflow.

Das kannst du heute noch tun

Öffne Julius AI kostenlos auf julius.ai — kein Download, kein Setup. Such dir einen öffentlich zugänglichen Datensatz, der dich interessiert: Der Statistik-Portal-Bund (destatis.de) bietet tausende CSV-Downloads, ebenso das Datenangebot der Eurostat oder dein Bundesland-Statistikamt.

Lade den Datensatz hoch und stelle drei konkrete Fragen:

  1. “Was sind die fünf größten Werte in Spalte X?”
  2. “Welches Jahr hat den stärksten Rückgang in Spalte Y?”
  3. “Gibt es Ausreißer in den Werten — also Einträge, die deutlich vom Rest abweichen?”

Dann prüfe: Stimmt das Ergebnis mit dem überein, was du durch kurzes Googeln oder manuelle Prüfung herausfindest? Wenn ja, weißt du, dass das Werkzeug für diesen Datensatztyp funktioniert. Wenn nein, hast du in zehn Minuten das wichtigste gelernt: Ergebnisse immer gegenprüfen.

Hier ist ein Prompt, den du direkt in Julius AI oder ChatGPT (Code Interpreter aktiviert) einfügen kannst:

Datenjournalismus-Analyse-Prompt
Ich bin Datenjournalist:in und möchte diesen Datensatz journalistisch auswerten. Analysiere den hochgeladenen Datensatz und beantworte folgende Fragen: 1. Überblick: Wie viele Zeilen und Spalten enthält der Datensatz? Welche Zeiträume sind abgedeckt? Gibt es fehlende Werte — wenn ja, in welchen Spalten und wie viele? 2. Ausreißer: Welche Einträge weichen statistisch stark vom Durchschnitt ab? Nenne die konkreten Zeilen mit den auffälligen Werten. 3. Trend: In welcher Spalte gibt es den deutlichsten Veränderungstrend über den Zeitraum? Zeig mir die konkreten Ausgangszahlen. 4. Muster: Gibt es Gruppierungen oder Häufungen, die journalistisch interessant sein könnten? Wichtig: Nenne bei jeder Antwort die konkreten Zeilen oder Spaltenwerte, aus denen du deine Schlussfolgerung ziehst. Gib keine Zusammenfassungen ohne Quellenangabe im Datensatz. [DATENSATZ HOCHLADEN ODER CSV-INHALT HIER EINFÜGEN]
Funktioniert mit Julius AI, ChatGPT (Code Interpreter)
Beispiel-Ausgabe

Mitarbeiter:in

Datensatz: Ausgaben der Gemeindeverwaltung 2012–2024, 12 Haushaltspositionen, 48 Zeilen Frage 3: Trend — in welcher Spalte gibt es den deutlichsten Veränderungstrend?

KI-Assistent

Stärkster Trend: Spalte "Personalkosten_Verwaltung_EUR" Veränderung 2012–2024: +94,3 Prozent (von 1.240.000 EUR auf 2.409.200 EUR) Quelldaten: - 2012: Zeile 1 → 1.240.000 EUR - 2018: Zeile 7 → 1.680.000 EUR (+35,5 %) - 2021: Zeile 10 → 2.100.000 EUR (+69,4 %) - 2024: Zeile 13 → 2.409.200 EUR (+94,3 %) Zum Vergleich: "Sachausgaben_EUR" im gleichen Zeitraum +31,2 %, "Investitionskosten_EUR" +18,7 %. Hinweis: Bitte verifiziere die Originalzeilen im Datensatz direkt — ich habe die Werte aus deiner hochgeladenen CSV-Datei berechnet.

Quellen & Methodik

  • Associated Press / Automated Insights (Wordsmith), ab 2014: Die AP begann 2014, Quartalsberichte von ~300 auf über 3.000 pro Quartal durch automatisierte Texterstellung zu skalieren. Fehlerquote sank von ca. 7 % auf ca. 1 %. Quelle: Poynter, „Robot-writing increased AP’s earnings stories by tenfold” (2015), poynter.org
  • EBU-Studie zu KI-Nachrichtengenauigkeit (2025): Internationale Studie der Europäischen Rundfunkunion (EBU) mit Beteiligung von ARD und ZDF: 45 % der KI-Antworten geben Nachrichteninhalte fehlerhaft wieder. Quelle: ZDF-Presseportal (Oktober 2025), presseportal.zdf.de
  • BDZV-Trendumfrage 2025: 73 Prozent der befragten Verlage investieren in KI; knapp 60 Prozent planen vollständig KI-erstellte Texte nach menschlicher Prüfung. Quelle: meedia.de / BDZV-Schickler-Umfrage, meedia.de
  • Datawrapper-Preise: Datawrapper GmbH, offizielle Preisseite (Mai 2026), datawrapper.de/pricing
  • Julius AI-Preise: Julius AI Inc., offizielle Preisseite (Stand Mai 2026). Plus-Plan: $20/Monat.
  • Vertrauen und KI-Fehler: “42 Prozent der Befragten verlieren dauerhaft Vertrauen in das Originalmedium, wenn KI-Antworten Fehler enthielten” — Reuters Institute Digital News Report 2024 / JournalismAI-Auswertungen.
  • Erfahrungswerte Kosten externer Datenanalysen: Eigene Einschätzungen auf Basis publizierter Freiberufler-Tagessätze für Data Science (GULP, Freelancermap, Stand 2025).

Du willst wissen, welche eurer Datensätze sich für einen KI-gestützten Workflow eignen und wie ihr die Verifikation redaktionell absichert? Meld dich — das lässt sich in einem kurzen Gespräch klären.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar