Verlag & Medienproduktion werbungprognoseumsatz

Werbeeinnahmen-Prognose per KI

ML-Modelle kombinieren Buchungshistorie, Traffic-Daten und Saisonalität zu monatlichen Prognosen, und ersetzen das Raten durch Rechnen.

⚡ Auf einen Blick

Problem: Werbeeinnahmen-Prognosen basieren auf historischen Durchschnittswerten und Bauchgefühl. Volatile Buchungseingänge, Print-Rückgang und Programmatic-Schwankungen machen die Budgetplanung zur Zitterpartie.
KI-Lösung: Ein ARIMA/Prophet-Zeitreihenmodell mit externen Regressoren kombiniert historische Buchungshistorie, Traffic-Daten, Saisonalität und externe Faktoren zu validierbaren monatlichen Vorausschauen, getrennt nach Umsatztyp.
Typischer Nutzen: Prognosegenauigkeit von ±20–30 % auf ±8–12 % verbessert, Planungssicherheit für Personaleinsatz und Ausgaben erhöht, Überraschungen in der Quartalsplanung reduziert.
Setup-Zeit: 8–12 Wochen bis zum ersten validen Modell
Kosteneinschätzung: 8–12 Wochen Einrichtung (Datenaufbereitung + Modellbau + Dashboard): 8.000–27.000 € einmalig; laufend 50–150 €/Monat (Infrastruktur + BI-Tools)

BI-IntegrationZeitreihenprognose

Worum geht's?

Es ist Mitte Oktober. Laura Heß, Leiterin Revenue Management bei einem mittelgroßen Regionalverlag, sitzt vor dem Budgetentwurf für das nächste Jahr.

Auf ihrem Bildschirm: zwei Tabellenblätter und sieben Jahre Bauchgefühl. Die Vorjahreswerte zeigen einen Anzeigenrückgang von 11 Prozent im Print, ein leichtes Plus bei Programmatic im ersten Quartal, dann ein Einbruch im Sommer, ein schwaches Jahresendgeschäft, das die Planung gerettet hat. Aber wie wird es dieses Jahr werden? Laura kennt die Branche gut genug, um zu wissen: Die Vergangenheit ist kein verlässlicher Spiegel mehr.

Sie schickt dem Verlagsgeschäftsführer eine Tabelle mit zwei Szenarien: „optimistisch” und „konservativ”. Die Spanne zwischen den beiden liegt bei 2,3 Millionen Euro. Der Geschäftsführer nickt und bittet sie, „irgendwo in der Mitte” zu planen. Das ist keine Prognose. Das ist Raten mit professionell aussehender Formatierung.

Acht Wochen später, wenn der Januar unerwartet schwächer läuft, muss sie erklären, warum das Budget nicht hält. Sie hat keine Antwort, die besser ist als: „Das war nicht vorherzusehen.”

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Der deutsche Zeitungsmarkt befindet sich in einem strukturellen Umbau, der die Werbeplanung systematisch schwieriger macht: Laut BDZV-Branchenbericht 2024 fielen die Anzeigen- und Beilagenumsätze der deutschen Zeitungsverlage um 10,7 Prozent auf 1,48 Milliarden Euro, während digitale Erlöse um 9 Prozent auf rund 896 Millionen Euro wuchsen. Das klingt nach Stabilisierung durch Digitalisierung, aber die Realität ist komplizierter.

Print-Buchungen gehen mit Monaten Vorlauf ein, sind planbar, aber sinken strukturell weiter. Programmatic-CPMs schwanken wöchentlich mit den Auktionsergebnissen, dem Newsgeschehen und dem Werbedruck der Saison. Direktbuchungen für Sponsored Content hängen an einzelnen Entscheidungen einzelner Kunden, die oft bis zwei Wochen vor Schaltzeitpunkt warten. Diese drei Umsatztypen folgen vollkommen unterschiedlichen Mustern, aber Verlage planen sie oft aus demselben Excel-Modell heraus.

Das Ergebnis: Planungsabweichungen von ±25 Prozent sind branchenüblich und werden als unvermeidlich akzeptiert. Dabei kostet diese Unsicherheit direkt: Wer im Februar nicht weiß, ob der Sommer eher 80 oder 95 Prozent des Vorjahres bringt, kann keine freie Stelle besetzen, kein Technikprojekt angehen, keinen Sonderband drucken, auch wenn sich die richtige Investition hinterher rechnen würde.

Was Predictive Analytics für den Vertrieb leistet, lässt sich auf den Werbemarkt übertragen: Wenn genug historische Daten vorliegen und die richtigen externen Signale eingebunden werden, lässt sich ein Machine Learning-Modell trainieren, das die Abweichung von ±25 auf ±8–12 Prozent reduziert. Das ist keine Wunderformel, aber es ist der Unterschied zwischen Raten und Rechnen.

Welcher Umsatztyp passt, und warum du nicht alle auf einmal modellierst

Der entscheidende Fehler beim Einstieg in die KI-gestützte Werbeprognose ist, alle Umsatzquellen in ein einziges Modell zu werfen. Programmatic, Direktbuchungen und Print-Beilagen folgen völlig unterschiedlichen Dynamiken, ein Modell, das alle drei mischt, lernt nichts Verwertbares.

Programmatic / CPM-Auktionen reagieren auf Nachrichtenlagen, Advertiser-Budgetzyklen und Plattform-Algorithmen. Der CPM schwankt täglich. Für die Prognose zählen: historische CPM-Zeitreihen je Anzeigenposition, Traffic-Volumen nach Kanal (organisch, Social, direkt), saisonale Buchungszyklen der wichtigsten Advertiserkategorien. Dieser Umsatztyp ist am einfachsten zu modellieren, es gibt viele Datenpunkte, klare Zeitreihen, wenig subjektiven Faktor.

Direct Deals / Kampagnenbuchungen hängen an Vertriebspipeline und Kundenkommunikation. Das Modell schaut hier auf Buchungseingang (wie viele Kampagnenreservierungen liegen gerade für die nächsten 90 Tage vor?), Konversionsrate von Angebot zu Buchung, historische Buchungsmuster je Branche. Der Vorlauf ist planbar, aber die Pipeline-Daten müssen im CRM gepflegt werden, wer das nicht tut, kann nichts modellieren.

Print-Beilagen und Sonderveröffentlichungen haben lange Vorlaufzeiten (4–8 Wochen) und klare saisonale Muster. Hier reichen oft einfache saisonale Trendmodelle, kein Machine Learning notwendig, weil die Datenpunkte per Jahreskalender vorstrukturiert sind.

Empfehlung für den Einstieg: Beginne mit Programmatic-Umsätzen. Die Datenlage ist am dichtesten (Tageswerte statt Monatswerte), der Modellbau geht schneller, und die Ergebnisse sind am leichtesten zu validieren. Erst wenn das Programmatic-Modell läuft, lohnt es, Direct-Deals dazuzunehmen.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne KI (Status quo)	Mit ML-Prognose
Prognosegenauigkeit (monatlich)	±20–30 % Abweichung	±8–12 % Abweichung ¹
Aufwand Budgetplanung pro Quartal	3–5 Arbeitstage (Controller + Geschäftsführung)	1–1,5 Tage (Modell läuft, Ergebnisse werden bewertet)
Erkennbarkeit saisonaler Trends	Erfahrungsbasiert, selten dokumentiert	Explizit modelliert und nachvollziehbar
Reaktion auf externe Schocks (Konjunktur)	Keine, wird erst bei Jahresendabrechnung sichtbar	Einmonatiger Vorlauf durch Konjunkturindikatoren als Regressoren
Szenario-Varianten für Budgetplanung	2–3 (optimistisch, konservativ, Mitte)	Statistisch fundierte Konfidenzintervalle

¹ Erzielbarer Richtwert bei sauber gepflegten historischen Buchungsdaten über 3+ Jahre. Eigene Einschätzung basierend auf Zeitreihenforschung zur Online-Werbung (Würfel et al., IEEE Big Data 2021) und Branchendaten.

Einschätzung auf einen Blick

Zeitersparnis, gering (2/5) Das Modell spart 2–3 Arbeitstage pro Monat im Controlling, reale Ersparnis, aber beschränkt auf einen kleinen Personenkreis. Für das Gesamtteam entsteht keine direkte Zeitentlastung. Verglichen mit Anwendungsfällen wie Podcast-Transkription oder Pressemitteilungen, die viele Personen täglich entlasten, bleibt dieser Effekt eng begrenzt. Ehrlich gesagt: Das Hauptargument für diese Investition ist nicht Zeitersparnis, sondern bessere Entscheidungen.

Kosteneinsparung, gering-mittel (2/5) Es gibt keine direkte Kosteneinsparung, der Wert entsteht indirekt über bessere Planungssicherheit. Wer im März weiß, dass der Sommer schwächer wird, kann Personalentscheidungen und Investitionen anpassen, bevor die Liquidität eng wird. Verglichen mit Use Cases, die direkte Prozesskosten senken (Übersetzung, Buchproduktion), ist die Wirkung indirekter und schwerer zu bilanzieren.

Schnelle Umsetzung, niedrig (2/5) Dieses Projekt braucht Realismus: 8–12 Wochen bis zum ersten validen Modell sind machbar, aber nur wenn Buchungshistorie, Traffic-Daten und ein Data Warehouse vorhanden sind. Wer von Null auf strukturierte Daten muss, plant eher 16–20 Wochen. In der gesamten Verlag-Kategorie gehört dieser Use Case zu den technisch anspruchsvolleren Projekten. Es ist kein Klick-und-fertig-Tool, sondern ein Dateninfrastrukturprojekt mit KI-Komponente.

ROI-Sicherheit, mittel (3/5) Das Prognosemodell liefert einen direkt messbaren Qualitätsindikator: den MAPE (Mean Absolute Percentage Error) vor und nach der Einführung. Was sich schwerer messen lässt, ist die Umsatzwirkung, weil der Markt weiter schwankt und du nie weißt, wie eine Entscheidung ohne bessere Prognose ausgegangen wäre. Solide, aber kein schneller ROI-Nachweis.

Skalierbarkeit, mittel (3/5) Das Modell wächst gut mit: Mehr Revenue-Streams, neue Anzeigenformate und längere Historien verbessern es über Zeit. Aber es skaliert nicht in die Breite, es ist ein Unternehmens-internes Werkzeug, kein Produkt. Wer mehrere Standorte oder Verlagsmarken hat, kann das Modell replizieren, aber der Aufwand wächst mit.

Richtwerte, stark abhängig von Datenlage, Verlagsgröße und bestehender BI-Infrastruktur.

Was das Modell konkret macht

Der technische Ansatz heißt Predictive Analytics, genauer: Zeitreihenprognose mit externen Regressoren. Klingt abstrakt, ist im Prinzip folgendes:

Das Modell lernt aus der Vergangenheit, wie sich Werbeeinnahmen entwickeln, nicht nur aus dem bloßen Trend, sondern aus einer Kombination von Faktoren:

Historische Buchungshistorie: Wie verliefen die letzten 36 Monate? Was war saisonal? Was war ein Einmaleffekt?
Traffic-Daten: Programmatic-CPMs hängen direkt am Seitenaufrufvolumen. GAM-Tagesberichte liefern diese Zeitreihe.
Externe Indikatoren: Konjunkturindikatoren (ifo-Index, GfK-Konsumstimmung), Advertiser-Branchenentwicklung, Feiertage und saisonale Buchungszyklen.
Pipeline-Daten für Direktbuchungen: Offene Angebote im CRM als Vorlauffaktor.

Das Modell gibt keine Punktprognose (“im Oktober kommen 480.000 Euro”), es gibt ein Intervall: “Mit 90 % Wahrscheinlichkeit zwischen 420.000 und 540.000 Euro.” Das Intervall ist das Wichtige: Es sagt dir, ob du konservativ oder optimistisch planen solltest, und wie sicher das Modell in dieser Einschätzung ist.

Ein gut konfiguriertes System bemerkt außerdem Ausreißer, bevor du sie bemerkt hättest: Wenn der Buchungseingang in KW 8 deutlich unter dem erwarteten Pfad liegt, meldet das Dashboard eine Abweichung, nicht erst beim Monatsabschluss, sondern innerhalb von Tagen.

Konkrete Werkzeuge, was wann passt

Für den Programmatic-Einstieg: Google Ad Manager als Datenquelle GAM liefert die täglich granularen Impressions-, Revenue- und CPM-Zeitreihen nach Anzeigenposition, Gerät und Kanal, die du für ein belastbares Modell brauchst. Ohne diese strukturierten historischen Daten gibt es kein Modell. Basisversion ist kostenlos bis 200 Millionen Impressions/Monat, für mittlere Verlage ausreichend.

Open-Source-Option: Prophet Metas quelloffene Python-Bibliothek für Zeitreihenprognosen modelliert Saisonalität, Trends und externe Sonderereignisse (Feiertage, Messen, Großereignisse) ohne Deep-Learning-Know-how. Für einen Data-Scientist, der Python kann, ist Prophet der schnellste Weg zum ersten Modell. Vollständig kostenlos, lediglich Infrastrukturkosten für das Hosting (0–200 Euro/Monat). Einschränkung: Developer-Tool, kein Business-User-Interface.

SQL-basierter Ansatz: BigQuery ML Für Teams mit SQL-Know-how, aber ohne dediziertes Data-Science-Team. ARIMA_PLUS und das vortrainierte TimesFM-Modell liefern direkt per SQL-Statement Zeitreihenprognosen auf den GAM-Daten, keine Python-Umgebung nötig. On-Demand-Kosten bei rund 6,25 USD pro TiB gescannter Daten; EU-Hosting verfügbar (Frankfurt). Einschränkung: Google-Cloud-Abhängigkeit.

Visualisierung und Reporting: Microsoft Power BI oder Looker Studio Das Modell allein reicht nicht, die Prognose muss für Geschäftsführung und Verlagsleitung lesbar gemacht werden. Power BI (ab ca. 10 Euro/Nutzer/Monat) ist tief in Microsoft 365 integriert; Looker Studio ist kostenlos und verbindet sich direkt mit BigQuery. Beide eignen sich für monatliche Forecast-Dashboards mit Konfidenzintervallen und tatsächlichem vs. prognostiziertem Verlauf.

Wann welcher Ansatz:

Programmatic-Fokus, Python-Know-how intern → Prophet + eigene Infrastruktur
SQL-basierter Stack, kein Python → BigQuery ML
Kein Data-Science-Team, kleines Budget → Excel mit saisonaler Bereinigung bleibt vorerst besser (kein Tool hilft, wenn die Datenbasis fehlt)

Datenschutz und Datenhaltung

Werbeeinnahmen-Daten sind in der Regel keine personenbezogenen Daten im Sinne der DSGVO, es handelt sich um aggregierte Buchungs- und Traffic-Werte. Damit fällt der Aufwand für Datenschutz-Folgenabschätzungen geringer aus als bei Use Cases, die Kundendaten verarbeiten.

Relevant wird DSGVO, wenn das Modell Pipeline-Daten aus dem CRM einbezieht, dann könnten Kontaktdaten von Werbetreibenden in die Verarbeitung einfließen. In diesem Fall: Vor dem Daten-Export in die ML-Umgebung die Personenbezüge herausfiltern (Kundennummer statt Name und E-Mail reicht für das Modell vollständig aus).

Zur Datenhaltung:

BigQuery ML mit EU-Region (Frankfurt): Daten verlassen den Europäischen Wirtschaftsraum nicht. AVV mit Google Cloud ist Teil der Standard-Vertragsbedingungen.
Google Ad Manager: Daten werden in US-Infrastruktur verarbeitet. Für reine Performance-Daten ohne Personenbezug in der Regel kein Problem, trotzdem sollte der Datenschutzbeauftragte eine Einschätzung geben.
Self-hosted Prophet-Setup: Vollständige Datenkontrolle, Hosting in eigener Infrastruktur oder bei einem deutschen Cloud-Anbieter möglich.

Was es kostet, realistisch gerechnet

Einmalige Einrichtungskosten:

Datenaufbereitung und -bereinigung (3+ Jahre Buchungshistorie bereinigen, in ein auswertbares Format bringen): intern 1–3 Wochen Aufwand; alternativ extern als Datenprojekt: 3.000–8.000 Euro
Modellentwicklung (Prophet oder BigQuery ML, Konfiguration, Validierung): intern mit Data-Scientist 2–4 Wochen; extern 5.000–15.000 Euro je nach Scope
Dashboard-Aufbau (Power BI oder Looker Studio): 3–7 Tage; extern 1.500–4.000 Euro

Laufende Kosten (monatlich):

BigQuery ML mit mittlerem Abfragevolumen: 20–80 Euro/Monat
Power BI: ca. 10 Euro/Nutzer/Monat
Looker Studio: kostenlos (für Publisher mit bereits vorhandenen Google-Accounts)
Prophet auf eigenem Server (Hetzner o.ä.): 0–50 Euro/Monat Infrastruktur

Wie du den Nutzen tatsächlich misst: Vor der Einführung: Berechne für die letzten 12 Monate, wie stark deine tatsächlichen Monats-Werbeeinnahmen von der ursprünglichen Planung abgewichen sind. Das ist dein Baseline-MAPE. Nach 6 Monaten mit ML-Prognose: Gleiche Rechnung. Der MAPE-Delta ist dein einziger ehrlicher Leistungsindikator.

Was sich schwerer quantifizieren lässt: Welche Entscheidungen hättest du bei besserer Prognose anders getroffen? Das ist die eigentliche Wertfrage, und sie lässt sich erst im Rückblick beantworten.

Konservatives Rechenbeispiel: Ein Verlag mit 5 Millionen Euro Jahreswerbeumsatz. Aktuelle Planungsabweichung: ±22 %. Das Modell reduziert sie auf ±10 %. Allein das verhindert ein falsches Quartal, in dem 400.000 Euro zu optimistisch geplant wurden, und in dem deshalb Stellen besetzt oder Ausgaben beschlossen wurden, die sich nicht gerechnet haben. Der Wert liegt nicht im Modell selbst, sondern in den Entscheidungen, die du mit besserem Wissen anders triffst.

Drei typische Einstiegsfehler

1. Alle Umsatztypen in ein Modell packen. Programmatic-CPMs und Direktbuchungen reagieren auf vollkommen verschiedene Faktoren. Ein Modell, das beide mischt, lernt Korrelationen, die keine sind, und macht im nächsten Sommer genau die gleichen Fehler wie deine Excel-Tabelle, nur mit besserem Styling. Beginne mit einem Umsatztyp, validiere ihn gründlich, baue dann den nächsten.

2. Zu wenig historische Daten, zu viel Modellambitionen. Für ein belastbares Saisonalitätsmuster braucht das Modell mindestens 36 Monate Tageswerte (für Programmatic) oder 36 Monatswerte (für Direktbuchungen). Wer mit 12 Monaten Daten startet, erhält Prognosen, die nicht besser sind als ein gleitender Durchschnitt. Wenn die Datenbasis zu dünn ist, warte, oder wechsle zu einfacheren statistischen Modellen, die mit weniger Daten robuster sind.

3. Das Modell wird gebaut, aber niemand pflegt es danach. Das ist der gefährlichste Fehler: still, schleichend, kostspielig. Das Modell wurde auf der Datenwelt von 2022 trainiert. Die Datenwelt 2025 ist anders. Cookie-Deprecation hat die CPM-Strukturen verändert. Der Programmverlagsmix hat sich verschoben. Einzelne Großkunden sind weggefallen oder hinzugekommen. Ein Modell, das nicht mindestens quartalsweise nachtrainiert und validiert wird, beginnt selbstbewusst falsche Prognosen zu liefern, ohne das von alleine zu melden.

Wer verantwortet das Nachtraining? Das muss vor der ersten Einführung feststehen. Wenn die Antwort “irgendwie die IT” ist, wird es nicht passieren.

Was mit der Einführung wirklich passiert, und was nicht

Das Modell verändert keine Werbeeinnahmen. Das ist der wichtigste Satz, den man zu Beginn kommunizieren muss, weil Vertrieb und Geschäftsführung gerne glauben, ein “KI-System” werde die Umsätze automatisch verbessern. Tut es nicht. Es verbessert das Wissen über erwartbare Umsätze, und damit die Qualität von Entscheidungen, die Menschen danach treffen.

Was tatsächlich passiert, wenn das Modell eingeführt wird:

Die Planungsrunden verändern sich. Statt zweier Szenarien mit kommentiertem Bauchgefühl gibt es plötzlich Konfidenzintervalle und Wahrscheinlichkeitsaussagen. Das ist für Geschäftsführungen manchmal irritierend: “Was meint ihr mit 90 % Wahrscheinlichkeit, wir planen entweder mit 420.000 oder mit 540.000, nicht mit ‘irgendwo dazwischen’.” Es braucht zwei bis drei Planungsrunden, bis sich die Kultur daran gewöhnt hat, mit Unsicherheitsbereichen zu arbeiten.

Das Controlling bekommt ein früheres Warnsystem. Wenn der Buchungseingang im März unter dem erwarteten Pfad liegt, meldet das Dashboard eine Abweichung, oft vier bis sechs Wochen bevor der klassische Monatsabschluss eine Unterdeckung sichtbar macht. Das ist wertvoll: Frühe Signale erlauben frühere Gegensteuerung. Aber sie erzeugen auch mehr Gesprächsbedarf, das Team muss lernen, zwischen statistisch-erwarteten Schwankungen und echten Problemsignalen zu unterscheiden.

Der Vertrieb wird nervöser. Wenn das Modell zeigt, dass der Direktbuchungseingang für Quartal 2 hinter dem Trend liegt, entsteht Druck. Das ist grundsätzlich gut, aber nur, wenn der Vertrieb versteht, dass das Modell Wahrscheinlichkeiten schätzt, keine Garantien gibt.

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
Datensichtung und -aufbereitung	Woche 1–3	Buchungshistorie aus GAM und CRM exportieren, bereinigen, in auswertbares Format bringen	Daten sind lückenhafter als erwartet, fehlende Monate, inkonsistente Kategorien, getrennte Systeme
Modellentwicklung und -validierung	Woche 4–8	Zeitreihenmodell trainieren, mit den letzten 12 Monaten backtesten, MAPE messen	Ergebnis schlechter als Erwartung, weil zu wenig Daten oder ein Strukturbruch (z. B. Pandemie-Jahr) die Zeitreihe verzerrt
Dashboard-Aufbau	Woche 7–10	Prognose-Ergebnisse in BI-Tool visualisieren, Konfidenzintervalle abbilden	Dashboard kommuniziert Unsicherheit schlecht, Management liest Mittelpunkt als Garantie
Pilotbetrieb parallel zur manuellen Planung	Woche 10–16	Modell läuft neben der bisherigen Planung, Abweichungen werden dokumentiert	Ergebnisse werden ignoriert, weil niemand sich verantwortlich fühlt, sie auszuwerten
Produktiver Einsatz in der Planung	Ab Woche 16	Modell ersetzt (teilweise) die manuelle Planung; vierteljährliches Nachtraining einplanen	Nachlässigkeit beim Nachtraining, Modell veraltet stillschweigend

Häufige Einwände, und was dahintersteckt

“Der Werbemarkt ist zu unvorhersehbar für KI.” Das ist teilweise richtig, und genau der Punkt. Ein Modell behauptet nicht, Überraschungen zu verhindern. Es unterscheidet zwischen dem, was vorhersagbar ist (Saisonalität, Buchungsvorlauf, Traffic-Muster), und dem, was Schock ist (Konjunktureinbruch, globale Krise). Die Qualität des Modells zeigt sich im normalen Betrieb, in den 11 von 12 Monaten, in denen keine Katastrophe passiert.

Zum COVID-Argument: Als im März 2020 die Werbeausgaben in einer Woche einbrachen, versagte jedes Prognosemodell, egal ob ML oder Excel. Laut IAB-Studie (April 2020) mussten 69 Prozent aller sell-side Unternehmen ihre Jahresprognosen kurzfristig neu aufsetzen. Das war kein Modellversagen, das war eine Situation ohne historisches Vorbild. Ein gutes ML-Modell erkennt aber, wenn Realwerte dauerhaft vom Prognosepfad abweichen, und signalisiert früher als Excel, dass etwas nicht stimmt.

“Wir haben nicht genug Daten.” Das ist das ehrlichste Ausschlusskriterium überhaupt. Wenn ihr weniger als 36 Monate auswertbare Buchungshistorie habt oder Programmatic-Umsatz unter 50.000 Euro/Monat, reichen die Datenpunkte für ein valides ML-Modell nicht aus. In diesem Fall: saisonale Bereinigung mit Excel, nicht ML. Das ist keine Niederlage, es ist realistisch.

“Das können wir uns intern nicht bauen.” Das ist oft falsch, aber manchmal richtig. Prophet mit Python und einer strukturierten GAM-Export-CSV ist ein Wochenendprojekt für jemanden mit Data-Science-Grundkenntnissen. BigQuery ML ist machbar für SQL-affine Controller. Was beides nicht ist: ein Projekt für jemanden ohne jede Datenerfahrung. Wenn intern niemand die Qualifikation hat, ist es besser, das Projekt nach draußen zu geben als es intern mit dem falschen Know-how zu beginnen.

Woran du merkst, dass das zu dir passt

Du solltest mit ML-gestützter Werbeprognose beginnen, wenn:

Dein Programmatic-Umsatz liegt über 50.000 Euro/Monat, damit gibt es genug tägliche Datenpunkte für Zeitreihenmodelle
Du hast mindestens 36 Monate sauber dokumentierte Buchungshistorie, in einer auswertbaren Form (GAM-Reports, strukturiertes CRM), nicht verteilt über sieben Personen-Mailboxen
Dein Controlling-Team hat Python- oder SQL-Kenntnisse, oder du hast Budget für externe Unterstützung
Die Planungsabweichung kostet dich Entscheidungsqualität, du kannst konkret benennen, welche Personalentscheidung oder Investition du wegen schlechter Prognose falsch getroffen hast
Die Geschäftsführung ist bereit, mit Konfidenzintervallen zu planen, statt mit einer einzigen “besten Schätzung”

Wann es sich (noch) nicht lohnt, drei harte Ausschlusskriterien:

Jahreswerbeumsatz unter ca. 2 Millionen Euro. Für einen Jahresumsatz dieser Größe gibt es typischerweise weniger als 200 individuelle Buchungsvorgänge pro Jahr. Das reicht für ein ML-Modell nicht aus, um statistisch belastbare Muster zu lernen. Saisonale Excel-Modelle sind hier ausreichend und ehrlicher. Investiere die Zeit lieber in bessere Datendisziplin und CRM-Nutzung.
Keine strukturierten historischen Buchungsdaten vorhanden. Wenn Buchungen primär per E-Mail vereinbart werden und nirgendwo systematisch erfasst sind, gibt es schlicht keine Zeitreihe zum Modellieren. Hier ist der sinnvollere erste Schritt die Einführung eines CRM und eines strukturierten Buchungsprozesses, das Prognosemodell kommt danach.
Kein Verantwortlicher für das Modell nach der Einführung. Ein ML-Prognosemodell ist kein Gerät, das man einschaltet und dann läuft. Es muss quartalsweise nachtrainiert, validiert und auf Driftmuster geprüft werden. Wenn du keine Person benennen kannst, die das dauerhaft übernimmt, baue kein Modell, du baust sonst etwas, das nach 12 Monaten selbstbewusst falsche Prognosen liefert, ohne das zu melden.

Das kannst du heute noch tun

Beginne mit einer rückwirkenden Prognoseanalyse, keine Tools nötig, kein Budget, kein Projekt. Nimm die letzten 24 Monate Programmatic-Monatsumsätze aus dem GAM-Report und berechne: Was hätte eine einfache Saisonalitätsbereinigung (Vorjahresmonat × aktueller Trendkoeffizient) als Prognose ergeben, verglichen mit dem, was ihr tatsächlich geplant hattet? Das gibt dir einen ersten Eindruck, ob ML überhaupt eine Verbesserung bringen kann oder ob das Rauschen im Markt zu hoch ist.

Für einen strukturierten nächsten Schritt, oder direkt als Basis für ein ChatGPT-gestütztes Analyse-Setup:

Erste Werbeeinnahmen-Analyse ohne ML-Setup

Du bist ein Datenanalyst für [VERLAGSNAME]. Ich gebe dir historische Monatswerte für unsere Programmatic-Werbeeinnahmen (in EUR) und monatliche Seitenaufrufzahlen der letzten 36 Monate. Bitte hilf mir dabei: 1. Erkenne saisonale Muster: In welchen Monaten liegen die Einnahmen systematisch über oder unter dem Jahresdurchschnitt? 2. Identifiziere Ausreißer: Welche Monate weichen mehr als 20 % vom saisonalen Erwartungswert ab? Was könnte der Grund sein? 3. Berechne einen einfachen Trend: Wie viel Prozent hat sich der Jahres-Basiswert im Vergleich zum Vorjahr verändert? 4. Erstelle eine Prognose für die nächsten 6 Monate: Was ergibt sich aus Trend und Saisonalität? Gib einen Mittelwert und eine realistische Bandbreite an (±X %). [MONATSDATEN HIER EINFÜGEN: Format "JJJJ-MM: EUR-Betrag, Seitenaufrufe", eine Zeile pro Monat]

Funktioniert mit ChatGPT, Claude, Gemini

Beispiel-Ausgabe

Mitarbeiter:in

2023-01: 48.200 EUR, 1.240.000 Aufrufe 2023-02: 41.100 EUR, 1.180.000 Aufrufe 2023-03: 52.800 EUR, 1.310.000 Aufrufe [... 33 weitere Monate...]

KI-Assistent

Saisonale Muster: • Deutlich überdurchschnittlich: November (+18%), Dezember (+23%), Oktober (+12%) • Deutlich unterdurchschnittlich: Januar (−15%), Februar (−19%), August (−11%) • Das Muster ist konsistent über alle drei analysierten Jahre. Ausreißer: • April 2024: −31% vom saisonalen Erwartungswert. Mögliche Ursache: Osterverschiebung + kurzfristige Werbeunterbrechung? • Juli 2023: +22% über Erwartung. Eventuell Sonder-Event oder Viral-Traffic? Trend: Der Basiswert ist von 2023 auf 2024 um −4,2% gesunken, von 2024 auf 2025 um −2,8%. Trend flacht leicht ab. Prognose nächste 6 Monate (Saisonalität × Trend): • Jun 2026: 44.500 EUR ±18% • Jul 2026: 38.200 EUR ±21% • Aug 2026: 37.800 EUR ±19% • Sep 2026: 49.100 EUR ±15% • Okt 2026: 54.800 EUR ±13% • Nov 2026: 55.700 EUR ±14% Hinweis: Diese Prognose basiert ausschließlich auf Vergangenheitsdaten ohne externe Regressoren. Bei unerwarteten Marktveränderungen oder Saisonverschiebungen bitte mit aktuellen Buchungseingangsdaten abgleichen.

Quellen & Methodik

BDZV-Branchenbericht 2024: Bundesverband Digitalpublisher und Zeitungsverleger (BDZV), „Zeitungsverlage zwischen Rückgang und Aufbruch”, Umsatzerhebung 2024 (veröffentlicht 2025). Anzeigen- und Beilagenumsätze −10,7 % auf 1,48 Mrd. EUR; Digitalerlöse +9 % auf ca. 896 Mio. EUR. bdzv.de
IAB Coronavirus Ad Revenue Impact (2020): Interactive Advertising Bureau, „Coronavirus: Ad Revenue Impact, Sell-Side” (April 2020). 69 % der sell-side Unternehmen mussten Jahresprognosen neu aufsetzen; 77 % der Direktpublisher berichteten Kampagnenstornierungen; Display-CPMs sanken um mehr als 30 %. iab.com
Würfel et al. (2021): Maximilian Würfel, Jie Han et al., „Online Advertising Revenue Forecasting: An Interpretable Deep Learning Approach”, IEEE International Conference on Big Data 2021. Validiert Temporal Fusion Transformer-Ansatz für Publisher-Umsatzprognosen auf Basis historischer AdSense-Zeitreihen. arxiv.org/abs/2111.08840
Forecast Pro Pricing: Business Forecast Systems, Preisliste Stand 2025. Einstieg ab 1.495 USD/Jahr (Forecast Pro 100), Flagship TRAC ab 9.995 USD/Jahr. forecastpro.com/pricing/price-list/
Mindestdatenbasis für ML: Einschätzung basierend auf ML-Grundlagen (1.000+ Datenpunkte für XGBoost/Prophet) und Praxiserfahrungen mit Publisher-Datensätzen. Verlage unter 2 Mio. EUR Jahreswerbeumsatz haben typischerweise zu wenige monatliche Buchungspunkte für robuste Zeitreihenmodelle.
Prophet (Open Source): Meta AI, Python-Bibliothek für Zeitreihenprognosen mit Saisonalitätsmodellierung, MIT-Lizenz. facebook.github.io/prophet/

Du willst wissen, ob deine Datenlage für ein belastbares Prognosemodell ausreicht, und welche Umsatztypen sinnvoll zu trennen sind? Meld dich, das klären wir in einem kurzen Gespräch, bevor du Zeit in ein Projekt investierst, das an der Datenbasis scheitert.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Verlag & Medienproduktion vergleichen

Weitere Use Cases

Manuskript-Lektorat-Unterstützung per KI

KI-Assistent unterstützt Lektoren bei Erstprüfung von Manuskripten auf Stilinkonsistenzen, Fehler und Strukturprobleme.

Mehr erfahren

SEO-Optimierung für Online-Artikel per KI

KI analysiert veröffentlichte Artikel auf SEO-Potenzial und erstellt umsetzbare Optimierungsempfehlungen automatisch.

Mehr erfahren

Rechercheassistent für die Redaktion

KI-Rechercheassistent durchsucht Quellen, fasst Fakten zusammen und erstellt Recherchememorandas für Journalisten.

Mehr erfahren

Zurück zu Verlag & Medienproduktion

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

Werbeeinnahmen-Prognose per KI

Das echte Ausmaß des Problems

Welcher Umsatztyp passt, und warum du nicht alle auf einmal modellierst

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was das Modell konkret macht

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Drei typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Manuskript-Lektorat-Unterstützung per KI

SEO-Optimierung für Online-Artikel per KI

Rechercheassistent für die Redaktion

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI