Werbeeinnahmen-Prognose per KI
ML-Modelle kombinieren Buchungshistorie, Traffic-Daten und Saisonalität zu monatlichen Prognosen — und ersetzen das Raten durch Rechnen.
- Problem
- Werbeeinnahmen-Prognosen basieren auf historischen Durchschnittswerten und Bauchgefühl. Volatile Buchungseingänge, Print-Rückgang und Programmatic-Schwankungen machen die Budgetplanung zur Zitterpartie.
- KI-Lösung
- Ein ARIMA/Prophet-Zeitreihenmodell mit externen Regressoren kombiniert historische Buchungshistorie, Traffic-Daten, Saisonalität und externe Faktoren zu validierbaren monatlichen Vorausschauen — getrennt nach Umsatztyp.
- Typischer Nutzen
- Prognosegenauigkeit von ±20–30 % auf ±8–12 % verbessert, Planungssicherheit für Personaleinsatz und Ausgaben erhöht, Überraschungen in der Quartalsplanung reduziert.
- Setup-Zeit
- 8–12 Wochen bis zum ersten validen Modell
- Kosteneinschätzung
- 8–12 Wochen Einrichtung (Datenaufbereitung + Modellbau + Dashboard): 8.000–27.000 € einmalig; laufend 50–150 €/Monat (Infrastruktur + BI-Tools)
Es ist Mitte Oktober. Laura Heß, Leiterin Revenue Management bei einem mittelgroßen Regionalverlag, sitzt vor dem Budgetentwurf für das nächste Jahr.
Auf ihrem Bildschirm: zwei Tabellenblätter und sieben Jahre Bauchgefühl. Die Vorjahreswerte zeigen einen Anzeigenrückgang von 11 Prozent im Print, ein leichtes Plus bei Programmatic im ersten Quartal, dann ein Einbruch im Sommer, ein schwaches Jahresendgeschäft, das die Planung gerettet hat. Aber wie wird es dieses Jahr werden? Laura kennt die Branche gut genug, um zu wissen: Die Vergangenheit ist kein verlässlicher Spiegel mehr.
Sie schickt dem Verlagsgeschäftsführer eine Tabelle mit zwei Szenarien: „optimistisch” und „konservativ”. Die Spanne zwischen den beiden liegt bei 2,3 Millionen Euro. Der Geschäftsführer nickt und bittet sie, „irgendwo in der Mitte” zu planen. Das ist keine Prognose. Das ist Raten mit professionell aussehender Formatierung.
Acht Wochen später, wenn der Januar unerwartet schwächer läuft, muss sie erklären, warum das Budget nicht hält. Sie hat keine Antwort, die besser ist als: „Das war nicht vorherzusehen.”
Das echte Ausmaß des Problems
Der deutsche Zeitungsmarkt befindet sich in einem strukturellen Umbau, der die Werbeplanung systematisch schwieriger macht: Laut BDZV-Branchenbericht 2024 fielen die Anzeigen- und Beilagenumsätze der deutschen Zeitungsverlage um 10,7 Prozent auf 1,48 Milliarden Euro — während digitale Erlöse um 9 Prozent auf rund 896 Millionen Euro wuchsen. Das klingt nach Stabilisierung durch Digitalisierung, aber die Realität ist komplizierter.
Print-Buchungen gehen mit Monaten Vorlauf ein, sind planbar — aber sinken strukturell weiter. Programmatic-CPMs schwanken wöchentlich mit den Auktionsergebnissen, dem Newsgeschehen und dem Werbedruck der Saison. Direktbuchungen für Sponsored Content hängen an einzelnen Entscheidungen einzelner Kunden, die oft bis zwei Wochen vor Schaltzeitpunkt warten. Diese drei Umsatztypen folgen vollkommen unterschiedlichen Mustern — aber Verlage planen sie oft aus demselben Excel-Modell heraus.
Das Ergebnis: Planungsabweichungen von ±25 Prozent sind branchenüblich und werden als unvermeidlich akzeptiert. Dabei kostet diese Unsicherheit direkt: Wer im Februar nicht weiß, ob der Sommer eher 80 oder 95 Prozent des Vorjahres bringt, kann keine freie Stelle besetzen, kein Technikprojekt angehen, keinen Sonderband drucken — auch wenn sich die richtige Investition hinterher rechnen würde.
Was Predictive Analytics für den Vertrieb leistet, lässt sich auf den Werbemarkt übertragen: Wenn genug historische Daten vorliegen und die richtigen externen Signale eingebunden werden, lässt sich ein Machine Learning-Modell trainieren, das die Abweichung von ±25 auf ±8–12 Prozent reduziert. Das ist keine Wunderformel, aber es ist der Unterschied zwischen Raten und Rechnen.
Welcher Umsatztyp passt — und warum du nicht alle auf einmal modellierst
Der entscheidende Fehler beim Einstieg in die KI-gestützte Werbeprognose ist, alle Umsatzquellen in ein einziges Modell zu werfen. Programmatic, Direktbuchungen und Print-Beilagen folgen völlig unterschiedlichen Dynamiken — ein Modell, das alle drei mischt, lernt nichts Verwertbares.
Programmatic / CPM-Auktionen reagieren auf Nachrichtenlagen, Advertiser-Budgetzyklen und Plattform-Algorithmen. Der CPM schwankt täglich. Für die Prognose zählen: historische CPM-Zeitreihen je Anzeigenposition, Traffic-Volumen nach Kanal (organisch, Social, direkt), saisonale Buchungszyklen der wichtigsten Advertiserkategorien. Dieser Umsatztyp ist am einfachsten zu modellieren — es gibt viele Datenpunkte, klare Zeitreihen, wenig subjektiven Faktor.
Direct Deals / Kampagnenbuchungen hängen an Vertriebspipeline und Kundenkommunikation. Das Modell schaut hier auf Buchungseingang (wie viele Kampagnenreservierungen liegen gerade für die nächsten 90 Tage vor?), Konversionsrate von Angebot zu Buchung, historische Buchungsmuster je Branche. Der Vorlauf ist planbar, aber die Pipeline-Daten müssen im CRM gepflegt werden — wer das nicht tut, kann nichts modellieren.
Print-Beilagen und Sonderveröffentlichungen haben lange Vorlaufzeiten (4–8 Wochen) und klare saisonale Muster. Hier reichen oft einfache saisonale Trendmodelle — kein Machine Learning notwendig, weil die Datenpunkte per Jahreskalender vorstrukturiert sind.
Empfehlung für den Einstieg: Beginne mit Programmatic-Umsätzen. Die Datenlage ist am dichtesten (Tageswerte statt Monatswerte), der Modellbau geht schneller, und die Ergebnisse sind am leichtesten zu validieren. Erst wenn das Programmatic-Modell läuft, lohnt es, Direct-Deals dazuzunehmen.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI (Status quo) | Mit ML-Prognose |
|---|---|---|
| Prognosegenauigkeit (monatlich) | ±20–30 % Abweichung | ±8–12 % Abweichung ¹ |
| Aufwand Budgetplanung pro Quartal | 3–5 Arbeitstage (Controller + Geschäftsführung) | 1–1,5 Tage (Modell läuft, Ergebnisse werden bewertet) |
| Erkennbarkeit saisonaler Trends | Erfahrungsbasiert, selten dokumentiert | Explizit modelliert und nachvollziehbar |
| Reaktion auf externe Schocks (Konjunktur) | Keine — wird erst bei Jahresendabrechnung sichtbar | Einmonatiger Vorlauf durch Konjunkturindikatoren als Regressoren |
| Szenario-Varianten für Budgetplanung | 2–3 (optimistisch, konservativ, Mitte) | Statistisch fundierte Konfidenzintervalle |
¹ Erzielbarer Richtwert bei sauber gepflegten historischen Buchungsdaten über 3+ Jahre. Eigene Einschätzung basierend auf Zeitreihenforschung zur Online-Werbung (Würfel et al., IEEE Big Data 2021) und Branchendaten.
Einschätzung auf einen Blick
Zeitersparnis — gering (2/5) Das Modell spart 2–3 Arbeitstage pro Monat im Controlling — reale Ersparnis, aber beschränkt auf einen kleinen Personenkreis. Für das Gesamtteam entsteht keine direkte Zeitentlastung. Verglichen mit Anwendungsfällen wie Podcast-Transkription oder Pressemitteilungen, die viele Personen täglich entlasten, bleibt dieser Effekt eng begrenzt. Ehrlich gesagt: Das Hauptargument für diese Investition ist nicht Zeitersparnis, sondern bessere Entscheidungen.
Kosteneinsparung — gering-mittel (2/5) Es gibt keine direkte Kosteneinsparung — der Wert entsteht indirekt über bessere Planungssicherheit. Wer im März weiß, dass der Sommer schwächer wird, kann Personalentscheidungen und Investitionen anpassen, bevor die Liquidität eng wird. Verglichen mit Use Cases, die direkte Prozesskosten senken (Übersetzung, Buchproduktion), ist die Wirkung indirekter und schwerer zu bilanzieren.
Schnelle Umsetzung — niedrig (2/5) Dieses Projekt braucht Realismus: 8–12 Wochen bis zum ersten validen Modell sind machbar — aber nur wenn Buchungshistorie, Traffic-Daten und ein Data Warehouse vorhanden sind. Wer von Null auf strukturierte Daten muss, plant eher 16–20 Wochen. In der gesamten Verlag-Kategorie gehört dieser Use Case zu den technisch anspruchsvolleren Projekten. Es ist kein Klick-und-fertig-Tool, sondern ein Dateninfrastrukturprojekt mit KI-Komponente.
ROI-Sicherheit — mittel (3/5) Das Prognosemodell liefert einen direkt messbaren Qualitätsindikator: den MAPE (Mean Absolute Percentage Error) vor und nach der Einführung. Was sich schwerer messen lässt, ist die Umsatzwirkung — weil der Markt weiter schwankt und du nie weißt, wie eine Entscheidung ohne bessere Prognose ausgegangen wäre. Solide, aber kein schneller ROI-Nachweis.
Skalierbarkeit — mittel (3/5) Das Modell wächst gut mit: Mehr Revenue-Streams, neue Anzeigenformate und längere Historien verbessern es über Zeit. Aber es skaliert nicht in die Breite — es ist ein Unternehmens-internes Werkzeug, kein Produkt. Wer mehrere Standorte oder Verlagsmarken hat, kann das Modell replizieren, aber der Aufwand wächst mit.
Richtwerte — stark abhängig von Datenlage, Verlagsgröße und bestehender BI-Infrastruktur.
Was das Modell konkret macht
Der technische Ansatz heißt Predictive Analytics — genauer: Zeitreihenprognose mit externen Regressoren. Klingt abstrakt, ist im Prinzip folgendes:
Das Modell lernt aus der Vergangenheit, wie sich Werbeeinnahmen entwickeln — nicht nur aus dem bloßen Trend, sondern aus einer Kombination von Faktoren:
- Historische Buchungshistorie: Wie verliefen die letzten 36 Monate? Was war saisonal? Was war ein Einmaleffekt?
- Traffic-Daten: Programmatic-CPMs hängen direkt am Seitenaufrufvolumen. GAM-Tagesberichte liefern diese Zeitreihe.
- Externe Indikatoren: Konjunkturindikatoren (ifo-Index, GfK-Konsumstimmung), Advertiser-Branchenentwicklung, Feiertage und saisonale Buchungszyklen.
- Pipeline-Daten für Direktbuchungen: Offene Angebote im CRM als Vorlauffaktor.
Das Modell gibt keine Punktprognose (“im Oktober kommen 480.000 Euro”) — es gibt ein Intervall: “Mit 90 % Wahrscheinlichkeit zwischen 420.000 und 540.000 Euro.” Das Intervall ist das Wichtige: Es sagt dir, ob du konservativ oder optimistisch planen solltest, und wie sicher das Modell in dieser Einschätzung ist.
Ein gut konfiguriertes System bemerkt außerdem Ausreißer, bevor du sie bemerkt hättest: Wenn der Buchungseingang in KW 8 deutlich unter dem erwarteten Pfad liegt, meldet das Dashboard eine Abweichung — nicht erst beim Monatsabschluss, sondern innerhalb von Tagen.
Konkrete Werkzeuge — was wann passt
Für den Programmatic-Einstieg: Google Ad Manager als Datenquelle GAM liefert die täglich granularen Impressions-, Revenue- und CPM-Zeitreihen nach Anzeigenposition, Gerät und Kanal, die du für ein belastbares Modell brauchst. Ohne diese strukturierten historischen Daten gibt es kein Modell. Basisversion ist kostenlos bis 200 Millionen Impressions/Monat — für mittlere Verlage ausreichend.
Open-Source-Option: Prophet Metas quelloffene Python-Bibliothek für Zeitreihenprognosen modelliert Saisonalität, Trends und externe Sonderereignisse (Feiertage, Messen, Großereignisse) ohne Deep-Learning-Know-how. Für einen Data-Scientist, der Python kann, ist Prophet der schnellste Weg zum ersten Modell. Vollständig kostenlos — lediglich Infrastrukturkosten für das Hosting (0–200 Euro/Monat). Einschränkung: Developer-Tool, kein Business-User-Interface.
SQL-basierter Ansatz: BigQuery ML Für Teams mit SQL-Know-how, aber ohne dediziertes Data-Science-Team. ARIMA_PLUS und das vortrainierte TimesFM-Modell liefern direkt per SQL-Statement Zeitreihenprognosen auf den GAM-Daten — keine Python-Umgebung nötig. On-Demand-Kosten bei rund 6,25 USD pro TiB gescannter Daten; EU-Hosting verfügbar (Frankfurt). Einschränkung: Google-Cloud-Abhängigkeit.
Visualisierung und Reporting: Microsoft Power BI oder Looker Studio Das Modell allein reicht nicht — die Prognose muss für Geschäftsführung und Verlagsleitung lesbar gemacht werden. Power BI (ab ca. 10 Euro/Nutzer/Monat) ist tief in Microsoft 365 integriert; Looker Studio ist kostenlos und verbindet sich direkt mit BigQuery. Beide eignen sich für monatliche Forecast-Dashboards mit Konfidenzintervallen und tatsächlichem vs. prognostiziertem Verlauf.
Wann welcher Ansatz:
- Programmatic-Fokus, Python-Know-how intern → Prophet + eigene Infrastruktur
- SQL-basierter Stack, kein Python → BigQuery ML
- Kein Data-Science-Team, kleines Budget → Excel mit saisonaler Bereinigung bleibt vorerst besser (kein Tool hilft, wenn die Datenbasis fehlt)
Datenschutz und Datenhaltung
Werbeeinnahmen-Daten sind in der Regel keine personenbezogenen Daten im Sinne der DSGVO — es handelt sich um aggregierte Buchungs- und Traffic-Werte. Damit fällt der Aufwand für Datenschutz-Folgenabschätzungen geringer aus als bei Use Cases, die Kundendaten verarbeiten.
Relevant wird DSGVO, wenn das Modell Pipeline-Daten aus dem CRM einbezieht — dann könnten Kontaktdaten von Werbetreibenden in die Verarbeitung einfließen. In diesem Fall: Vor dem Daten-Export in die ML-Umgebung die Personenbezüge herausfiltern (Kundennummer statt Name und E-Mail reicht für das Modell vollständig aus).
Zur Datenhaltung:
- BigQuery ML mit EU-Region (Frankfurt): Daten verlassen den Europäischen Wirtschaftsraum nicht. AVV mit Google Cloud ist Teil der Standard-Vertragsbedingungen.
- Google Ad Manager: Daten werden in US-Infrastruktur verarbeitet. Für reine Performance-Daten ohne Personenbezug in der Regel kein Problem — trotzdem sollte der Datenschutzbeauftragte eine Einschätzung geben.
- Self-hosted Prophet-Setup: Vollständige Datenkontrolle, Hosting in eigener Infrastruktur oder bei einem deutschen Cloud-Anbieter möglich.
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten:
- Datenaufbereitung und -bereinigung (3+ Jahre Buchungshistorie bereinigen, in ein auswertbares Format bringen): intern 1–3 Wochen Aufwand; alternativ extern als Datenprojekt: 3.000–8.000 Euro
- Modellentwicklung (Prophet oder BigQuery ML, Konfiguration, Validierung): intern mit Data-Scientist 2–4 Wochen; extern 5.000–15.000 Euro je nach Scope
- Dashboard-Aufbau (Power BI oder Looker Studio): 3–7 Tage; extern 1.500–4.000 Euro
Laufende Kosten (monatlich):
- BigQuery ML mit mittlerem Abfragevolumen: 20–80 Euro/Monat
- Power BI: ca. 10 Euro/Nutzer/Monat
- Looker Studio: kostenlos (für Publisher mit bereits vorhandenen Google-Accounts)
- Prophet auf eigenem Server (Hetzner o.ä.): 0–50 Euro/Monat Infrastruktur
Wie du den Nutzen tatsächlich misst: Vor der Einführung: Berechne für die letzten 12 Monate, wie stark deine tatsächlichen Monats-Werbeeinnahmen von der ursprünglichen Planung abgewichen sind. Das ist dein Baseline-MAPE. Nach 6 Monaten mit ML-Prognose: Gleiche Rechnung. Der MAPE-Delta ist dein einziger ehrlicher Leistungsindikator.
Was sich schwerer quantifizieren lässt: Welche Entscheidungen hättest du bei besserer Prognose anders getroffen? Das ist die eigentliche Wertfrage — und sie lässt sich erst im Rückblick beantworten.
Konservatives Rechenbeispiel: Ein Verlag mit 5 Millionen Euro Jahreswerbeumsatz. Aktuelle Planungsabweichung: ±22 %. Das Modell reduziert sie auf ±10 %. Allein das verhindert ein falsches Quartal, in dem 400.000 Euro zu optimistisch geplant wurden — und in dem deshalb Stellen besetzt oder Ausgaben beschlossen wurden, die sich nicht gerechnet haben. Der Wert liegt nicht im Modell selbst, sondern in den Entscheidungen, die du mit besserem Wissen anders triffst.
Drei typische Einstiegsfehler
1. Alle Umsatztypen in ein Modell packen. Programmatic-CPMs und Direktbuchungen reagieren auf vollkommen verschiedene Faktoren. Ein Modell, das beide mischt, lernt Korrelationen, die keine sind — und macht im nächsten Sommer genau die gleichen Fehler wie deine Excel-Tabelle, nur mit besserem Styling. Beginne mit einem Umsatztyp, validiere ihn gründlich, baue dann den nächsten.
2. Zu wenig historische Daten, zu viel Modellambitionen. Für ein belastbares Saisonalitätsmuster braucht das Modell mindestens 36 Monate Tageswerte (für Programmatic) oder 36 Monatswerte (für Direktbuchungen). Wer mit 12 Monaten Daten startet, erhält Prognosen, die nicht besser sind als ein gleitender Durchschnitt. Wenn die Datenbasis zu dünn ist, warte — oder wechsle zu einfacheren statistischen Modellen, die mit weniger Daten robuster sind.
3. Das Modell wird gebaut — aber niemand pflegt es danach. Das ist der gefährlichste Fehler: still, schleichend, kostspielig. Das Modell wurde auf der Datenwelt von 2022 trainiert. Die Datenwelt 2025 ist anders. Cookie-Deprecation hat die CPM-Strukturen verändert. Der Programmverlagsmix hat sich verschoben. Einzelne Großkunden sind weggefallen oder hinzugekommen. Ein Modell, das nicht mindestens quartalsweise nachtrainiert und validiert wird, beginnt selbstbewusst falsche Prognosen zu liefern — ohne das von alleine zu melden.
Wer verantwortet das Nachtraining? Das muss vor der ersten Einführung feststehen. Wenn die Antwort “irgendwie die IT” ist, wird es nicht passieren.
Was mit der Einführung wirklich passiert — und was nicht
Das Modell verändert keine Werbeeinnahmen. Das ist der wichtigste Satz, den man zu Beginn kommunizieren muss — weil Vertrieb und Geschäftsführung gerne glauben, ein “KI-System” werde die Umsätze automatisch verbessern. Tut es nicht. Es verbessert das Wissen über erwartbare Umsätze — und damit die Qualität von Entscheidungen, die Menschen danach treffen.
Was tatsächlich passiert, wenn das Modell eingeführt wird:
Die Planungsrunden verändern sich. Statt zweier Szenarien mit kommentiertem Bauchgefühl gibt es plötzlich Konfidenzintervalle und Wahrscheinlichkeitsaussagen. Das ist für Geschäftsführungen manchmal irritierend: “Was meint ihr mit 90 % Wahrscheinlichkeit — wir planen entweder mit 420.000 oder mit 540.000, nicht mit ‘irgendwo dazwischen’.” Es braucht zwei bis drei Planungsrunden, bis sich die Kultur daran gewöhnt hat, mit Unsicherheitsbereichen zu arbeiten.
Das Controlling bekommt ein früheres Warnsystem. Wenn der Buchungseingang im März unter dem erwarteten Pfad liegt, meldet das Dashboard eine Abweichung — oft vier bis sechs Wochen bevor der klassische Monatsabschluss eine Unterdeckung sichtbar macht. Das ist wertvoll: Frühe Signale erlauben frühere Gegensteuerung. Aber sie erzeugen auch mehr Gesprächsbedarf — das Team muss lernen, zwischen statistisch-erwarteten Schwankungen und echten Problemsignalen zu unterscheiden.
Der Vertrieb wird nervöser. Wenn das Modell zeigt, dass der Direktbuchungseingang für Quartal 2 hinter dem Trend liegt, entsteht Druck. Das ist grundsätzlich gut — aber nur, wenn der Vertrieb versteht, dass das Modell Wahrscheinlichkeiten schätzt, keine Garantien gibt.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datensichtung und -aufbereitung | Woche 1–3 | Buchungshistorie aus GAM und CRM exportieren, bereinigen, in auswertbares Format bringen | Daten sind lückenhafter als erwartet — fehlende Monate, inkonsistente Kategorien, getrennte Systeme |
| Modellentwicklung und -validierung | Woche 4–8 | Zeitreihenmodell trainieren, mit den letzten 12 Monaten backtesten, MAPE messen | Ergebnis schlechter als Erwartung — weil zu wenig Daten oder ein Strukturbruch (z. B. Pandemie-Jahr) die Zeitreihe verzerrt |
| Dashboard-Aufbau | Woche 7–10 | Prognose-Ergebnisse in BI-Tool visualisieren, Konfidenzintervalle abbilden | Dashboard kommuniziert Unsicherheit schlecht — Management liest Mittelpunkt als Garantie |
| Pilotbetrieb parallel zur manuellen Planung | Woche 10–16 | Modell läuft neben der bisherigen Planung, Abweichungen werden dokumentiert | Ergebnisse werden ignoriert, weil niemand sich verantwortlich fühlt, sie auszuwerten |
| Produktiver Einsatz in der Planung | Ab Woche 16 | Modell ersetzt (teilweise) die manuelle Planung; vierteljährliches Nachtraining einplanen | Nachlässigkeit beim Nachtraining — Modell veraltet stillschweigend |
Häufige Einwände — und was dahintersteckt
“Der Werbemarkt ist zu unvorhersehbar für KI.” Das ist teilweise richtig — und genau der Punkt. Ein Modell behauptet nicht, Überraschungen zu verhindern. Es unterscheidet zwischen dem, was vorhersagbar ist (Saisonalität, Buchungsvorlauf, Traffic-Muster), und dem, was Schock ist (Konjunktureinbruch, globale Krise). Die Qualität des Modells zeigt sich im normalen Betrieb — in den 11 von 12 Monaten, in denen keine Katastrophe passiert.
Zum COVID-Argument: Als im März 2020 die Werbeausgaben in einer Woche einbrachen, versagte jedes Prognosemodell — egal ob ML oder Excel. Laut IAB-Studie (April 2020) mussten 69 Prozent aller sell-side Unternehmen ihre Jahresprognosen kurzfristig neu aufsetzen. Das war kein Modellversagen, das war eine Situation ohne historisches Vorbild. Ein gutes ML-Modell erkennt aber, wenn Realwerte dauerhaft vom Prognosepfad abweichen — und signalisiert früher als Excel, dass etwas nicht stimmt.
“Wir haben nicht genug Daten.” Das ist das ehrlichste Ausschlusskriterium überhaupt. Wenn ihr weniger als 36 Monate auswertbare Buchungshistorie habt oder Programmatic-Umsatz unter 50.000 Euro/Monat, reichen die Datenpunkte für ein valides ML-Modell nicht aus. In diesem Fall: saisonale Bereinigung mit Excel, nicht ML. Das ist keine Niederlage — es ist realistisch.
“Das können wir uns intern nicht bauen.” Das ist oft falsch — aber manchmal richtig. Prophet mit Python und einer strukturierten GAM-Export-CSV ist ein Wochenendprojekt für jemanden mit Data-Science-Grundkenntnissen. BigQuery ML ist machbar für SQL-affine Controller. Was beides nicht ist: ein Projekt für jemanden ohne jede Datenerfahrung. Wenn intern niemand die Qualifikation hat, ist es besser, das Projekt nach draußen zu geben als es intern mit dem falschen Know-how zu beginnen.
Woran du merkst, dass das zu dir passt
Du solltest mit ML-gestützter Werbeprognose beginnen, wenn:
- Dein Programmatic-Umsatz liegt über 50.000 Euro/Monat — damit gibt es genug tägliche Datenpunkte für Zeitreihenmodelle
- Du hast mindestens 36 Monate sauber dokumentierte Buchungshistorie — in einer auswertbaren Form (GAM-Reports, strukturiertes CRM), nicht verteilt über sieben Personen-Mailboxen
- Dein Controlling-Team hat Python- oder SQL-Kenntnisse — oder du hast Budget für externe Unterstützung
- Die Planungsabweichung kostet dich Entscheidungsqualität — du kannst konkret benennen, welche Personalentscheidung oder Investition du wegen schlechter Prognose falsch getroffen hast
- Die Geschäftsführung ist bereit, mit Konfidenzintervallen zu planen — statt mit einer einzigen “besten Schätzung”
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Jahreswerbeumsatz unter ca. 2 Millionen Euro. Für einen Jahresumsatz dieser Größe gibt es typischerweise weniger als 200 individuelle Buchungsvorgänge pro Jahr. Das reicht für ein ML-Modell nicht aus, um statistisch belastbare Muster zu lernen. Saisonale Excel-Modelle sind hier ausreichend und ehrlicher. Investiere die Zeit lieber in bessere Datendisziplin und CRM-Nutzung.
-
Keine strukturierten historischen Buchungsdaten vorhanden. Wenn Buchungen primär per E-Mail vereinbart werden und nirgendwo systematisch erfasst sind, gibt es schlicht keine Zeitreihe zum Modellieren. Hier ist der sinnvollere erste Schritt die Einführung eines CRM und eines strukturierten Buchungsprozesses — das Prognosemodell kommt danach.
-
Kein Verantwortlicher für das Modell nach der Einführung. Ein ML-Prognosemodell ist kein Gerät, das man einschaltet und dann läuft. Es muss quartalsweise nachtrainiert, validiert und auf Driftmuster geprüft werden. Wenn du keine Person benennen kannst, die das dauerhaft übernimmt, baue kein Modell — du baust sonst etwas, das nach 12 Monaten selbstbewusst falsche Prognosen liefert, ohne das zu melden.
Das kannst du heute noch tun
Beginne mit einer rückwirkenden Prognoseanalyse — keine Tools nötig, kein Budget, kein Projekt. Nimm die letzten 24 Monate Programmatic-Monatsumsätze aus dem GAM-Report und berechne: Was hätte eine einfache Saisonalitätsbereinigung (Vorjahresmonat × aktueller Trendkoeffizient) als Prognose ergeben — verglichen mit dem, was ihr tatsächlich geplant hattet? Das gibt dir einen ersten Eindruck, ob ML überhaupt eine Verbesserung bringen kann oder ob das Rauschen im Markt zu hoch ist.
Für einen strukturierten nächsten Schritt — oder direkt als Basis für ein ChatGPT-gestütztes Analyse-Setup:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- BDZV-Branchenbericht 2024: Bundesverband Digitalpublisher und Zeitungsverleger (BDZV), „Zeitungsverlage zwischen Rückgang und Aufbruch”, Umsatzerhebung 2024 (veröffentlicht 2025). Anzeigen- und Beilagenumsätze −10,7 % auf 1,48 Mrd. EUR; Digitalerlöse +9 % auf ca. 896 Mio. EUR. bdzv.de
- IAB Coronavirus Ad Revenue Impact (2020): Interactive Advertising Bureau, „Coronavirus: Ad Revenue Impact — Sell-Side” (April 2020). 69 % der sell-side Unternehmen mussten Jahresprognosen neu aufsetzen; 77 % der Direktpublisher berichteten Kampagnenstornierungen; Display-CPMs sanken um mehr als 30 %. iab.com
- Würfel et al. (2021): Maximilian Würfel, Jie Han et al., „Online Advertising Revenue Forecasting: An Interpretable Deep Learning Approach”, IEEE International Conference on Big Data 2021. Validiert Temporal Fusion Transformer-Ansatz für Publisher-Umsatzprognosen auf Basis historischer AdSense-Zeitreihen. arxiv.org/abs/2111.08840
- Forecast Pro Pricing: Business Forecast Systems, Preisliste Stand 2025. Einstieg ab 1.495 USD/Jahr (Forecast Pro 100), Flagship TRAC ab 9.995 USD/Jahr. forecastpro.com/pricing/price-list/
- Mindestdatenbasis für ML: Einschätzung basierend auf ML-Grundlagen (1.000+ Datenpunkte für XGBoost/Prophet) und Praxiserfahrungen mit Publisher-Datensätzen. Verlage unter 2 Mio. EUR Jahreswerbeumsatz haben typischerweise zu wenige monatliche Buchungspunkte für robuste Zeitreihenmodelle.
- Prophet (Open Source): Meta AI, Python-Bibliothek für Zeitreihenprognosen mit Saisonalitätsmodellierung, MIT-Lizenz. facebook.github.io/prophet/
Du willst wissen, ob deine Datenlage für ein belastbares Prognosemodell ausreicht — und welche Umsatztypen sinnvoll zu trennen sind? Meld dich — das klären wir in einem kurzen Gespräch, bevor du Zeit in ein Projekt investierst, das an der Datenbasis scheitert.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Manuskript-Lektorat-Unterstützung per KI
KI-Assistent unterstützt Lektoren bei Erstprüfung von Manuskripten auf Stilinkonsistenzen, Fehler und Strukturprobleme.
Mehr erfahrenSEO-Optimierung für Online-Artikel per KI
KI analysiert veröffentlichte Artikel auf SEO-Potenzial und erstellt umsetzbare Optimierungsempfehlungen automatisch.
Mehr erfahrenRechercheassistent für die Redaktion
KI-Rechercheassistent durchsucht Quellen, fasst Fakten zusammen und erstellt Recherchememorandas für Journalisten.
Mehr erfahren