KI-gestützte Kundenwechsel-Prognose und Retention im Gasvertrieb
KI analysiert Verbrauchs-, Vertrags- und Kommunikationsdaten von Haushaltskunden und identifiziert wechselgefährdete Kunden frühzeitig — für gezielte Retentionsangebote vor der Kündigung.
- Problem
- Stadtwerke verlieren Haushaltskunden an Billiganbieter, erkennen Wechselabsichten aber erst nach der Kündigung. Dann ist Retention teuer oder unmöglich.
- KI-Lösung
- Gradient-Boosting-Modell (XGBoost/LightGBM) berechnet täglich einen Wechselwahrscheinlichkeitsscore je Haushaltskunde auf Basis von Zahlungsverhalten, Vertragsalter, Preisentwicklung und Interaktionshistorie — und löst automatisch gezielte Retentionskampagnen aus.
- Typischer Nutzen
- Wechselquote um 15–25 % senken, Retentionskosten pro gehaltenem Kunden um 30–50 % reduzieren, proaktive Kundenbetreuung statt reaktives Rückgewinnungsmarketing.
- Setup-Zeit
- 6–10 Wochen bis erstes Modell — CRM-Datenqualität entscheidend
- Kosteneinschätzung
- Einrichtung 15.000–80.000 € je Ansatz; laufend unter 50 €/Monat für Batch-Scoring
Es ist Donnerstag, 8:47 Uhr. Vertriebsleiter Markus Probst öffnet die wöchentliche Abgangsliste seines Stadtwerks — 340 Haushaltskunden, die ihren Gasvertrag im vergangenen Monat gekündigt haben. Er kennt diesen Moment. Er mag ihn nicht.
Das Fatale ist nicht die Zahl. Es ist der Zeitpunkt.
Mit dem Senden der Kündigungsbestätigung ist die entscheidende Chance verpasst. Ein kleiner Teil der 340 hätte vor sechs Wochen noch gehalten werden können — mit einem persönlichen Anruf, einem angepassten Tarif, vielleicht einer Geburtstagsmail mit Treueangebot. Stattdessen sieht Markus jetzt die Liste: Name, Adresse, Zählpunkt, Ablaufdatum. Keine Hinweise darauf, wer wechselbereit war, wer zufällig auf ein Vergleichsportal-Angebot hereingefallen ist, wer schon seit Monaten über den Absprung nachgedacht hat.
Sein Team wird jetzt Rückgewinnungskampagnen starten. Erfahrungsgemäß holt man dabei 8–12 Prozent der Abgänge zurück — und zahlt dafür in der Regel mehr als für eine frühzeitige Retention.
Das Muster wiederholt sich Monat für Monat. Nicht weil es keine Daten gäbe. Sondern weil niemand täglich 50.000 Kundendatensätze manuell auf Wechselrisiken prüft.
Das echte Ausmaß des Problems
Der deutsche Gasmarkt erlebt seit 2022 eine Dynamik, die für viele regionale Versorger strukturell bedrohlich ist. Laut Bundesnetzagentur wechselten 2024 über drei Millionen Haushaltskunden ihren Gaslieferanten — das entspricht rund 17 Prozent der Gasbezieher und ist fast doppelt so viel wie im Vorjahr (1,8 Millionen Wechsel 2023). Wer auf einem Grundversorgungstarif saß, konnte durch einen Wechsel mehrere hundert Euro pro Jahr einsparen.
Für die Versorger bedeutet das: Jeder Abgang ist nicht nur ein verlorener Kunde, sondern eine Neuakquisitionsaufgabe. Die Kosten für einen neuen Haushaltskunden im deutschen Energiemarkt liegen je nach Kanal und Produktkomplexität bei 80–150 Euro — Leadkauf, Provisionen, Onboarding, Vertragsanlage. Ein Bestandskunde, den man zwei Monate früher mit einem Anruf und einem angepassten Angebot hätte halten können, ist bei einem Fünftel dieser Kosten zu retentieren.
Branchenintern belastend: Viele Versorger erkennen Wechselabsichten zu spät. Die klassischen Signale — Kündigung, ausbleibende Abschlagszahlung, schriftliche Anfrage nach Verbrauchsdaten — kommen dann, wenn die Entscheidung schon gefallen ist. Die Schätzung von moveXM, einem auf Energieversorger spezialisierten CX-Anbieter, legt nahe, dass rund 40 Prozent aller Kündigungen auf vermeidbare Gründe zurückgehen: unklare Kommunikation, fehlende Proaktivität, nicht angebotene Tarifanpassung — Dinge, die ein frühzeitiger Eingriff hätte beheben können.
Besonders schmerzhaft: Die Wechselwellen konzentrieren sich auf bestimmte Kundensegmente. Kunden mit einer Vertragsdauer von 18–30 Monaten, nach der ersten Preiserhöhung oder nach einem Umzug in einen neuen Haushalt wechseln überproportional häufig. Diese Muster sind in den CRM- und Abrechnungsdaten sichtbar — sofern jemand systematisch hineinschaut.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Churn-Prognose | Mit KI-gestützter Churn-Prognose |
|---|---|---|
| Erkennungszeitpunkt Wechselrisiko | Nach Kündigung | 6–12 Wochen vor Kündigung |
| Anteil wechselgefährdeter Kunden proaktiv adressiert | < 5 % (manuelle Stichproben) | 70–85 % (automatische Segmentierung) |
| Kosten pro gehaltenem Kunden | 80–150 € (Rückgewinnung) | 20–50 € (Retention-Angebot) |
| Wechselquote in adressierter Zielgruppe | Benchmark: 8–12 % p. a. | Reduktion auf 5–8 % p. a. ¹ |
| Vertriebsaufwand für Retention | Reaktiv, personalkräftig | Automatisiert, auf Hochrisikokunden fokussiert |
| Messbarkeit des ROI | Schwierig (kein Vorher-Nachher) | Direkt: Wechselquote je Segment vor/nach |
¹ Erfahrungswerte aus Stadtwerke-Pilotprojekten; stark abhängig von Datenqualität, Angebotsattraktivität und CRM-Anbindung. Nicht alle Wechsel sind durch Retention zu verhindern — preissensitive Kunden mit einem Wechselvorteil von > 200 €/Jahr werden durch Retentionskampagnen nur in seltenen Fällen gehalten.
Einschätzung auf einen Blick
Zeitersparnis — niedrig (2/5)
Churn-Prognose spart keine tägliche Arbeitszeit im engeren Sinne. Der Hebel liegt woanders: Das System entscheidet, wen das Vertriebsteam wann und mit welchem Angebot kontaktiert — statt jeden Kunden manuell zu prüfen. Die freiwerdende Kapazität liegt im Bereich von 2–4 Stunden pro Woche je Vertriebsmitarbeitenden, die nicht mehr mit der Analyse wechselgefährdeter Kunden verbringen. Im Vergleich zu anderen Anwendungsfällen in dieser Kategorie — etwa der Wartungsplanung oder der Stoerfall-Eskalation — ist der Zeitersparnis-Effekt gering. Der primäre Wert liegt in der Erlössicherung, nicht in der Effizienzsteigerung.
Kosteneinsparung — sehr hoch (5/5)
Das ist der stärkste Finanzhebel unter den Gasversorgungsanwendungsfällen: Jeder gehaltene Kunde spart 80–150 Euro Neuakquise plus den Margenverlust durch Tarif-Neukalkulation. Für ein Stadtwerk mit 50.000 Gasbeziehern und einer Wechselquote von 10 Prozent bedeutet eine Reduktion auf 7 Prozent — knapp 1.500 gehaltene Kunden — eine Einsparung von 120.000 bis 225.000 Euro jährlich, nur in vermiedenen Neuakquisekosten. Hinzu kommt die gesicherte Marge während der Vertragslaufzeit.
Schnelle Umsetzung — mittel (3/5)
Ein erstes Churn-Scoring-Modell auf Basis vorhandener CRM- und Abrechnungsdaten ist in 6–10 Wochen pilotfähig — vorausgesetzt, die Datenqualität stimmt. Das ist weder der einfachste noch der komplexeste Einstieg in dieser Kategorie. Deutlich schneller gestartet werden kann bei einfacheren Automatisierungen wie der Abrechnung oder der Kundenkommunikation. Die Komplexität liegt bei Churn-Prediction weniger im Modell selbst als in der CRM-Integration: Scoring muss täglich aktualisiert werden, und die Auslöser für Kampagnen müssen in vorhandene Vertriebssysteme eingehängt werden.
ROI-Sicherheit — hoch (4/5)
Die Messbarkeit ist eine echte Stärke dieses Anwendungsfalls: Wechselquote vor Einführung vs. nach Einführung, je Kundensegment, direkt aus der Abrechnungsdatenbank. Das ist keine indirekte Schätzung — man sieht, wie viele der als risikoreich eingestuften Kunden tatsächlich geblieben sind. Was die Sicherheit auf 4 statt 5 begrenzt: Ein Teil der Wechsel ist durch kein Retentionsangebot zu verhindern (rein preisorientierte Kunden, Umzüge, Lebensumstände). Das Modell kann nicht alle Wechsel prognostizieren, und der ROI hängt stark von der Qualität der angebotenen Retention-Incentives ab.
Skalierbarkeit — sehr hoch (5/5)
Das ist die zweite große Stärke: Das Churn-Modell läuft mit dem gleichen technischen Aufwand auf 10.000 oder 200.000 Kunden. Die Systemkosten sind praktisch fix; was skaliert, ist der Nutzen. Ein regionales Stadtwerk mit 15.000 Haushaltskunden und ein Regionalversorger mit 150.000 Kunden zahlen für die Infrastruktur ähnlich viel — der Kostenvorteil je gehaltenem Kunden wächst linear mit der Kundenbasis.
Richtwerte — stark abhängig von Datenqualität im CRM, Wettbewerbssituation im Versorgungsgebiet und Qualität der Retentionsangebote.
Was das Churn-Modell konkret macht
Das Grundprinzip ist Machine Learning auf historischen Kundendaten. Das System lernt aus den Mustern von Kunden, die in der Vergangenheit gewechselt haben — und erkennt diese Muster bei aktiven Kunden, bevor die Kündigung kommt.
Das Modell verarbeitet täglich:
- Vertragsstammdaten (Vertragsdauer, Tarif, Produktgattung)
- Zahlungshistorie (Pünktlichkeit der Abschläge, Mahnungen, Teilzahlungen)
- Verbrauchsentwicklung (Abweichung vom Jahresvorjahr, saisonale Muster)
- Kommunikationshistorie (Kontaktfrequenz, offene Beschwerden, ungelöste Tickets)
- Preisdelta (Abstand zwischen aktuellem Tarif und günstigstem Marktangebot, soweit verfügbar)
- Externe Signale (Umzugsmeldungen, Einzahlerdaten, sofern CRM-gepflegt)
Aus diesen Daten berechnet das Modell täglich einen Wechselwahrscheinlichkeitsscore zwischen 0 und 100 für jeden Kunden. Die gängigen Algorithmen sind Gradient-Boosting-Verfahren wie XGBoost oder LightGBM — sie liefern bei tabellarischen Kundendaten die besten Ergebnisse und sind zudem interpretierbar: Du kannst sehen, welche Faktoren den Score eines bestimmten Kunden treiben.
Auslösung von Retentionsmaßnahmen:
Sobald ein Kunde einen definierten Schwellenwert überschreitet (typischerweise Score > 65–70 %), löst das System automatisch eine Aktion aus:
- E-Mail mit personalisierten Angeboten (Treuebonus, Tarifwechsel-Option, Preisgarantie)
- Aufgabe im CRM für den zuständigen Vertriebsmitarbeitenden bei Hochrisikokunden (Score > 85 %)
- Brief oder Telefonkampagne je nach Kundensegment und Kanalhistorie
Die Segmentierung zwischen automatisierten und manuellen Aktionen ist dabei wichtig: Nicht jeder Hochrisikokunde lohnt den Vertriebsanruf. Für einen Haushaltskunden mit einem Jahresverbrauch von 8.000 kWh und einem Jahresumsatz von 800 Euro rechnet sich ein Außendiensttermin nie — ein personalisierter Brief schon.
Welche Daten wirklich entscheiden
Das klingt nach einer technischen Frage, ist aber eine strategische: Nicht alle Datenpunkte tragen gleichviel zur Vorhersagekraft bei.
Starke Prädiktoren (tragen 60–70 % zur Modellgüte bei):
- Vertragsalter zwischen 18 und 30 Monaten — der stärkste einzelne Prädiktor. Kunden wechseln bevorzugt nach dem Ende der ersten Vertragsbindung.
- Erste Preiserhöhung im laufenden Vertrag — erhöht die Wechselwahrscheinlichkeit um 40–60 % in den 60 Tagen danach.
- Mehr als eine unbezahlte Mahnung in den letzten 12 Monaten — korreliert zwar mit Wechsel, ist aber oft ein Zeichen für finanzielle Situation, nicht für Wechselabsicht. Vorsicht bei Überinterpretation.
- Kein Kontakt mit dem Versorger in den letzten 18 Monaten — fehlende Bindung erhöht Wechselbereitschaft signifikant.
Schwache oder irreführende Prädiktoren:
- Absoluter Verbrauch — ein Großverbraucher wechselt nicht häufiger als ein Kleinverbraucher.
- Postleitzahl — nur relevant, wenn Wettbewerber regional besonders aktiv werben. Ohne externe Kampagnendaten meist kein stabiler Prädiktor.
- Alter des Kunden — leicht vorhandenes Merkmal, aber datenschutzrechtlich sensibel (Altersdiskriminierung) und in der Praxis ein schwacher Prädiktor.
Was fehlt und trotzdem wichtig wäre:
- Besuche auf Preisvergleichsportalen — dieser Datenpunkt ist in der Praxis nicht verfügbar, wäre aber der stärkste Einzelprädiktor überhaupt.
- Interaktionen mit dem Kundenservice (Beschwerdecontent, Stimmungslage) — technisch möglich, wenn Tickets in strukturierter Form vorliegen; in vielen Stadtwerke-CRMs aber nur als Freitext.
Diese Datenlücken sind kein Grund, nicht zu starten — aber ein Grund, die Modellgüte realistisch einzuschätzen. Ein gutes Churn-Modell erreicht auf EVU-typischen Datensätzen Predictive-Analytics-Qualitäten mit 75–85 Prozent Trefferquote bei den wirklich wechselnden Kunden. Das ist gut genug, um deutlich mehr proaktive Retention zu ermöglichen als heute — aber nicht perfekt genug, um alle Wechsel zu verhindern.
Gewerbe- vs. Haushaltskunden: Wen priorisiert das Modell?
Die wirtschaftliche Logik ist fundamental anders — und das beeinflusst, wie ein Churn-Modell eingesetzt werden sollte.
Haushaltskunden (SLP-Kunden):
Hohe Stückzahl (typisch 30.000–150.000 je EVU), geringer Einzelumsatz (500–1.500 € p. a.), standardisierter Wechselprozess. Hier lohnt das vollautomatisierte Scoring: E-Mail-Kampagne bei Score > 65 %, Telefonoutreach nur bei Score > 85 %. Modell kann auf sehr guter Datenbasis trainiert werden, weil Wechsel häufig vorkommen und statistisch auswertbar sind.
Kleingewerbekunden (SLP-G):
Mittlere Stückzahl, Umsatz 2.000–8.000 € p. a. Wechselverhalten anders als bei Privatkunden: stärker preisgetrieben, aber auch servicegetrieben. Hier eignet sich ein hybrides Vorgehen: automatisches Scoring als Trigger, dann manuelle Prüfung durch den Vertrieb vor der Kontaktaufnahme.
Industriekunden (RLM-Kunden):
Wenige Kunden, sehr hoher Einzelumsatz. Hier ist ein ML-Modell im klassischen Sinne fehl am Platz — die Kundenbasis ist zu klein für statistisch belastbare Muster. Stattdessen: manuelle Account-Management-Prozesse, CRM-Alerts bei Vertragslaufzeit-Annäherung, Key-Account-Pflege. Der Verlust eines einzigen RLM-Kunden kann für ein regionales Stadtwerk fünfstellige Margenausfälle bedeuten — das ist ein persönliches Gespräch, kein automatisierter Brief.
Empfehlung für die Priorisierung:
Beginne mit dem SLP-Haushaltskunden-Segment. Die Datenlage ist am besten, das Volumen groß genug für statistisch valide Modelle, und der Automatisierungsgrad am höchsten. SLP-Gewerbe als zweites Segment, sobald das erste Modell läuft. RLM: Außen vor lassen.
Konkrete Werkzeuge — was wann passt
Welches Werkzeug sinnvoll ist, hängt entscheidend davon ab, welches CRM- oder Abrechnungssystem heute im Einsatz ist.
CURSOR EVI / TINA — für EVU mit diesem Energie-CRM
Das energie-spezifische CRM vieler deutscher Stadtwerke bietet seit der E-world 2026 ein natives Churn-Score-Modul. Kein separates ML-System nötig — der Score wird direkt im CRM berechnet und Kampagnenauslöser sind nativ integriert. Voraussetzung: CURSOR EVI oder TINA muss bereits im Einsatz sein. Wer wechseln will, nur um an das Churn-Modul zu kommen, unterschätzt das Einführungsprojekt erheblich. CURSOR ist Hosted in Germany, was die Datenschutzfrage für Verbrauchsdaten wesentlich vereinfacht.
Salesforce Einstein — für EVU mit Salesforce-CRM
Einstein Prediction Builder kann auf eigenen Kundendaten ein Churn-Score-Modell trainieren — ohne externen Data-Scientist. Die Anbindung an SAP IS-U oder Schleupen erfolgt über Middleware. Realistisch für EVU, die Salesforce bereits für Marketing Cloud oder Service Cloud nutzen. Datenhaltung über Hyperforce EU möglich. Preis: erheblich — für KMU-Stadtwerke mit < 50 CRM-Lizenzen meist wirtschaftlich nicht darstellbar.
Azure Machine Learning mit eigenem Modell — für IT-affine EVU
Für Stadtwerke mit einer Data-Engineering-Kapazität oder einem Dienstleister-Rahmenvertrag: Churn-Score-Modell in Python/scikit-learn auf Azure ML trainieren, täglich aktualisierten Score-Batch ins CRM zurückschreiben. Flexible Integration in SAP IS-U oder Schleupen.CS via API oder Datei-Drop. Volle Kontrolle über Modell, Features und Scoring-Logik. EU-Datenhaltung in Frankfurt verfügbar. Kostenstruktur: Compute-Kosten für tägliches Batch-Scoring sind gering (typisch < 50 €/Monat), Hauptaufwand liegt in der Einrichtung (3–6 Monate mit Dienstleister).
Python mit XGBoost / scikit-learn — on-premise für datensensible EVU
Wer Verbrauchsdaten unter keinen Umständen in eine Cloud-Infrastruktur geben will, baut das Modell on-premise. Python mit XGBoost ist der Industriestandard für tabellarische Churn-Prediction. Training auf historischen Kundendaten, tägliches Scoring als Batchjob, Ergebnisse direkt in die CRM-Datenbank schreiben. Vollständige Datensouveränität, aber: Wartung und Modellpflege liegen beim EVU oder beim beauftragten Dienstleister.
Was wann passt:
- CURSOR-Bestandskunden → CURSOR EVI Churn-Modul
- Salesforce-Bestandskunden mit Enterprise-Budget → Salesforce Einstein
- Microsoft-Azure-Infrastruktur vorhanden → Azure ML + Python
- On-premise oder Cloud-agnostisch → Python + eigenes Setup
Datenschutz und Datenhaltung
Verbrauchsdaten von Haushaltskunden sind personenbezogene Daten im Sinne der DSGVO. Das gilt für Jahresverbrauchswerte genauso wie für Last- und Zählerstandsprofile. Wer diese Daten für ein ML-Modell nutzt, braucht eine klare Rechtsgrundlage — und in den meisten Fällen einen Auftragsverarbeitungsvertrag (AVV) mit dem Tool-Anbieter.
Hinweis zu Verbrauchsdaten: Nach § 50 EnWG (Energiewirtschaftsgesetz) und den einschlägigen Datenschutzanforderungen der Bundesnetzagentur für den Bereich Messwesen und Datenfluss sind Lastprofile und Zählerstandsdaten für die Energielieferung grundsätzlich für die Vertragserfüllung erforderlich und damit auf Basis von Art. 6 Abs. 1 lit. b DSGVO verarbeitbar. Für die darüber hinausgehende Verwendung zum Aufbau von Churn-Scoring-Modellen — also zur Profilerstellung für Marketingzwecke — kann eine separate Rechtsgrundlage (berechtigtes Interesse nach Art. 6 Abs. 1 lit. f DSGVO oder Einwilligung) erforderlich sein. Kläre diesen Punkt vor dem Produktiveinsatz mit deinem Datenschutzbeauftragten oder einer spezialisierten Rechtsberatung. Die Bundesnetzagentur (BNetzA) reguliert zudem den Lieferantenwechselprozess über die GPKE/GeLi-Gas-Prozesse — das betrifft zwar die operative Wechselabwicklung, nicht das Scoring selbst, aber die verwendeten Datenpunkte überschneiden sich. Auch hier gilt: keine Verarbeitung ohne dokumentierte Rechtsgrundlage.
Praktische Datenschutzmaßnahmen:
- Anonymisierte Trainingsumgebung: Das Modell kann auf pseudonymisierten Daten trainiert werden (Kunden-ID statt Name/Adresse). Identifizierende Merkmale werden erst beim Kampagnen-Trigger benötigt.
- Technischer Datenschutz: Scoring-Ergebnisse nur im CRM speichern, kein Export in externe Systeme ohne AVV.
- Aufbewahrungsfristen: Historische Wechseldaten, die für das Modelltraining genutzt werden, unterliegen den gleichen Löschfristen wie andere Kundendaten.
Für die gängigen Werkzeuge gilt:
CURSOR EVI — Hosted in Germany, Datenschutz nach deutschem Standard, kein US-Cloud-Risiko.
Salesforce Einstein — EU-Hosting über Hyperforce Frankfurt möglich, aber explizit einfordern, AVV abschließen.
Azure Machine Learning — EU-Region (Frankfurt) wählbar, AVV ist Teil der Microsoft Online Services Terms.
On-premise-Python-Setup — vollständige Datensouveränität, kein Cloud-Risiko; Pflege liegt intern.
Newsletter
Solche Praxis-Analysen, regelmäßig in deinem Postfach
Neue KI-Use-Cases, ehrliche Tool-Tests und DSGVO-Updates, verständlich aufbereitet. Kein Spam, jederzeit abbestellbar.
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten:
| Ansatz | Einmalige Kosten | Dauer |
|---|---|---|
| CURSOR EVI Churn-Modul (Bestandskunden) | 15.000–40.000 € (Konfiguration + Pilotprojekt) | 6–10 Wochen |
| Azure ML + Dienstleister | 30.000–80.000 € | 3–6 Monate |
| Python on-premise (eigene IT + Dienstleister) | 20.000–60.000 € | 2–5 Monate |
| Salesforce Einstein (Bestandskunden) | > 50.000 € (Lizenz + Implementierung) | 4–9 Monate |
Laufende Kosten:
- Azure ML Batch-Scoring: < 50 €/Monat (täglicher Batch auf Kundendatensatz bis 200.000 Kunden)
- CURSOR EVI Wartung: 15–20 % der Lizenzkosten p. a. (in der Regel im Gesamtpaket)
- Modellpflege intern oder Dienstleister: 2–5 Tage/Quartal für Review, Retraining, Monitoring
Wie du den ROI tatsächlich misst:
Der sauberste Ansatz: A/B-Test auf Kundensegmente. Du teilst die als risikoreich eingestuften Kunden in zwei Hälften — eine wird proaktiv kontaktiert, die andere nicht. Nach einem Quartal vergleichst du die Wechselquote beider Gruppen. Das ist aufwändiger als eine globale Vorher-nachher-Messung, gibt aber saubere Kausalität statt Korrelation.
Konservative ROI-Rechnung:
Stadtwerk mit 40.000 Haushaltskunden Gas. Wechselquote 9 % = 3.600 Abgänge/Jahr. Neuakquisekosten je Kunde 100 €.
Churn-Score-Modell identifiziert 2.800 der 3.600 wechselgefährdeten Kunden vorab. Von diesen werden 2.400 proaktiv angesprochen. 25 % davon bleiben (= 600 Kunden).
Ersparnis: 600 × 100 € = 60.000 € vermiedene Neuakquise — zuzüglich gesicherter Marge für die Restvertragslaufzeit.
Systemkosten Jahr 1 (Einrichtung + Betrieb): ~50.000 €. ROI positiv ab Quartal 3.
(Schätzrechnung auf Basis von Branchenbenchmarks; tatsächlicher ROI hängt von Datenqualität, Retention-Angeboten und Wettbewerbssituation ab.)
Drei typische Einstiegsfehler
1. Das Modell wird nicht regelmäßig neu trainiert.
Das ist der häufigste und gefährlichste Fehler — und er passiert leise. Ein Churn-Modell, das im Januar auf den Wechseldaten der Vorjahre trainiert wurde, kennt die Wechselmuster nach der nächsten Preisrunde im Herbst nicht. Konzept-Drift ist im Energiemarkt besonders stark, weil sich Preisniveaus, Wettbewerbsintensität und regulatorische Rahmenbedingungen schnell ändern. Faustregel: Das Modell wird mindestens quartalsweise neu evaluiert und spätestens nach jeder größeren Preisanpassung neu trainiert. Wer das nicht plant, hat nach 12 Monaten ein Modell, das Muster aus der Vergangenheit erkennt — die heute nicht mehr relevant sind.
2. Das Modell als „Schwarze Box” betreiben.
Wenn niemand im Vertriebsteam versteht, warum Kunde X einen Score von 78 % hat, werden die Kampagnen nicht passend gestaltet. “Hohes Risiko, weil Vertrag 28 Monate alt + letzte Preiserhöhung vor 6 Wochen + kein Kontakt seit 14 Monaten” ist eine Handlungsanweisung. “Hohes Risiko” ohne Begründung ist eine Zahl. Moderne Modelle mit SHAP-basierter Erklärbarkeit geben für jeden Kunden an, welche Faktoren seinen Score treiben — nutze das für die Kampagnengestaltung.
3. Zu viele Kunden automatisch anschreiben.
Die initiale Versuchung: Score-Schwelle niedrig setzen, möglichst viele Kunden in die Kampagne aufnehmen. Das Ergebnis ist eine massive Menge an Retentionsangeboten, die auch an Kunden gehen, die ohne Anschreiben geblieben wären — inklusive nicht geplantem Rabattvolumen. Besser: Mit einem engen Schwellenwert (Score > 75 %) beginnen, die erste Kampagnenwelle sorgfältig auswerten, dann die Schwelle graduell anpassen. Ein falscher Alarm (false positive: Kunden wird angeschrieben, wäre aber sowieso geblieben) ist nicht tragisch, aber unnötig teuer. Zu viele false positives erosionieren das Budget und das Vertrauen des Teams in das Modell.
4. Den Maintenance-Aufwand nicht einplanen.
Churn-Modelle sind keine einmalige Entwicklung. Sie brauchen regelmäßiges Monitoring (läuft das tägliche Scoring durch? Sind die Datenfeeds stabil?), periodisches Retraining und jemanden, der auf Modell-Alerts reagiert. Wer das nicht namentlich verantwortlich macht, hat nach 18 Monaten ein System, das niemand mehr anfasst — weil sich niemand zuständig fühlt.
Was mit der Einführung wirklich passiert — und was nicht
Was gut geht: Das Scoring selbst läuft nach dem Einrichtungsaufwand meist stabil. Technisch ist die tägliche Batch-Berechnung von 50.000 Kundendaten kein Problem. Die Anbindung ans CRM — dass der Score sichtbar ist, Aufgaben erstellt werden — klappt in der Praxis ebenfalls. Was bleibt, sind menschliche Hürden.
Widerstand im Vertriebsteam:
“Warum soll ich diesen Kunden anrufen? Der ist doch seit Jahren treu.” Das ist die häufigste Reaktion, wenn ein Vertriebsmitarbeitender eine automatisch generierte Aufgabe für einen Kunden bekommt, den er persönlich kennt. Der Score-Wert allein überzeugt nicht — aber die Erklärbarkeit des Modells hilft: “Markus, der Score ist hoch, weil wir letzten Monat den Preis erhöht haben und der Kunde danach zweimal das Kontaktformular aufgerufen aber nicht ausgefüllt hat.” Das ist eine Handlungsanweisung, keine Kritik.
Die Angst vor der eigenen Retentionsaktivität:
Ein paradoxer Effekt: Wenn das Churn-Modell tatsächlich funktioniert, werden viele Kunden früher kontaktiert als zuvor. Das Vertriebsteam sieht plötzlich mehr Arbeit. Hier hilft die klare Kommunikation, dass proaktive Retention — auch wenn sie aufwändiger wirkt — erheblich günstiger ist als Rückgewinnungskampagnen nach Abgang. Diese Rechnung muss der Teamleiter oder die Teamleiterin explizit und regelmäßig zeigen.
Was nicht passiert:
Das Modell verhindert keine Wechsel bei Kunden, bei denen der Preisunterschied 200 Euro pro Jahr beträgt und kein vergleichbares Angebot gemacht werden kann. Es ist kein Allheilmittel gegen strukturelle Preisunwettbewerbsfähigkeit. Wer hofft, durch ein Churn-Modell den unvermeidbaren Preiswettbewerb zu umgehen, wird enttäuscht werden.
Konkrete Empfehlungen für die Einführung:
- Vor dem Rollout: Einen Pilot mit 5.000–10.000 Kunden über 3 Monate laufen lassen, bevor das System auf den gesamten Bestand ausgerollt wird.
- Vertriebsteam vorab briefen: Nicht “KI übernimmt die Steuerung”, sondern “ihr bekommt bessere Hinweise, wen ihr priorisieren sollt”.
- Klaren Review-Termin nach 90 Tagen setzen: Wie viele Aufgaben wurden erstellt, wie viele bearbeitet, welche Quote ist geblieben? Ohne diesen Termin wird der Pilot nie formal bewertet.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datenerhebung & -prüfung | Woche 1–2 | Verfügbare Felder im CRM/Abrechnungssystem prüfen, Datenqualität bewerten, fehlende Features identifizieren | Mehr Datenlücken als erwartet — Zahlungshistorie oder Kommunikationshistorie nur lückenhaft vorhanden |
| Feature Engineering & Modell-Training | Woche 3–5 | Historische Wechseldaten aufbereiten, XGBoost/LightGBM-Modell trainieren, erste Trefferquote validieren | Klassenungleichgewicht (nur 8–12 % der Kunden wechseln wirklich) — Modell überprediziert die Nicht-Wechsler |
| CRM-Integration & Scoring-Pipeline | Woche 5–8 | Täglich aktualisierten Score-Batch ins CRM schreiben, Kampagnenauslöser konfigurieren | Datenbank-Schnittstellen (SAP IS-U oder Schleupen.CS) aufwändiger als geplant — 2–4 Wochen Puffer einplanen |
| Pilot-Launch | Woche 8–10 | Ersten Retention-Kampagnenzyklus mit Score-basiertem Targeting starten, Pilotgruppe vs. Kontrollgruppe | Vertriebsteam nimmt Score-basierte Aufgaben nicht ernst — manuelle Priorisierung dominiert weiter |
| Review & Optimierung | Woche 12–16 | Wechselquote Pilot vs. Kontrolle auswerten, Score-Schwellwert und Kampagnenlogik anpassen | Datenlage für A/B-Auswertung zu dünn (Pilot-Zeitraum zu kurz) — Bewertung in Quartal 2 verschoben |
| Produktivbetrieb & Modellpflege | Ab Monat 4 | Vollständiger Rollout auf Kundenstamm, quartalsweises Retraining, Modell-Monitoring | Retraining wird vergessen — Modellgüte erodiert nach 9–12 Monaten ohne Wartung |
Häufige Einwände — und was dahintersteckt
“Wir haben das schon versucht, ohne KI — hat nicht funktioniert.”
Meistens steckt dahinter eine manuelle Segmentierung: “Kunden, deren Vertrag älter als 24 Monate ist, bekommen einen Brief.” Das ist keine Churn-Prognose, das ist ein stumpfer Filter. Das Problem: Er trifft 40 % der Kunden (weil viele alte Verträge haben), aber nur 15 % davon wechseln wirklich. Ein ML-Modell, das auch Zahlungsverhalten, Preisentwicklung und Kommunikationshistorie einbezieht, priorisiert deutlich genauer. Die Frage ist nicht “Brief ja oder nein”, sondern “Wen wann mit welchem Angebot ansprechen.”
“Unsere Daten sind zu schlecht für so ein Modell.”
Das ist der häufigste Einwand — und er stimmt selten vollständig. Fast jedes EVU hat die drei wichtigsten Datenpunkte: Vertragsalter, Zahlungshistorie und Verbrauch. Damit ist ein erstes Modell mit 70–75 % Trefferquote machbar. Natürlich wird es besser mit mehr Daten — aber der Schritt von null auf 70 % ist größer als der von 70 % auf 85 %. Wer auf perfekte Datenbasis wartet, wartet meistens zu lange.
“Wir haben nicht das Budget für so ein Projekt.”
Das stimmt für einige Wege — ein SAP-S/4HANA-Integrationsprojekt ist teuer. Es stimmt nicht für alle Wege. Ein Python-Modell auf historischen Exportdaten, das täglich läuft und seinen Score per CSV ins CRM übergibt, ist mit einem Dienstleister für 20.000–40.000 Euro einzurichten — und die erste volle Wechselwelle, die dadurch auch nur zu 20 % verhindert wird, amortisiert das. Die Frage ist, welcher Ansatz für die vorhandene IT-Landschaft passt, nicht ob das generell zu teuer ist.
“Wir wollen keine persönlichen Daten der Kunden für KI verwenden.”
Das ist ein valides Anliegen und kein bloßer Einwand. Es hat jedoch eine lösbare Antwort: Das Modell kann auf pseudonymisierten Datensätzen trainiert werden, bei denen Identitätsmerkmale durch eine Kunden-ID ersetzt sind. Das Scoring läuft anonym, die Zuordnung des Scores zum Kunden passiert erst im CRM — wo du die Daten ohnehin verarbeiten darfst. Der Datenschutzbeauftragte sollte in der Projektplanung von Anfang an einbezogen werden, nicht erst kurz vor dem Launch.
Woran du merkst, dass das zu dir passt
Das System macht Sinn für dein Stadtwerk oder EVU, wenn:
- Du mehr als 10.000 Haushaltskunden Gas oder Strom hast — darunter ist die statistische Basis für ein valides Modell zu dünn, und die Kosten übersteigen den Nutzen fast immer.
- Deine Wechselquote liegt bei mehr als 6 % p. a. — wer 2 % Wechselquote hat, hat kein Churn-Problem. Wer 10 % hat, hat einen massiven wirtschaftlichen Hebel, den ein Modell adressieren kann.
- Du hast im CRM oder Abrechnungssystem mindestens zwei Jahre Vertragshistorie — das ist das Minimum für ein trainiertes Modell. Weniger führt zu hohen Fehlerraten.
- Dein Vertriebsteam hat Kapazität für proaktive Kundenkontakte — das Modell generiert Aufgaben und Kampagnenempfänger; wenn niemand die Aufgaben bearbeitet, läuft das System ins Leere.
- Jemand in deiner IT oder deinem Analytics-Team ist für die Modellpflege zuständig — oder ein Dienstleister hat das im Rahmenvertrag. Ohne Zuständigkeit kein langfristiger Betrieb.
Wann du noch nicht anfangen solltest — drei harte Ausschlusskriterien:
-
Unter 8.000–10.000 Haushaltskunden. Die Wechselereignisse pro Periode sind zu wenige, um ein statistisch valides Modell zu trainieren. Die Lösung hier ist keine KI, sondern ein gut gepflegter CRM-Filter: Kunden mit Vertragsalter > 24 Monate + letzter Kontakt > 12 Monate manuell priorisieren.
-
Keine strukturierte Zahlungshistorie im CRM oder Abrechnungssystem. Wenn du nicht weißt, welche Kunden in den letzten 24 Monaten Mahnungen erhalten haben oder wann zuletzt bezahlt wurde, fehlt einer der stärksten Prädiktoren. Ein Modell ohne Zahlungsdaten prognostiziert dann nicht besser als der stumpfe Filter nach Vertragsalter. Erst Datenhaltung ordnen — dann Modell.
-
Keine oder sehr geringe Wettbewerbsintensität im Versorgungsgebiet. In Gebieten ohne aktive Vergleichsportal-Präsenz und ohne aggressiv beworbene Wechseloptionen liegt die Wechselquote strukturell niedrig. Hier ist der Return on Investment für ein Churn-Modell nicht gegeben — und jede Retentionskampagne kann das Bewusstsein erst wecken, das zu Wechseln führt.
Das kannst du heute noch tun
Bevor du in Infrastruktur oder Dienstleister investierst, mach eine Datenbewertung. Ziehe aus deinem CRM oder Abrechnungssystem die Wechseldaten der letzten 24 Monate — wer hat wann gekündigt, welche Kundendaten hattest du für diesen Kunden zum Zeitpunkt der Kündigung?
Schau dann auf die Muster: Wie alt war der Vertrag im Durchschnitt? Gab es Mahnungen vorher? Wie lange zurück war der letzte Kontakt? Diese manuelle Analyse — notfalls in Excel — zeigt dir in zwei Stunden, ob deine Datenbasis für ein Churn-Modell geeignet ist. Und sie liefert dir gleichzeitig die wichtigsten Merkmale, die das Modell später verwenden wird.
Dann nutze diesen Prompt, um eine erste Hypothese zu prüfen:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Bundesnetzagentur, Pressemitteilung „Wieder deutlich mehr Wechsel bei Strom- und Gasanbietern” (2024): 3 Millionen Gaslieferantenwechsel 2024 (vs. 1,8 Millionen 2023); Wechselquote Gas ca. 17 %; Einsparung von bis zu 200 €/Jahr für wechselnde Haushaltskunden. URL: bundesnetzagentur.de
- affinis GmbH, „Projektrückblick: Churn-Analyse bei einem Energieversorger” (zweiteilig): Praxisbericht eines Churn-Analyse-Projekts bei einem deutschen Energieversorger; XGBoost-Modell auf 10 Jahren historischer Kundendaten; Artikel dokumentiert Datenvorbereitung, Modellauswahl und Ergebnisse. URL: blog.affinis.de
- CURSOR Software AG, E-world 2026 (Bericht via itiko.de): Präsentation des Churn-Score-Moduls in CURSOR EVI und TINA, inklusive „Chat with your Data”-KI-Assistent für energiespezifisches CRM. URL: itiko.de
- moveXM, „Wie Energieversorger Churn Management erfolgreich nutzen” (2023): Branchenbericht zu Wechselmotiven; 40-%-Schätzung für vermeidbare Kündigungen bei Energieversorgern durch Kommunikationsmängel. URL: movexm.com
- Churn-Prediction-Praxisbericht (Prospeo.io / industrie-übergreifend): Dokumentierter Produktions-Deployment-Fehler: Modelle mit 85 % Precision/Recall in Tests fielen in der Produktion auf 60 % Recall / 18 % Precision durch Training-Inference-Distribution-Mismatch. URL: prospeo.io
- Neuakquisekosten-Benchmark: Branchenrichtwert 80–150 € je neuer Haushaltskunde (Gas/Strom, DE-Markt); basierend auf veröffentlichten Kostenangaben von Leadanbietern und EVU-Vergleichsrechnern (Krauss GmbH, enermakler).
- EnWG § 50: Energiewirtschaftsgesetz, aktuelle Fassung (Pflicht zur Datenbereitstellung und Datenschutz im Kontext Messwesen).
- Eigene Einschätzung: Timing-Annahmen, ROI-Rechnung und Implementierungsaufwände basieren auf Erfahrungswerten aus vergleichbaren EVU-Projekten (Stand Mai 2026) — keine repräsentative Studie, konsistente Beobachtungen aus mehreren Implementierungen.
Du willst einschätzen, ob deine Datenbasis für ein Churn-Modell reicht — und welcher technische Ansatz für dein Stadtwerk passt? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.
Diesen Inhalt teilen:
Wissen ist der erste Schritt. Der zweite kostet Zeit.
Du kannst diesen Use Case selbst umsetzen. Realistisch sind das ein paar Wochen Einarbeitung, einige Fehlversuche bei Datenschutz und Toolauswahl und das Risiko, dass es im Alltag doch nicht greift. Oder wir gehen es gemeinsam an: kostenlos und unverbindlich im Erstgespräch.
Weitere Use Cases
KI-Wissensdatenbank für Gasnetztechniker
Ein domänenspezifisches RAG-System macht DVGW-Regelwerk, Betriebsanweisungen und Inspektionsberichte für Montagetechniker mobil abrufbar — und schließt die Wissenslücke, die durch Ruhestandswellen entsteht.
Mehr erfahrenKI-Automatisierung von Netzanschlussanfragen
KI parst eingehende Netzanschlussanfragen, prüft technische Machbarkeit gegen GIS-Daten und GasNZV-Anforderungen und erstellt Angebotsentwürfe — statt 3–5 Tage dauert die Erstprüfung wenige Stunden.
Mehr erfahrenML-basierte Leckageprognose im Gasnetz
Machine-Learning-Modelle analysieren SCADA-Druck- und Durchflussdaten und erkennen Anomaliemuster, die auf Leckagen oder erhöhte Netzverluste hinweisen — bevor der Schaden sichtbar und teuer wird.
Mehr erfahren