KI-gestützte Kundensegmentierung und Potenzialanalyse
KI analysiert Transaktionsdaten und Produktnutzung automatisch und identifiziert Kunden mit Cross-Selling-Potenzial — damit Berater ihre Gesprächszeit dort investieren, wo die größte Wirkung ist.
- Problem
- Banken und Finanzdienstleister haben reichhaltige Transaktionsdaten, nutzen sie aber kaum für systematische Vertriebssteuerung. Berater priorisieren nach Gefühl statt nach Datenlage.
- KI-Lösung
- Ein Clustering-Modell (K-Means/HDBSCAN) gruppiert Kunden nach Verhaltensmustern aus Transaktionsdaten; Propensity-Scoring berechnet täglich produktspezifische Abschlusswahrscheinlichkeiten und speist priorisierte Kontaktlisten direkt ins CRM.
- Typischer Nutzen
- Cross-Selling-Erfolg um 20–35 Prozent steigern; Beraterzeit von Kaltakquise auf warme Anlässe verlagern; Kundenzufriedenheit durch relevantere Beratungsgespräche erhöhen.
- Setup-Zeit
- Transaktionsdaten aufbereiten + Segmentierungsmodell: 3–5 Monate
- Kosteneinschätzung
- 5.000–15.000 € (KNIME-Pilot intern) bis 50.000–120.000 € Einrichtung + 26.000–300.000 €/Jahr Lizenz (Dataiku bis SAS Viya)
Es ist Montag, 8:14 Uhr. Marcus Heidemann, CRM-Manager bei der Volksbank Rems-Murr, öffnet seinen Laptop und schaut auf die Kampagnenliste für das nächste Quartal.
Das Thema ist dasselbe wie immer: Baufinanzierung. Die Direktbank im Verbund hat gerade die Konditionen verbessert, und das Marketingteam will 18.000 Kunden anschreiben — alle, die in den letzten drei Jahren kein Immobilienprodukt gebucht haben. Das sind Segmente nach Produktbesitz, wie immer. Marcus kennt die Rücklaufquoten aus den vergangenen Kampagnen: unter einem Prozent. Manche Kundenberater beschweren sich, dass ihnen die Aktionen Arbeit machen, die nirgendwo hinführt.
Was Marcus nicht weiß: Unter diesen 18.000 Kunden sind 340, die in den letzten sechs Monaten regelmäßig im Online-Banking nach dem Begriff “Baufinanzierung” gesucht haben. 210 weitere zeigen einen Sparmuster-Shift, der statistisch mit einem bevorstehenden Immobilienkauf korreliert. Zwölf haben in den letzten Wochen ihren Dispokredit deutlich reduziert — klassisches Anzeichen für einen geplanten größeren Kauf.
Diese Kunden werden mit den anderen 17.400 in denselben Brief geschickt.
Das ist kein Einzelfall. Das ist das Vertriebsmodell der meisten Genossenschaftsbanken und Sparkassen in Deutschland.
Das echte Ausmaß des Problems
Frag zehn Vertriebsleiter in regionalen Banken, wie ihre Kundensegmentierung funktioniert — und du wirst fast immer dieselbe Antwort hören: Produktbesitz und Einkommensklasse. Wer ein Girokonto hat, bekommt Angebote für Sparprodukte. Wer spart, bekommt Angebote für Fonds. Wer keine Lebensversicherung hat, bekommt alle zwei Jahre ein Mailing.
Das klingt nach einer Strategie. Es ist keine.
Eine Befragung von 35 Expertinnen und Experten aus deutschen Banken und Sparkassen durch ibi research (IT-Finanzmagazin, 2023) zeigt das strukturelle Ausmaß: 61 Prozent der Institute setzen auf ABC-Segmentierung (Einteilung nach Ertragspotenzial), 39 Prozent nutzen Lebensphasenmodelle. Beide Methoden berücksichtigen die individuelle Situation des Kunden nur eingeschränkt. Besonders aufschlussreich: Nur 10 Prozent der befragten Banken erfassen 80 Prozent ihrer Segmentierungskriterien automatisch — der Rest verlässt sich auf manuelle Einschätzungen oder sporadische Datenexporte.
Was dabei verloren geht:
- Timing. Ein Baufinanzierungsangebot im Oktober bringt nichts, wenn der Kauf im März geplant war — und die Signale dafür seit August in den Transaktionsdaten sichtbar waren.
- Kontext. Ein Kunde mit 40.000 Euro auf dem Tagesgeldkonto ist kein “Standard-Sparer”. Er könnte kurz vor einer größeren Ausgabe stehen, einen Erbfall verarbeiten oder aktiv nach einer Anlageform suchen.
- Wechselsignale. Wenn ein Kunde auf ein Konkurrenzinstitut umzieht, beginnt das mit kleinen Transaktionen — reduzierten Daueraufträgen, einem neuen Konto bei einer anderen Bank. Diese Signale sind sichtbar, bevor das Konto wirklich abgewandert ist. Ohne automatisierte Auswertung sieht sie niemand.
Die Folge: Kampagnen mit Responserate unter einem Prozent. Berater, die Kaltanrufe führen, obwohl das CRM ihnen keine verwertbaren Hinweise gibt. Und Kunden, die relevante Produkte anderswo kaufen — nicht weil die eigene Bank kein gutes Angebot hätte, sondern weil niemand zum richtigen Zeitpunkt gefragt hat.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Segmentierung | Mit KI-gestützter Segmentierung |
|---|---|---|
| Segmentierungsbasis | Produktbesitz, Einkommensklasse, Lebensphase | Transaktionsverhalten, Produktaffinität, Verhaltenscluster |
| Kampagnen-Responserate | 0,3–1,2 Prozent | 3–8 Prozent (laut Dataiku Banking Solution, 2024) |
| Kaltanrufe vs. warme Anlässe | 80–90 Prozent Kaltansprache | 50–70 Prozent warme Anlässe mit konkretem Auslöser |
| Erkennung von Abwanderungssignalen | Erst nach Kündigung sichtbar | 4–8 Wochen Vorwarnzeit durch Transaktionsanalyse |
| Aktualität der Segmentzuweisung | Quartalsweise oder jährlich | Täglich oder wöchentlich aktualisiert |
| Personelle Skalierbarkeit | Wächst mit Anzahl der Berater | Läuft über gesamten Kundenstamm, unabhängig von Teamgröße |
Die Werte in der Kampagnen-Responserate sind Richtwerte aus Praxisberichten und Anbieterquellen — eigene Ergebnisse hängen stark von Datenqualität, Modellgüte und Angebotsrelevanz ab.
Vom RFM-Modell zur Verhaltenssegmentierung: Was KI besser macht
Das klassische Werkzeug der Kundensegmentierung in Banken heißt RFM: Recency (Wann war der letzte Kontakt?), Frequency (Wie häufig interagiert der Kunde?) und Monetary Value (Wie wertvoll ist der Kunde monetär?). RFM ist einfach zu berechnen und gibt eine brauchbare erste Orientierung — aber es hat eine strukturelle Schwäche: Es schaut zurück, nicht voraus.
Was RFM nicht kann:
Ein Kunde mit einem Girokonto, einem Sparbuch und keiner Immobilienfinanzierung ist in einem RFM-Modell ein Standard-Privatkunde. Was RFM nicht sieht: Dieser Kunde hat in den letzten 90 Tagen acht Zahlungen an eine Makleragentur geleistet, zwei Monate lang erhöhte Sparbeträge überwiesen, und seine monatliche Auszahlungsfrequenz aus dem Tagesgeld hat sich verändert. Alle drei Signale zeigen in dieselbe Richtung — aber ein RFM-Modell wertet keine Einzeltransaktionsmuster aus.
Was Machine Learning stattdessen tut:
Ein Predictive Analytics-Modell trainiert auf Tausenden historischer Kundenpfade — also auf den Transaktionssequenzen, die in der Vergangenheit tatsächlich zu einem Baufinanzierungsabschluss geführt haben. Es erkennt, wenn ein aktueller Kunde einem dieser Pfade ähnelt, ohne dass er selbst irgendetwas signalisiert hat. Das Ergebnis ist kein Segment nach Produktbesitz, sondern ein Propensity-Score — eine Wahrscheinlichkeit: “Dieser Kunde kauft in den nächsten 90 Tagen mit 23-prozentiger Wahrscheinlichkeit ein Immobilienprodukt.”
Das klingt abstrakt, ist aber in der Praxis der Unterschied zwischen einer Massenkampagne mit 0,7 Prozent Responserate und einer Zielgruppenkampagne für 400 Kunden mit 14 Prozent Responserate.
Lebensereignisse als Katalysator:
Der wertvollste Datensatz ist nicht der Jahresabschluss — es sind die Muster, die auf Lebensübergänge hinweisen. Heirat, Familienzuwachs, Erbschaft, Renteneintritt, Wohnortwechsel: Alle hinterlassen Spuren in Transaktionsdaten, bevor sie als Ereignis “offiziell” werden. Ein Modell, das diese Muster erkennt, bringt die Beratung dann, wenn sie gefragt ist — nicht wenn das Mailing-Budget es erlaubt.
Der Unterschied zu dem verwandten Ansatz der Lebensereignis-Signale aus Transaktionsdaten: Dieser Use Case fokussiert auf die breite Verhaltenssegmentierung des gesamten Kundenstamms — wer hat welche Produktaffinitäten, welche Cluster verhalten sich ähnlich, welche Kunden sind grundsätzlich beratungsbereit? Die Lebensereignis-Erkennung ist ein mächtiger Spezialfall davon, der deutlich mehr technische Tiefe, eine längere Implementierungszeit und eine größere Kundenbasis voraussetzt.
Einschätzung auf einen Blick
Zeitersparnis — niedrig (2/5) Das Segmentierungsmodell läuft über Nacht — es beschleunigt keine tägliche Einzelaufgabe. Was sich ändert: die Qualität der Arbeit, nicht ihre Geschwindigkeit. Berater verbringen weniger Zeit mit erfolglosen Kaltanrufen und mehr Zeit in Gesprächen, die zu Abschlüssen führen. Das ist ein echter Nutzen — aber einer, der sich nicht als Stundeneinsparung messen lässt. Wer nach einem Werkzeug sucht, das täglich Arbeitsstunden spart, findet den größeren Hebel beim automatisierten Beratungsprotokoll oder beim automatisierten Reporting.
Kosteneinsparung — hoch (4/5) Der Haupthebel liegt nicht bei Kostensenkung, sondern bei Umsatzsteigerung: mehr Abschlüsse aus dem bestehenden Kundenstamm, ohne dass neue Berater eingestellt werden. Institute, die ihre Kampagnen-Responserate von unter 1 Prozent auf 3–8 Prozent steigern, verdreifachen den Vertriebsertrag aus demselben Mailing-Budget. Für eine Volksbank mit 50.000 Privatkunden und einem Baufinanzierungsvolumen von 80–120 Millionen Euro jährlich ist das ein messbarer Umsatzunterschied. Zweitstärkste Kostenachse im Vergleich mit anderen finanzen-Anwendungsfällen.
Schnelle Umsetzung — mittel (3/5) Ein erstes Pilotmodell für eine Produktkategorie lässt sich in 3–5 Monaten implementieren: Datenaufbereitung, Modelltraining, CRM-Integration, Pilotbetrieb. Das ist deutlich schneller als die verwandte Lebensereignis-Erkennung, die 12–18 Monate benötigt — aber langsamer als rein operative Anwendungen wie automatisierte Kundenkommunikation, die oft in Wochen starten können. Mittelfeldposition, zu Recht.
ROI-Sicherheit — mittel (3/5) Der Nutzen ist zählbar — Cross-Selling-Abschlüsse, Kampagnen-Conversionrate, Produktdurchdringung je Segment. Aber die Kausalität ist schwer sauber zu isolieren: Hat die bessere Kampagnen-Responserate am Modell gelegen oder am Timing des Zinsumfelds? Ein sauberer A/B-Test mit einer Kontrollgruppe ist die einzige belastbare Methode — und den müssen Institute von Anfang an einplanen, nicht als Nachgedanke. Ohne A/B-Struktur bleibt der Nachweis immer indirekt.
Skalierbarkeit — sehr hoch (5/5) Das Modell läuft täglich über den gesamten Kundenstamm — unabhängig davon, ob er 30.000 oder 300.000 Privatkunden umfasst. Kein linearer Mehrbedarf an Personal oder Infrastruktur. Das ist der stärkste Skalierungshebel unter allen finanzen-Anwendungsfällen: einmal kalibriert, deckt es das gesamte Portfolio ab.
Richtwerte — stark abhängig von Kundenstamm-Größe, Datenqualität im Kernbankensystem und vorhandenen CRM-Kapazitäten.
Was das System konkret macht
Der technische Kern einer KI-gestützten Kundensegmentierung ist ein Clustering-Modell, das Kunden nicht nach statischen Attributen (Produktbesitz, Alter, Einkommensklasse), sondern nach Verhaltensmustern gruppiert. Konkret:
Schritt 1 — Datenextraktion: Transaktionsdaten der letzten 12–24 Monate werden aus dem Kernbankensystem oder Data Warehouse extrahiert: Zahlungseingänge, Zahlungsausgänge nach Kategorie (Miete, Versicherung, Handel, Immobilien), Nutzung von Online-Banking-Funktionen, Produktabschlüsse, Callcenter-Kontakte.
Schritt 2 — Feature Engineering: Aus den Rohtransaktionen werden verhaltensbasierte Merkmale berechnet: Sparquote der letzten drei Monate im Vergleich zum Jahresschnitt, Veränderung der Ausgabenkategorien (mehr für Einrichtung/Bauen?), Disponutzung im Trend, Frequenz von Überweisungen an bestimmte Empfängerkategorien.
Schritt 3 — Clustering: Ein unsupervised Clustering-Algorithmus (typisch K-Means oder HDBSCAN) gruppiert Kunden nach Ähnlichkeit in ihren verhaltensbasierten Merkmalen. Das Ergebnis: nicht “Segment A: Jungfamilien”, sondern “Cluster 7: erhöhte Sparquote + Immobilienkategorie-Ausgaben + reduzierter Dispo — historisch 34 Prozent Wahrscheinlichkeit für Baufinanzierungsabschluss in 6 Monaten.”
Schritt 4 — Propensity-Scoring: Für jede Produktkategorie (Baufinanzierung, Investmentfonds, Rente, Versicherung) wird ein Propensity-Score pro Kunde berechnet. Der Score fließt täglich in das CRM — mit Beratungsanlass (“Transaktionsmuster deutet auf Immobilienkauf hin: Sparraten +40%, zwei Zahlungen an Maklerbüro”).
Schritt 5 — Priorisierungsliste: Der Berater öffnet morgens das CRM und sieht: “Heute 12 Kunden mit hoher Baufinanzierungs-Propensity — Anlass für proaktiven Kontakt.” Kein manuelles Durchsuchen, kein Bauchgefühl. Eine datenbegründete Handlungsempfehlung.
Was das System nicht tut: Es entscheidet nicht, ob ein Kunde eine Finanzierung bekommt. Es filtert nicht nach Kreditwürdigkeit. Es empfiehlt nur, wen der Berater ansprechen sollte — die Entscheidung und das Gespräch bleiben menschlich. Das ist die entscheidende Grenzziehung zur Kreditwürdigkeitsprüfung (einem ganz anderen Anwendungsfall).
Konkrete Werkzeuge — was wann passt
Die Implementierungstiefe hängt stark von der Kundenstamm-Größe, der vorhandenen IT-Infrastruktur und dem verfügbaren Data-Science-Know-how ab.
Dataiku — Mittelweg mit Banking-Templates Dataiku bietet eine kollaborative ML-Plattform mit vorkonfigurierten Banking-Branchenlösungen — darunter “Next Best Offer for Banking” als einsatzbereites Template. Das Template enthält vorbereitete Feature-Engineering-Pipelines für Transaktionsdaten, Clustering-Algorithmen und Score-Output-Konnektoren. Für Teams mit einem Data-Analysten ohne vollständiges Data-Science-Team ist das der schnellste Weg zu einem ersten Pilotmodell. Preis: ca. 26.000 USD/Jahr laut aktuellen Käuferdaten (PriceLevel, 2024); für Regional- und Genossenschaftsbanken ab ca. 50.000 Privatkunden realistisch. Deutschsprachige Dokumentation eingeschränkt; EU-Hosting verfügbar.
SAS Viya — Enterprise-Governance für regulierte Institute SAS ist der Klassiker im deutschen Bankensektor — und Viya ist die cloud-native Weiterentwicklung. Vorteil: vollständige Model-Governance, BaFin-konforme Auditlogs, und der Model Manager dokumentiert jede Modellversion für regulatorische Prüfungen. Für Institute unter BaFin-Aufsicht, die KI-Modelle nachvollziehbar betreiben müssen, ist SAS Viya die Plattform mit dem kleinsten regulatorischen Risiko. Preis: typisch 80.000–300.000 € jährlich; wirtschaftlich erst ab ca. 200.000 Kundendatensätzen und einem dedizierten Data-Science-Team.
Pega Customer Decision Hub — Next-Best-Action in Echtzeit Pega CDH geht einen Schritt weiter als Batch-Segmentierung: Das System berechnet für jeden Kundenkontakt in Echtzeit die optimale Aktion — ob im Online-Banking-Portal, im Callcenter oder in der Filiale. Für Retail-Banken mit mehr als 500.000 Privatkunden und Omnichannel-Ambitionen ist Pega CDH die führende Plattform. Preis: Jahreslizenzen 300.000–1.500.000 €, Gesamtprojektbudget typisch 500.000–2.000.000 €. Kein Self-Service; Implementierung durch zertifizierte Pega-Partner.
KNIME — Open-Source-Einstieg für kleinere Institute KNIME Analytics Platform ist kostenlos (Open Source, GPLv3) und ermöglicht visuelle ML-Workflows ohne Code. Für Genossenschaftsbanken oder Sparkassen mit weniger als 30.000 Kunden und einem IT-Mitarbeitenden mit Datenaffinität ist KNIME eine realistische Einstiegsoption. Der Desktop-Client läuft lokal — kein Cloud-Zugang nötig, was Datenschutzbedenken reduziert. Grenzen: Keine Echtzeit-Verarbeitung, keine native CRM-Integration ohne Scripting, begrenzte Skalierbarkeit bei sehr großen Datensätzen.
Databricks + Salesforce Financial Services Cloud — Moderner Data Stack Für Institute, die bereits einen modernen Data Lake betreiben (oder aufbauen wollen): Databricks für die Modellentwicklung und Scoring-Pipeline, Salesforce Financial Services Cloud als CRM-Zielsystem mit Einstein-KI-Integration. Databricks unterstützt Kundencluster-Modelle nativ auf Spark, mit Delta Lake als regulatorisch nachvollziehbarem Storage. Salesforce Financial Services Cloud bietet vorgefertigte Datenmodelle für Banking (Accounts, Financial Accounts, Financial Goals) und kann Propensity-Scores direkt im Beratungs-Dashboard anzeigen. Aufwändiger in der Implementierung, aber zukunftssicherer als proprietäre Einzellösungen.
Zusammenfassung: Wann welcher Ansatz
- Unter 30.000 Kunden, ein IT-Mitarbeitender → KNIME (kostenlos, lokaler Betrieb)
- 30.000–150.000 Kunden, ein Data-Analyst → Dataiku (Banking-Templates, schnellerer Einstieg)
- 150.000–500.000 Kunden, Data-Science-Team → SAS Viya (Governance-Stärke) oder Databricks + Salesforce FSC
- Über 500.000 Kunden, Omnichannel-Ambition → Pega Customer Decision Hub
DSGVO Art. 22, SCHUFA-Urteil und automatisiertes Profiling: Wo die Grenze liegt
Kundensegmentierung mit KI ist Profiling im Sinne von Art. 4 Nr. 4 DSGVO — das ist unbestreitbar. Das System wertet automatisch Verhaltensdaten aus, um Rückschlüsse auf Bedürfnisse und Entscheidungswahrscheinlichkeiten zu ziehen. Das klingt beunruhigend, ist aber rechtlich handhabbar — wenn man die richtige Seite der Grenze kennt.
Die entscheidende Frage ist Art. 22 DSGVO: Liegt eine “ausschließlich automatisierte Entscheidung mit rechtlicher oder ähnlich erheblicher Wirkung” vor? Für die meisten Formen der Vertriebssegmentierung ist die Antwort: Nein — solange der Berater die finale Entscheidung trifft. Das Modell sagt “Dieser Kunde hat eine hohe Baufinanzierungsaffinität” — der Berater entscheidet, ob und wie er das Gespräch führt. Das ist nicht Art. 22 DSGVO, weil keine automatisierte Entscheidung mit erheblicher Wirkung für den Kunden getroffen wird.
Das SCHUFA-Urteil des EuGH (7. Dezember 2023, C-634/21) hat die Lage verändert: Der Europäische Gerichtshof hat klargestellt, dass ein automatisierter Score eine Art.-22-Entscheidung sein kann, wenn dieser Score die menschliche Entscheidung “maßgeblich beeinflusst” — also wenn der menschliche Entscheidungsträger ihn praktisch unreflektiert übernimmt. Das bedeutet für die Praxis: Wenn ein Propensity-Score direkt und ohne menschliche Würdigung in eine Produkteignungsentscheidung oder ein Kreditangebot einfließt, greift Art. 22.
Was das für dein Segmentierungsmodell bedeutet:
Drei Anforderungen solltest du vor dem Go-Live klären:
-
Rechtsgrundlage für das Profiling: Art. 6 Abs. 1 lit. f DSGVO (berechtigtes Interesse) ist die übliche Grundlage für Marketing-Profiling — erfordert aber eine dokumentierte Interessenabwägung und die Möglichkeit zum Widerspruch.
-
Transparenzpflicht: Kunden müssen in der Datenschutzerklärung darüber informiert sein, dass ihre Transaktionsdaten für verhaltensbasierte Segmentierung genutzt werden. “Wir verwenden Ihre Kontodaten zur Personalisierung unserer Dienstleistungen” reicht pauschal nicht — der Verarbeitungszweck muss spezifisch sein.
-
Keine Entscheidungen über Produkteignung oder Konditionen durch das Modell: Das Modell priorisiert Gesprächsanlässe — Kreditentscheidungen, Konditionenanpassungen oder Limitänderungen bleiben beim Menschen. Sobald ein Scoring-Ergebnis direkt eine Produktbeschränkung oder -freigabe auslöst, befindest du dich in Art.-22-Territorium.
Empfehlung: Lass die DSGVO-rechtliche Einordnung vor dem Produktivbetrieb von einem auf Bankrecht spezialisierten Datenschutzbeauftragten bestätigen. Der Aufwand dafür ist überschaubar — die Konsequenzen eines fehlenden Nachweises im Fall einer Datenschutzbeschwerde nicht.
Die regulatorische Dimension: MaRisk und BaFin-Anforderungen
Kundensegmentierungsmodelle sind keine harmlosen Analytik-Tools — sie sind Modelle im regulatorischen Sinne, sobald ihre Outputs systematisch in die Vertriebssteuerung einfließen. Das hat seit April 2026 eine neue Dimension.
Die 9. MaRisk-Novelle (BaFin-Konsultationsentwurf, April 2026) führt ein vollständig neues Modul ein: AT 4.3.4 — Einsatz von Modellen und Künstlicher Intelligenz. Dieses Modul schreibt erstmals explizit Anforderungen für den Einsatz von algorithmischen Modellen und KI in Banken fest — und gilt ausdrücklich nicht nur für klassische Risikomodelle, sondern auch für “technologiegetriebene Innovationen und Künstliche Intelligenz.”
Was AT 4.3.4 konkret bedeuten kann:
- Modell-Governance: Wer ist verantwortlich für das Modell? Wer dokumentiert Version, Training und Drift-Monitoring?
- Validierung: Wie wird sichergestellt, dass das Modell keine diskriminierenden Outputs produziert?
- Vollständige Auditierbarkeit: Kann eine BaFin-Prüferin nachvollziehen, warum Kunden X und Y unterschiedliche Propensity-Scores bekommen haben?
Was das für dich bedeutet: Auch wenn AT 4.3.4 noch im Konsultationsverfahren ist und seine finale Form noch offen ist: Wer jetzt ein Segmentierungsmodell einführt, sollte die Governance-Anforderungen von Anfang an einplanen — also Model-Versionierung, Trainings-Dokumentation und eine klare Beschreibung der Input-Features. Das kostet im Aufbau kaum Extra-Aufwand, spart aber erheblich bei einer nachträglichen Anpassung.
Für Institute, die bereits MaRisk AT 8.2 (Anforderungen an Outsourcing und Drittdienstleister) kennen: Das Grundprinzip ist ähnlich — du brauchst eine vollständige Verantwortungskette für jeden Prozess, der systematisch Entscheidungen beeinflusst.
Praktischer Rat: Nutze für Segmentierungsmodelle von Anfang an eine Plattform mit integrierter Model-Governance — SAS Viya und Dataiku haben das out-of-the-box. Eigenbau-Lösungen in Python ohne Versionierungs-Layer sind regulatorisch schwerer absicherbar.
Was es kostet — realistisch gerechnet
Implementierungskosten (einmalig) Die Spanne ist groß — sie hängt von der Ausgangslage ab:
- KNIME-Pilotprojekt mit einem internen IT-Mitarbeitenden: 5.000–15.000 € (Zeitaufwand intern, ggf. externe Beratungstage)
- Dataiku-Implementierung mit Banking-Template: 25.000–60.000 € (Lizenz Jahr 1 + externer Implementierungspartner)
- SAS Viya mit vollständiger Governance: 80.000–300.000 €/Jahr (Lizenz) + 50.000–120.000 € Implementierung
- Pega Customer Decision Hub: 500.000–2.000.000 € Gesamtprojektbudget
Laufende Kosten (monatlich/jährlich)
- KNIME Desktop: kostenlos (Personal Community License); KNIME Business Hub ab ca. 1.000 €/Monat
- Dataiku: ca. 26.000 USD/Jahr (Richtwert aus Käuferdaten)
- SAS Viya: 80.000–300.000 €/Jahr
- Pega CDH: 300.000–1.500.000 €/Jahr Lizenz
Den ROI wirklich messen — nicht nur schätzen: Der häufige Fehler ist, den Nutzen als Differenz zwischen alter und neuer Responserate zu berechnen und daraus einen Euro-Wert zu destillieren. Das klingt sauber, ist aber ohne Vergleichsgruppe nicht belastbar.
Die einzige Methode, die vor dem Management und vor einem Prüfer standhält: A/B-Test von Anfang an einplanen. Kampagnengruppe A erhält die KI-priorisierten Kontaktlisten, Kampagnengruppe B die bisherige Methode. Nach drei bis sechs Monaten lassen sich Responserate, Abschlussrate und Ertrag pro kontaktiertem Kunden direkt vergleichen. Das ist mehr Aufwand — aber der einzige Weg, den Wert des Modells intern zu verteidigen.
Konservatives Rechenbeispiel: Eine regionale Volksbank mit 60.000 Privatkunden und einem Jahresvolumen von 40 Millionen Euro Neukrediten. Aktuelle Responserate auf Baufinanzierungs-Kampagnen: 0,8 Prozent. Mit KI-Priorisierung: 3,5 Prozent (Dataiku-Banking-Richtwert). Kampagne an 5.000 Kunden: 40 statt 175 Abschlüsse. Bei 240.000 Euro durchschnittlichem Kreditvolumen und 1,2 Prozent Marge: Mehrumsatz von ca. 389.000 Euro (135 zusätzliche Abschlüsse × 2.880 Euro Marge) — im besten Fall. Realistisch, nach Abzug von Selektionseffekten und Umsetzungsverlusten: 150.000–300.000 Euro jährlich. Das übertrifft die Dataiku-Jahreslizenz bereits im ersten Jahr — wenn die Datenbasis stimmt.
Typische Einstiegsfehler
1. Das Modell auf den gesamten Kundenstamm ansetzen, bevor es einen Benchmark gibt. Der Impuls ist verständlich: Das Modell ist gebaut, also lasst es über alle 60.000 Kunden laufen. Das Problem: Wenn kein A/B-Test angelegt wurde und keine Baseline-Benchmarks existieren, kann niemand später sagen, ob das Modell besser war als der Status quo. Starte mit einer kontrollierten Pilotgruppe, dokumentiere die Baseline-KPIs aus der Vergangenheit, und messe dann den Vergleich.
2. Schlechte Datenqualität als “lösen wir später”-Problem behandeln. Transaktionsdaten in Kernbanksystemen haben oft Lücken: ältere Kunden ohne Online-Banking haben keine digitalen Verhaltensdaten. Kampagnen-Opt-outs fehlen in der Exportschnittstelle. Kundenkonten mit identischen Adressen für mehrere Generationen (Familienkonto-Konstellationen) verzerren Cluster. Diese Probleme müssen vor dem Modellbau adressiert werden — nicht danach. Ein auf schlechten Daten trainiertes Modell gibt schlechte Scores, und niemand wird das System nutzen, wenn die Empfehlungen offensichtlich falsch erscheinen.
3. Das Modell einführen und dann nicht pflegen. Das ist der gefährlichste Fehler — und er passiert leise.
Segmentierungsmodelle altern. Als im Jahr 2022 die Zinsen schnell stiegen, veränderte sich das Sparverhalten der Bankkunden innerhalb von Quartalen. Modelle, die auf Daten aus der Niedrigzinsphase trainiert waren, gaben plötzlich falsche Propensity-Scores aus — für Festgeld hoch, für Tagesgelder falsch. Das nennt sich Concept Drift: der statistische Zusammenhang zwischen Eingabedaten und Zielverhalten verändert sich, weil sich das Verhalten der Kunden verändert hat.
Ein Segmentierungsmodell, das einmal trainiert und dann nicht re-validiert wird, gibt nach 12–18 Monaten Empfehlungen aus, die nicht mehr zur aktuellen Datenlage passen — ohne Alarm, ohne Fehlermeldung, einfach mit sinkender Trefferquote. Die Lösung ist organisatorisch, nicht technisch: Wer ist verantwortlich für das Modell? Wann wird es re-evaluiert? Welche KPI-Schwelle löst ein Re-Training aus?
4. Den CRM-Rollout als IT-Projekt behandeln. Das größte Hindernis ist selten das Modell — es sind die Berater, die die Output-Listen täglich nutzen sollen. Wenn das CRM plötzlich priorisierte Kontaktlisten anzeigt, ohne dass die Berater verstehen, woher die Empfehlung kommt und warum sie ihr vertrauen sollten, werden sie die Listen ignorieren und weiter nach Bauchgefühl arbeiten. Erklärbarkeit ist kein Nice-to-have: “Dieser Kunde hat in den letzten 90 Tagen Transaktionen an Maklerbüros durchgeführt” ist besser als “Propensity-Score: 0.73”.
Was mit der Einführung wirklich passiert — und was nicht
Der wichtigste Widerstand kommt selten von der IT-Abteilung. Er kommt von den erfahrenen Beraterinnen und Beratern.
Ein guter Privatkundenberater kennt “seine” Kunden — und ist stolz darauf. Ein System, das ihm empfiehlt, wen er ansprechen soll, fühlt sich nach einer Entmündigung an. Besonders wenn die Empfehlungen in den ersten Wochen nicht immer zum erfahrenen Bauchgefühl passen. Das ist eine legitime Reaktion, keine Technikfeindlichkeit.
Was hilft:
Keine Pflicht zur Nutzung in der ersten Phase. Zeige stattdessen: “Das Modell empfiehlt drei Kunden für Baufinanzierungsgespräche. Schau, ob du die kennst und was du denkst.” Berater, die die Empfehlungen kennen und als plausibel erleben, werden das System von sich aus nutzen. Berater, denen das System komisch vorkommt, geben wertvolles Feedback — vielleicht sind die Daten für bestimmte Kundensegmente tatsächlich unvollständig.
Das zweite Widerstandsmuster: Der Compliance-Einwand. Manchmal wird die DSGVO als Totschlagargument verwendet, wenn die eigentliche Skepsis eine andere ist. Das ist produktiv — Datenschutzfragen müssen geklärt werden. Aber: Solange das Modell Transaktionsdaten des eigenen Instituts für interne Vertriebssteuerung auswertet und keine automatisierten Entscheidungen über Produktzugang trifft, ist die rechtliche Grundlage — berechtigtes Interesse nach Art. 6 Abs. 1 lit. f DSGVO — beherrschbar. Das sollte ein Datenschutzbeauftragter schriftlich bestätigen, bevor der Rollout beginnt — dann ist das Argument entkräftet.
Was konkret passiert, wenn es läuft: In den ersten drei Monaten liegt die Nutzungsrate erfahrungsgemäß bei 20–40 Prozent der Berater — die Engagierten probieren es aus. Nach sechs Monaten, wenn die ersten messbaren Abschlüsse auf Basis von Modell-Empfehlungen dokumentiert sind, steigt die Nutzungsrate auf 60–80 Prozent. Das sind keine Versprechen — das ist die typische Adoptionskurve aus ähnlichen CRM-Projekten, bei denen neue Priorisierungs-Funktionen eingeführt wurden.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datenaudit | Woche 1–3 | Transaktionsdaten aus Kernbankensystem extrahieren, Vollständigkeit prüfen, Kundenstamm-Abdeckung bewerten | Datenlücken bei älteren Kunden ohne Online-Banking; Exportschnittstelle erfordert mehr Aufwand als erwartet |
| Feature Engineering | Woche 3–7 | Verhaltensbasierte Merkmale berechnen, Datenvorbereitung, Datenqualitätsprobleme bereinigen | Inkonsistente Kategorisierung von Transaktionen im Kernbankensystem — manuelle Nacharbeit nötig |
| Modellentwicklung & Pilottraining | Woche 6–10 | Clustering-Modell trainieren, Segmente interpretieren, erste Propensity-Scores berechnen | Segmente ergeben keine interpretierbaren Business-Cluster — Modell muss mit anderen Parametern neu trainiert werden |
| CRM-Integration & Pilotbetrieb | Woche 8–14 | Scores in CRM einspielen, Beratungs-Dashboard anpassen, Pilot mit 3–5 Beratern starten | CRM-Schnittstelle erfordert IT-Ressourcen, die nicht verfügbar sind — verzögert Rollout |
| A/B-Test & Auswertung | Monat 4–7 | Kontrollierten Vergleich zwischen KI-priorisierten und herkömmlichen Kontaktlisten durchführen | Testgruppe zu klein für statistisch belastbare Ergebnisse — Pilotphase verlängern |
| Vollrollout | Ab Monat 6 | Alle Berater erhalten Zugang, regelmäßiges Modell-Monitoring einrichten | Anfängliche Ablehnung durch erfahrene Berater — Change Management unterschätzt |
Realistischer Zeitraum bis zum produktiven Pilotbetrieb: 3–5 Monate. Bis zum skalierten Vollbetrieb mit A/B-Nachweis: 7–12 Monate.
Häufige Einwände — und was dahintersteckt
“Wir kennen unsere Kunden — wir brauchen kein Modell.” Das ist der häufigste Einwand. Und für einen Berater mit 500 Kunden, die er persönlich kennt, ist er legitim. Das Problem: Die meisten Volksbanken und Sparkassen haben 30.000–150.000 Privatkunden — und keiner kennt alle. Das Modell ersetzt nicht das Beziehungswissen des Beraters für die Kunden, die er kennt. Es arbeitet für die Kunden, die er nicht kennt.
“Unsere Daten sind nicht gut genug für KI.” Eine berechtigt klingende Sorge, die oft überschätzt wird. Transaktionsdaten in Kernbanksystemen sind strukturiert, aktuell und vollständig — das sind gute Ausgangsbedingungen. Was häufig fehlt, sind konsistente Transaktionskategorien und saubere Kundenprofildaten. Das ist ein Aufwand, der in Phase 1 adressiert werden muss — aber kein Ausschlusskriterium. Kein Modell braucht perfekte Daten; es braucht konsistente Daten.
“Das ist zu teuer.” Stimmt für Pega CDH, nicht für KNIME oder einen Dataiku-Piloten. Die eigentliche Frage ist nicht der absolute Preis, sondern die Gegenrechnung: Was kostet es, wenn 3 Prozent der Kunden jährlich zu einer anderen Bank wechseln, weil niemand zum richtigen Zeitpunkt gefragt hat? Für eine Bank mit 60.000 Kunden und einem durchschnittlichen Kundenwert von 400 Euro Provisionsumsatz pro Jahr sind 1.800 abgewanderte Kunden 720.000 Euro jährlich — ohne einmalige Neuakquise-Kosten einzurechnen.
“Was ist mit der DSGVO?” Profiling für Marketingzwecke auf Basis von Transaktionsdaten des eigenen Instituts ist rechtlich lösbar — es erfordert Transparenz, eine klare Rechtsgrundlage und die Möglichkeit zum Widerspruch. Was rechtlich nicht lösbar ist: automatisierte Kreditentscheidungen oder Konditionsanpassungen ohne menschliche Würdigung. Der Unterschied zwischen beidem ist der menschliche Berater als finaler Entscheidungsträger.
Woran du merkst, dass das zu dir passt
- Du führst mehrere tausend Kundenkontakte pro Jahr in einem CRM, aber die Priorisierung basiert auf Produktbesitz oder interner Einschätzung, nicht auf Verhaltensdaten
- Deine Kampagnen-Rücklaufquoten liegen dauerhaft unter 2 Prozent — und die Ursache ist nicht das Angebot, sondern die fehlende Zielgruppenauswahl
- Du hast eine strukturierte Transaktionshistorie im Kernbanksystem (d.h. mindestens 12–24 Monate Daten sind zugänglich und konsistent)
- Berater-Kapazität ist der Engpass, nicht das Budget — das Modell hilft, diese Kapazität auf die 20 Prozent der Kunden zu konzentrieren, aus denen 80 Prozent des Vertriebs-Ertrags kommen
- Du hast einen Datenschutzbeauftragten, der aktiv in KI-Projekte eingebunden werden kann (Pflicht, kein Optional)
Wann es sich noch nicht lohnt — drei harte Ausschlusskriterien:
-
Unter 20.000 aktiven Privatkunden. Bei dieser Größe kennen gute Berater ihre Kunden wirklich persönlich. Das Modell findet nicht genug Muster, um statistisch valide Cluster zu bilden — die Segmente werden entweder zu groß (nichtssagend) oder zu klein (nicht handlungsfähig). Investiere die Zeit stattdessen in ein strukturiertes CRM-Nutzungskonzept und definierte Kontaktpläne.
-
Keine strukturierte Transaktionshistorie auf einem Data Warehouse oder ähnlichem System. Wenn Transaktionsdaten nur im Kernbankensystem archiviert sind, aber kein Export-Interface oder kein Data Mart existiert, fehlt das Fundament. Datenextraktion aus Legacy-Kernbanksystemen (z. B. ältere OSPlus-Installationen) kann Monate dauern und viel IT-Kapazität binden. Prüfe das vor jedem Projektkickoff.
-
Kein CRM-System, in das Scores ausgespielt werden können. Ein Segmentierungsmodell ohne CRM ist eine Excel-Tabelle mit aufwändig berechneten Zahlen. Wenn kein CRM-System existiert oder die bestehende Vertriebslösung keine externe Dateneingabe erlaubt, fehlt der Kanal, über den die Empfehlungen zu den Beratern kommen. Erst CRM einführen und stabilisieren — dann KI-Segmentierung.
Das kannst du heute noch tun
Öffne dein Kernbankensystem oder einen Datenexport und stelle dir drei Fragen:
- Wie viele Kunden haben in den letzten 90 Tagen mindestens eine Transaktion an eine Immobilienmakler- oder Baumarkt-Kategorie durchgeführt?
- Wie viele davon haben kein Immobilienprodukt bei euch?
- Welcher Anteil davon wurde in den letzten 12 Monaten aktiv kontaktiert?
Diese Abfrage kostet maximal eine Stunde und zeigt dir, ob das Potenzial real ist — ohne Modell, ohne KI, nur mit den Daten, die du heute hast. Wenn die Lücke zwischen Frage 1 und 3 signifikant ist, weißt du, dass Segmentierungspotenzial ungenutzt liegt.
Für ein erstes KI-gestütztes Pilotprojekt brauchst du einen strukturierten Prompt — zum Beispiel für die Übergabe an ein externes Analytics-Team oder für die interne Präsentation des Business Case:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
-
Segmentierungspraktiken in deutschen Banken: IT-Finanzmagazin / ibi research, „Kundensegmentierung bei Banken: Individualität durch datengetriebene Ansätze” (2023). 35 Experteninterviews mit Vertreterinnen und Vertretern aus deutschen Banken und Sparkassen. Quelle: it-finanzmagazin.de
-
Gießkannenprinzip und ML-Segmentierung: pmOne, „Datengetriebene Kundensegmentierung für Banken und Versicherungen” (2023). Beschreibt den Übergang von undifferenzierten Massenkampagnen zu ML-basierter Segmentierung mit Clustering-Algorithmen und Empfehlungssystemen. Quelle: pmone.com
-
Kampagnen-Responserate mit ML-Segmentierung: Dataiku, „Customer Segmentation for Banking” Solution Template (2024). Richtwerte für Responserate-Verbesserungen basierend auf Banking-Kundenprojekten. Quelle: dataiku.com
-
SCHUFA-Urteil und Art. 22 DSGVO: Europäischer Gerichtshof, Urteil vom 7. Dezember 2023, C-634/21 (SCHUFA Holding AG / Land Hessen). Klarstellung, dass automatisierter Score eine Art.-22-Entscheidung sein kann, wenn er die menschliche Entscheidung maßgeblich beeinflusst. Auswirkungen auf Kundensegmentierung und Affinitätenanalyse analysiert in: Kremer Legal, „Auswirkungen auf Affinitätenanalyse, Kundensegmentierung und KI” (2024). Quelle: kremer.legal
-
MaRisk 9. Novelle, AT 4.3.4: BaFin, Konsultationsentwurf zur 9. MaRisk-Novelle (April 2026). Neues Modul für den Einsatz von Modellen und KI in Kreditinstituten. Quelle: bafin.de sowie casis.de
-
Concept Drift und Modell-Degradation: SmartDev, „AI Model Drift & Retraining: A Guide for ML System Maintenance” (2024). Praxisbeispiel: Bankenmodell mit 87% Korrektheit bei Deployment im Januar 2024, gesunken auf problematische Werte bis September 2024. Quelle: smartdev.com
-
Pega Customer Decision Hub Preise: Angaben aus Produktdokumentation und verifizierten Anbieterangaben (Stand April 2026). Implementierungskosten aus Branchenberichten zu Pega-Projekten in der Finanzdienstleistung.
-
SAS Viya Preise: SAS Institute, Enterprise-Preisliste (Stand April 2026). Typische Jahreslizenzen 80.000–300.000 € für Finanzdienstleister-Installationen.
-
Dataiku Preise: PriceLevel.com, Käufer-gemeldeter Medianpreis für Dataiku (2024): ca. 26.000 USD/Jahr.
Willst du herausfinden, ob deine Datenbasis für ein Segmentierungsmodell reicht — und welche Produktkategorie als erster Pilot am sinnvollsten ist? Meld dich — das klären wir in einem kurzen Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Automatische Schadenbearbeitung in der Versicherung
KI bearbeitet einfache Schadensfälle vollautomatisch in Minuten statt in Tagen — von der Eingangserfassung bis zur Auszahlungsentscheidung.
Mehr erfahrenKI-gestütztes Beratungsprotokoll in der Finanzberatung
KI erstellt automatisch MiFID-konforme Beratungsprotokolle aus dem Beratungsgespräch — Berater können sich auf den Kunden konzentrieren statt auf die Dokumentation.
Mehr erfahrenKI-gestützte Risikoeinschätzung
KI analysiert Kreditanträge, Kundendaten und Marktinformationen schneller und konsistenter als manuelle Prüfprozesse.
Mehr erfahren