Zum Inhalt springen
Papier- & Zellstoffindustrie spezialpapierkundensegmentierungqualitaetsmatching

Kundensegmentierung Spezialpapiere: Qualitätsanforderungen zu Abnehmern matchen

Ein ML-System clustert Kunden anhand ihrer tatsächlichen Qualitätsanforderungen — und zeigt, welche Abnehmer mit einer anderen Sorte besser bedient wären. Weniger Beschwerden, höhere Marge, bessere Kundenbindung.

⚡ Auf einen Blick
Problem
Spezialpapier-Hersteller betreiben 15–20 Sorten mit Hunderten Qualitätsparametern, aber Kundenzuordnungen basieren auf Erfahrungswerten und Vertriebsbauchgefühl. Das Ergebnis: Kunden bestellen jahrelang Sorten, die für ihr Equipment suboptimal sind — bis ein Ausschuss-Problem oder eine Beschwerde die Fehlzuordnung sichtbar macht.
KI-Lösung
k-Means- und hierarchisches Clustering gruppiert Kunden nach ihren tatsächlichen Qualitätsprofilen — aus ERP-Bestellhistorie, QC-Prüfprotokollen und Kundenspezifikationen. Das Modell identifiziert systematisch Fehlzuordnungen: Kunden, die eine andere Sorte brauchen, und Kunden, die für eine höhermargige Sorte qualifiziert wären.
Typischer Nutzen
Weniger sortenbedingte Beschwerden, höhere Treffsicherheit bei Neukundenberatung. Beschwerdeanalyse sinkt von 2–4 Stunden auf unter 15 Minuten; 15–22% Margenverbesserung bei identifizierten Hochmargen-Upsell-Kandidaten, die auf passendere Premiumpapiere umsteigen.
Setup-Zeit
3–6 Monate Datenvorbereitung vor erstem auswertbaren Modell
Kosteneinschätzung
Einrichtung: 15.000–50.000 € (Datenintegration + Pilot-Modell); laufend: 0–1.000 €/Jahr bei KNIME-Eigenbetrieb; 60.000+ €/Jahr bei Dataiku Enterprise
ERP + QC/LIMS verknüpfenClustering (k-Means / hierarchisch)Sales-Dashboard mit Matching-Matrix
Worum geht's?

Es ist ein Montagmorgen Anfang November, 8:47 Uhr.

Vertriebsleiterin Miriam Holzer hat gerade ihre E-Mails geöffnet und findet eine dringende Nachricht von Konrad Büttner, Beschaffungsleiter bei einem mittelgroßen Etikettendrucker in Ludwigshafen. Thema: Haftungsausfälle. Büttners Anlage läuft seit drei Tagen im Strich — Etiketten lösen sich bei der Applikation nicht sauber ab, die Haftung variiert von Rolle zu Rolle. Betroffen: das Etikettenpapier, das Büttners Unternehmen seit fast vier Jahren bei Holzers Papierfabrik bezieht.

Miriam öffnet das QC-System. Die Prüfprotokolle der betroffenen Charge zeigen nichts Ungewöhnliches — Glättung, Grammatur, Feuchte, alles innerhalb Spezifikation. Der Lieferschein zeigt: Sorte Typ-7-Label, Standard. Holzer leitet den Fall an die Qualitätssicherung weiter, und während QS und Kundenservice sich durch sechs Monate Lieferdaten arbeiten, kommen Büttners Maschinen nicht an die Ursache heran. Drei Tage Ausschuss, ein frustrierter Kunde.

Zwei Wochen später, nach aufwändiger Ursachenanalyse, findet das Team heraus: Das Applikationsequipment von Büttner ist auf ein engeres Toleranzfenster bei der Oberflächenrauheit ausgelegt als die Standardspezifikation von Typ-7-Label. Eine andere Sorte aus dem eigenen Portfolio — Typ-9-Label-Premium — hätte gepasst, seit Jahren. Und noch etwas: Typ-9-Label-Premium hat eine um 18 Prozent höhere Marge.

Die Information, dass Büttners Equipmentprofil zu Typ-9-Label-Premium passt, hätte im QC-System des Herstellers vorgelegen — hätte jemand danach gesucht.

Das echte Ausmaß des Problems

Ein mittelgroßer Spezialpapier-Hersteller betreibt typischerweise 15 bis 20 verschiedene Papiersorten: Releasepapiere, Filterpapiere, Thermopapiere, Etikettensubstrate, medizinische Verpackungspapiere. Jede Sorte ist durch Hunderte von Qualitätsparametern definiert — Grammatur, Oberflächenrauheit, Luftdurchlässigkeit, Reißlänge, Dehnung, Feuchte, Aschegehalt, Porosität, Kalandriertheit und Dutzende mehr. Das Qualitätskontrollsystem protokolliert diese Werte für jede produzierte Charge.

Auf der Kundenseite liegt eine spiegelbildliche Komplexität: Jeder Abnehmer hat spezifische Anforderungen, die von seinem Weiterverarbeitungsequipment, seinem Endprodukt und seinen Prozessparametern abhängen. Ein Etikettendrucker, der auf Hochgeschwindigkeits-Applikatoren setzt, braucht andere Oberflächeneigenschaften als ein Betrieb mit langsamen Handapplikationslinien. Ein Pharmaverpacker mit FDA-Anforderungen hat andere Feuchtetoleranzen als ein Lebensmittelproduzent.

Das Problem: In den meisten Spezialpapierwerken sind Kundenzuordnungen zu Sorten historisch gewachsen. Der erste Auftrag definiert die Sorte, und wenn der Kunde nicht klagt, wird nicht gewechselt. Kein aktiver Abgleich findet statt, ob die Kundenanforderungen noch zur bestellten Sorte passen — oder ob eine andere Sorte besser geeignet wäre.

Die wirtschaftliche Konsequenz ist zweigeteilt:

  • Sortenbedingte Reklamationen entstehen, wenn Kunden Qualitätsparameter fordern, die ihre aktuelle Sorte zwar formal erfüllt, die aber am Rande der Toleranz liegen — und bei Equipmentverschleiß oder Produktionsschwankungen herausfallen. Jede sortenbedingte Reklamation kostet im Schnitt zwei bis vier Stunden interne Analysezeit, ganz abgesehen vom Reputationsschaden.

  • Margenverbesserungspotenzial bleibt ungenutzt, weil Kunden, die eigentlich eine höhermargige Premiumsorte benötigen, jahrelang Standardware beziehen — weil niemand den Abgleich gemacht hat.

Laut einer Analyse von McKinsey & Company zu B2B-Vertriebsanalytics (“Driving Above-Market Growth in B2B”, 2023) nutzen B2B-Unternehmen im Industriebereich im Schnitt weniger als 20 Prozent der verfügbaren Kundendaten für Vertriebsentscheidungen. Im Spezialpapierbereich ist die Lücke noch größer, weil Qualitätsdaten (QC-System) und Kundendaten (ERP/CRM) historisch in getrennten Systemen leben.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit ML-Kundenmatching
Zeit bis Ursachenerkennung bei sortenbedingter Beschwerde2–4 WochenStunden bis 2 Tage
Sortenempfehlung bei NeukundenErfahrungswissen VertriebDatenbankbasiert, reproduzierbar
Systematische Überprüfung bestehender ZuordnungenNie oder reaktivQuartalsweise automatisch
Erkannte Upsell-Kandidaten (Kunden mit besserem Sorten-Match)Keine systematische AnalyseVollständige Kundenliste priorisiert
Margenverbesserung bei NeuzuordnungAbhängig von Vertriebsbauchgefühl15–22% bei identifizierten Kandidaten ¹

¹ Erfahrungswert aus vergleichbaren B2B-Produktmatching-Projekten in der Prozessindustrie. Voraussetzung: Vertrieb führt das Gespräch und der Kunde stimmt dem Sortenumstieg zu. Das Modell liefert den Hinweis, nicht den Abschluss.

Einschätzung auf einen Blick

Zeitersparnis — mittel (3/5) Die größte direkte Zeitersparnis entsteht bei Beschwerdeanalysen: Was heute zwei bis vier Wochen mühsamer manueller Rückverfolgung kostet, lässt sich mit einem verknüpften System in Stunden einkreisen. Im Tagesgeschäft — Sortenzuordnung für Neukunden, Aktualisierung von Kundenprofilen — spart das System dem Vertrieb ein bis zwei Stunden pro Fall. Andere Use Cases in diesem Bereich, etwa die Runnability-Prognose, sparen tägliche Maschinenzeit und sind auf Zeitersparnis stärker ausgelegt. Mittelfeldposition.

Kosteneinsparung — mittel (3/5) Der Margengewinn ist real, wenn der Vertrieb die identifizierten Upsell-Kandidaten erfolgreich anspricht und Kunden umsteigen. Bei einem typischen Spezialpapierwerk mit Produktwerten um 500–800 Euro pro Tonne und zehn bis zwanzig Upsell-Kandidaten im Bestand ist der Margeneffekt substanziell — aber er hängt vollständig an der Vertriebskonversionsrate. Eine reine Analyse ohne Gesprächsfolge erzielt nichts.

Schnelle Umsetzung — niedrig (2/5) Das ist die ehrlichste Einschätzung in dieser Kategorie. Bevor das erste Modell läuft, müssen ERP-Bestellhistorie, QC/LIMS-Prüfdaten und Kundenspezifikationen in einer gemeinsamen Datenbasis verknüpft werden — drei Systeme, oft mit unterschiedlichen Kundennummern, Produktcodes und Einheiten. Erfahrungsgemäß dauert diese Datenintegration drei bis sechs Monate. Kein Quick Win. Wer diesen Schritt unterschätzt, startet das Projekt zweimal.

ROI-Sicherheit — niedrig (2/5) Anders als bei Ausschuss-Ursachenanalyse oder Bleichchemikalien-Optimierung, wo das Modell direkt in den Produktionsprozess eingreift, ist dieser Use Case zweistufig: Das Modell zeigt, wo Upsell-Potenzial liegt. Ob daraus eine Margenverbesserung wird, entscheidet das Vertriebsgespräch. Dieser Kausalitätsbruch macht den ROI schwer direkt zuzuordnen und macht sorgfältige Messung unabdingbar.

Skalierbarkeit — hoch (4/5) Ein einmal aufgebautes Modell verbessert sich, je mehr Kunden und Sorten dazukommen. Jede neue Sorte schärft die Cluster, jeder neue Kunde verbessert die Zuordnungsqualität. Keine proportionale Mehrarbeit beim Wachstum — der Pflegeaufwand bleibt konstant, während der Nutzen mit dem Bestand skaliert.

Richtwerte — stark abhängig von Portfoliogröße, Datenqualität und Vertriebskapazität für die Folgegespräche.

Was das System konkret macht

Das technische Herzstück ist Machine Learning-Clustering: Der Algorithmus gruppiert Kunden nicht nach Umsatz oder Region, sondern nach ihren tatsächlichen Qualitätsanforderungen, abgeleitet aus drei Datenquellen.

Quelle 1: ERP-Bestellhistorie. Welche Sorte hat der Kunde in welchen Mengen über welchen Zeitraum bestellt? Gibt es Muster — bestimmte Chargenmerkmale, die immer nachgeordert wurden, oder Chargen, bei denen die Bestellung ausblieb?

Quelle 2: QC-Prüfprotokolle. Für jede Liefercharge existieren Messwerte zu 50–200 Qualitätsparametern. Wenn Kunden bestimmte Chargen häufig reklamierten oder bei bestimmten Messwerten wiederholt Probleme auftraten, ist das im QC-System codiert — nur nicht ausgewertet.

Quelle 3: Kundenspezifikationen. Die formellen Abnahmebedingungen, die Kunden bei Vertragsabschluss definieren. Oft veraltet und selten mit den tatsächlichen QC-Daten abgeglichen.

Aus diesen drei Quellen baut das Modell ein Qualitätsbedarfsprofil für jeden Kunden: Welche Parameter sind tatsächlich relevant für diesen Kunden, und in welchem Toleranzbereich? Das Clustering-Verfahren (typischerweise k-Means oder hierarchisches Clustering) gruppiert Kunden mit ähnlichen Profilen — und gleicht die Cluster anschließend mit den Merkmalsprofilen der verfügbaren Sorten ab.

Das Ergebnis ist eine Matching-Matrix: Für jeden Kunden zeigt das System, welche Sorte am besten passt, und ob der aktuelle Fit gut, ausreichend oder problematisch ist. Eine zweite Ausgabe identifiziert Kunden, deren Profil zur nächsthöheren Premiumsorte passt — mit dem Hinweis auf Margenunterschied und historische Reklamationsrate als Gesprächsaufhänger für den Vertrieb.

Das Modell greift nicht selbst in Aufträge oder Preise ein. Es liefert Empfehlungen, die ein Mensch bewertet und im Kundengespräch umsetzt.

Datenlage als Voraussetzung

Das ist die unangenehmste Wahrheit dieses Use Cases: Er funktioniert nur so gut, wie die Datenbasis strukturiert ist. Und in den meisten Spezialpapierwerken ist sie das nicht — zumindest nicht von Anfang an.

Das konkrete Problem: ERP-System und QC/LIMS sprechen oft nicht miteinander. Der Auftrag im ERP hat eine Auftragsnummer, die Qualitätsprüfung im QC-System läuft auf Chargennummern, und die Kundenspezifikation liegt als PDF beim Vertrieb auf einem Netzlaufwerk. Diese drei Datenstränge müssen über einen gemeinsamen Schlüssel verbunden werden — Chargennummer zu Auftragsnummer zu Kundennummer — bevor das Modell trainiert werden kann.

Typische Probleme dabei:

  • Inkonsistente Produktcodes: Dieselbe Sorte heißt im ERP “Label-7-Standard” und im QC-System “L7-STD” und im alten Produktkatalog “Typ VII”.
  • Fehlende Kundenspezifikationen: Für ältere Kunden existieren keine formalisierten Spezifikationen — nur informelle Absprachen in E-Mail-Archiven.
  • Veraltete Messwerteinheiten: Ältere QC-Berichte nutzen andere Einheiten oder Messverfahren als neuere. Ein Glättewert nach Bekk ist nicht direkt mit einem Glättewert nach Sheffield vergleichbar.
  • Datenlücken bei Chargen ohne Reklamation: Das Modell lernt besonders gut aus Fällen, wo etwas schiefging. Aber gute Chargen sind oft nur mit Mindestprüfungen dokumentiert.

Was das für die Projektplanung bedeutet: Rechne drei bis sechs Monate für die Datenvorbereitung ein, bevor das erste Modell trainiert werden kann. Das ist kein Scheitern — das ist die eigentliche Arbeit. Wer diesen Schritt überspringt und versucht, ein Modell auf schlechten Daten zu trainieren, bekommt Cluster-Ergebnisse, die keine Vertriebsempfehlung tragen.

Eine einfache Daumenregel für die Machbarkeit: Wenn du für einen beliebigen Kunden in unter einer Stunde herausfinden kannst, welche Chargen er in den letzten zwei Jahren bestellt hat, welche QC-Parameter diese Chargen hatten und welche dieser Lieferungen reklamiert wurden — dann ist die Datenbasis grundsätzlich brauchbar. Wenn das nicht geht, fang mit der Datenintegration an, nicht mit dem Modell.

Konkrete Werkzeuge — was wann passt

KNIME Analytics Platform — für Werke mit IT-affinem Team Die Plattform ist dauerhaft kostenlos in der Desktop-Version, unterstützt Datenbankverbindungen zu den meisten ERP- und LIMS-Systemen und enthält alle gängigen Clustering-Algorithmen als visuelle Nodes. Ein technisch versierter Mitarbeiter aus QS oder IT kann einen ersten Prototyp in vier bis acht Wochen aufbauen — nach der Datenvorbereitung, die ohnehin länger dauert. KNIME kann vollständig on-premise betrieben werden, was für das Verarbeiten von Kundenstammdaten DSGVO-relevant ist.

Dataiku — für größere Werke oder Konzernstrukturen Wer mehrere Werke, ein größeres Team oder Anforderungen an kollaborative Modellentwicklung und automatisiertes Retraining hat, ist mit dieser Plattform besser bedient. Sie hat vorgefertigte Solutions-Templates für Customer-Segmentation-Projekte, unterstützt Python und SQL direkt und hat eine stärkere MLOps-Schicht für den produktiven Betrieb. Die Kosten liegen im sechsstelligen Bereich jährlich — das rechtfertigt sich bei großen Kundenbeständen und wenn das Modell Teil einer breiteren Datenplattform werden soll.

Power BI — für die Vertriebsvisualisierung Das ML-Modell alleine hilft dem Vertrieb wenig, wenn die Ergebnisse in einem Datenbankfenster versteckt sind. Die BI-Plattform übernimmt die Visualisierung der Matching-Matrix und der Upsell-Kandidaten als Dashboard, das der Vertrieb täglich nutzen kann. Geographische Verteilung, Reklamationshistorie und Margenverbesserungspotenzial nach Sortenumstieg lassen sich so auf einem Blick vermitteln. Power BI Pro kostet rund 12 Euro pro Nutzer und Monat und lässt sich mit den meisten ERPs und KNIME-Outputs verbinden.

SAS Viya — wenn regulatorische Dokumentation gefragt ist Für Spezialpapierwerke mit starker Pharmakunden-Basis, die Qualitätsentscheidungen gegenüber Auditoren dokumentieren müssen, ist diese Plattform die richtige Wahl. Sie hat ausgeprägte Model-Governance-Funktionen, lässt sich in EU-Rechenzentren betreiben und bietet deutschsprachigen Support über die Niederlassung Heidelberg. Für reine B2B-Segmentierungsaufgaben ohne Regulatorikanforderung ist SAS Viya überdimensioniert.

Wann welcher Ansatz

  • Kleines Team, erstes Projekt, Budget begrenzt → KNIME
  • Mehrere Werke, kollaborative Entwicklung, MLOps-Anforderungen → Dataiku
  • Visualisierung für Vertrieb → Power BI als Aufsatz
  • Pharmakontext, Auditierbarkeit → SAS Viya

Datenschutz und Datenhaltung

Kundenstammdaten — Bestellhistorie, Spezifikationsprofile, Reklamationshistorie — sind personenbezogene Daten im Sinne der DSGVO, sobald sie auf identifizierbare Unternehmen und Ansprechpersonen schließen lassen. In der Praxis ist die Rechtsgrundlage für die interne Analyse (Art. 6 Abs. 1 f DSGVO — berechtigtes Interesse des Unternehmens) bei einem eigenen Kundenstamm typischerweise gegeben.

Kritischer ist die Frage der Werkzeugwahl:

  • On-Premise-Lösungen (KNIME Desktop, selbst gehostetes SAS Viya oder Dataiku) sind unkritisch — die Daten verlassen das Unternehmensnetzwerk nicht.
  • Cloud-SaaS-Lösungen erfordern einen Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO. KNIME Business Hub und Dataiku Cloud bieten AVV an; EU-Regionen sind bei beiden verfügbar.
  • Power BI kann EU-Datenresidenz über Microsoft Azure in Frankfurt betreiben — aber das muss aktiv konfiguriert werden; der Standardmodus verarbeitet Daten global.

Wenn das Modell Empfehlungen auf Basis von Kundenreklamationshistorien macht, sollten diese Daten nur für intern berechtigte Personen zugänglich sein. Eine rollenbasierte Zugriffssteuerung (wer sieht welche Kundendaten) muss vor der Einführung definiert sein.

Was es kostet — realistisch gerechnet

Einmalige Projektkosten

Die größte Einzelposition ist nicht das ML-Tool, sondern die Datenintegration:

  • Datenbankabgleich ERP + QC/LIMS + Kundenspezifikationen: 40–120 interne Personentage, je nach Systemkomplexität und Datenhygiene. Bei einem mittleren Werk mit 15 Sorten und 80 Bestandskunden sind 60–80 Personentage realistisch.
  • Externe Unterstützung (Datenbankintegration, ML-Modellaufbau): 15.000–50.000 Euro für den Piloten, wenn ein Dienstleister hinzugezogen wird.
  • KNIME: kostenlos in der Standardversion. Dataiku: 14-Tage-Trial kostenlos, Enterprise ab rund 60.000 USD/Jahr.

Laufende Kosten

  • KNIME Desktop (einzelner Analyst): 0 Euro.
  • Power BI Pro: ca. 12 Euro/Nutzer/Monat.
  • Modellpflege (Retraining, wenn neue Sorten dazukommen): 2–4 Arbeitstage pro Quartal.

Was du dagegen rechnen kannst

Bei einem Spezialpapierwerk, das 500–800 Euro pro Tonne erzielt und 15 Kunden identifiziert, die auf eine Sorte mit 18 Prozent höherer Marge umsteigen könnten, ergibt sich bei einer realistischen Konversionsrate von 40 Prozent (sechs Kunden wechseln wirklich) und einem mittleren Jahresumsatz von 200 Tonnen je Kunde: rund 180.000 Euro Margenverbesserung im ersten Jahr. Das ist eine konservative Rechnung mit realistischen Annahmen — der Break-Even gegenüber dem Pilotprojekt ist in Reichweite, wenn der Vertrieb die Empfehlungen aktiv umsetzt.

ProcessMiner dokumentiert für AI-gestützte Qualitätsprogramme in Papierwerken Ergebnisse von über 500.000 USD Mehrertrag pro Produktionslinie jährlich — allerdings aus dem Prozessoptimierungs-, nicht dem Vertriebskontext (Quelle: processminer.com, 2024). Der Effekt für Kundenmatching liegt in einer anderen Kategorie, aber die Größenordnung zeigt, was strukturierte Datennutzung im Papiersektor leisten kann.

Drei typische Einstiegsfehler

1. Mit dem Modell anfangen, nicht mit den Daten. Das passiert häufig, weil das Modell spannend ist und die Datenintegration langweilig klingt. Das Ergebnis: Ein Clustering-Modell, das auf unverknüpften, inkonsistenten Daten trainiert wird, produziert Cluster, die statistisch korrekt aussehen, aber keine vertriebliche Aussagekraft haben. Erst wenn ERP, QC-System und Kundenspezifikationen sauber auf einen gemeinsamen Schlüssel gemappt sind, hat das Modell eine belastbare Grundlage.

2. Upsell-Kandidaten dem Vertrieb als Fakten präsentieren, nicht als Gesprächseinstieg. Ein häufiger Folgefehler: Das Modell identifiziert zwanzig Kunden, die “eigentlich” Typ-9-Label-Premium kaufen sollten, und der Vertrieb erhält eine Liste mit dem Hinweis “bitte umstellen”. Kunden, die seit Jahren eine Sorte beziehen, reagieren auf einen unvermittelten Sortenwechselvorschlag mit Misstrauen — besonders wenn sie fragen, warum sie das nicht schon früher wussten. Empfehlung: Die Analyse dient als Vorbereitung für das Kundengespräch, nicht als Direktanweisung. Das Gespräch selbst muss eine Verbesserung für den Kunden kommunizieren, nicht ein Margeninteresse des Herstellers.

3. Das Modell einmal trainieren und sich darauf verlassen. Kunden ändern ihr Equipment, fügen Produktlinien hinzu, verändern Toleranzanforderungen. Ein Modell, das auf Daten aus 2022 trainiert wurde und 2026 noch dieselben Cluster liefert, hat die Hälfte seiner Aktualität verloren. Das Modell braucht ein quartalsweises Retraining auf aktualisierter Datenbasis — und einen definierten Auslöser: Wenn ein Kunde eine neue Maschinengeneration einführt oder ein Reklamationsmuster zeigt, das nicht ins bisherige Profil passt, ist das ein Signal für ein Einzelupdate. Wer das Retraining niemand konkret zuweist, bekommt nach 18 Monaten ein Modell, das auf veralteten Profilen läuft.

Was mit der Einführung wirklich passiert — und was nicht

Die technische Seite ist beherrschbar, wenn die Datenvorbereitung sorgfältig läuft. Die menschliche Seite ist schwieriger.

Der Vertrieb, der sein Bauchgefühl verteidigt. Erfahrene Vertriebsmitarbeitende haben jahrelang Sortenzuordnungen auf Basis von Erfahrungswissen getroffen. Ein Modell, das nun systematisch prüft, ob diese Zuordnungen richtig waren, kann sich wie eine Infragestellung anfühlen. Was tatsächlich hilft: Das Modell nicht als Urteil über bisherige Arbeit einführen, sondern als Werkzeug, das dem Vertrieb Informationen liefert, die es vorher nicht gab. Der beste Einstieg ist ein Fall, bei dem das Modell etwas findet, das der erfahrene Vertriebsmitarbeitende selbst interessant findet — und dann selbst entscheidet, das Gespräch mit dem Kunden zu suchen.

Die QS, die ihre Daten nicht teilen will. In vielen Werken sind QC-Daten als “Produktionsinterna” klassifiziert, nicht als Vertriebs-Input. Die Qualitätsabteilung sieht möglicherweise keinen Grund, Prüfprotokolle mit einem Vertriebsanalyse-Tool zu verknüpfen — besonders wenn die Konsequenz ist, dass externe Systeme Zugriff auf Chargendaten bekommen. Hier hilft ein klares Datenschutzkonzept und die Sicherheit, dass die Daten ausschließlich intern genutzt werden und kein Cloud-System berühren, wenn das gewünscht ist.

Die Vertriebsleitung, die schnelle Ergebnisse erwartet. Wenn die Erwartung ist, dass nach drei Monaten die ersten Upsell-Gespräche laufen, wird das Projekt enttäuschen — weil die Datenvorbereitung länger dauert. Eine sorgfältige Erwartungssteuerung von Beginn an ist entscheidend: “Wir haben in sechs Monaten ein Modell, das uns zeigt, wo wir anrufen sollen. Die ersten Gespräche führen wir dann — und in zwölf Monaten sehen wir, ob der Effekt eingetreten ist.”

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Datenbasis klärenMonat 1–2ERP-, QC- und Kundenspezifikations-Systeme inventarisieren; Verbindbarkeit prüfen; Datenlücken identifizierenErkenntnis: Kundenspezifikationen liegen nicht digital vor — Nachdigitalisierung nötig
DatenintegrationMonat 2–5Gemeinsamen Schlüssel bauen; Produktcodes harmonisieren; historische QC-Daten bereinigenUnterschiedliche Messverfahren in alten und neuen Prüfdaten — Werte nicht direkt vergleichbar
Modell-PrototypMonat 5–6Clustering-Modell auf Pilotkundenstamm (30–40 Kunden) trainieren; Ergebnisse mit Vertrieb validierenCluster ergeben keinen vertrieblichen Sinn → Feature Engineering iterieren
VertriebsintegrationMonat 7–8Power-BI-Dashboard aufbauen; erste Kundengespräche zu identifizierten Upsell-Kandidaten führenKunden reagieren skeptisch auf Sortenwechsel-Vorschlag → Kommunikationsrahmen anpassen
Einführung auf GesamtkundenstammMonat 9–12Alle Kunden in Modell aufnehmen; Retraining-Zyklus einrichten; Margeneffekt messenRetraining nicht eingeplant → Modell veraltet still

Häufige Einwände — und was dahintersteckt

„Unsere Kunden haben wir im Griff — die kommen zu uns, wenn was nicht stimmt.” Das ist die häufigste Reaktion bei erfahrenen Vertriebsteams. Und sie stimmt — für die Probleme, die sichtbar werden. Die sortenbedingte Fehlzuordnung, die nie zu einer Reklamation führt, weil der Kunde die Variabilität intern ausgleicht (mehr Ausschuss, langsamere Linie, häufigere Reinigung), ist unsichtbar. Die Kostenwirkung trägt ausschließlich der Kunde. Der Vorschlag des Modells ist, diese verborgenen Fehlzuordnungen sichtbar zu machen — als Dienstleistung, nicht als Kritik.

„Wenn wir Kunden auf andere Sorten schieben, riskieren wir die Beziehung.” Das ist ein echter Einwand, kein Scheinargument. Ein unvorbereiteter Sortenwechselvorschlag kann ein langjähriger Kunde als “Warum habt ihr uns das nicht früher gesagt?” interpretieren. Die Lösung liegt nicht im Vermeiden des Gesprächs, sondern in der Vorbereitung: Das Gespräch muss einen konkreten Nutzen für den Kunden kommunizieren — weniger Ausschuss, stabilere Verarbeitung, kürzere Rüstzeiten — und nicht primär das Margeninteresse des Herstellers.

„Wir haben keine Data Scientists.” Für einen Pilot mit KNIME und einer IT-affinen Person aus QS oder Prozessoptimierung reicht das. Die Plattform hat visuelle Clustering-Workflows ohne Programmieraufwand. Der aufwändigere Teil ist die Datenvorbereitung — und die erfordert Domänenwissen über Produktcodes und QC-Daten, das im eigenen Haus vorhanden ist. Ein externer Dienstleister kann den Modellaufbau begleiten; aber die Kenntnis der eigenen Datenbasis kommt von innen.

Woran du merkst, dass das zu dir passt

  • Du betreibst mindestens 8–10 verschiedene Papiersorten und hast Kunden in mehreren Segmenten (Etiketten, Pharma, Filter, Release…) — genug Heterogenität, damit das Clustering sinnvolle Cluster bildet
  • Du hast ein digitales QC/LIMS-System, das Prüfprotokolle auf Chargenbasis speichert — nicht auf Papier oder in Excel-Einzeldateien
  • Deine ERP-Bestellhistorie geht mindestens drei Jahre zurück und enthält Sorte, Chargennummer und Kundennummer je Auftrag
  • Du hattest in den letzten zwei Jahren mindestens zwei sortenbezogene Kundenbeschwerden, bei denen die Ursache erst nach umfangreicher Analyse klar wurde
  • Dein Vertrieb hat kein systematisches Tool für Sortenzuordnungsempfehlungen bei Neukunden

Wann es sich noch nicht lohnt — drei harte Ausschlusskriterien:

  1. Unter 50 Stammkunden oder weniger als 6 verschiedene Sorten. Bei kleinen Beständen ist das manuelle Wissen im Vertrieb überlegen — und der Modellaufbau erzeugt mehr Aufwand als Nutzen. Der Abgleich lässt sich mit einer gepflegten Excel-Tabelle abbilden.

  2. QC-Daten liegen nicht digital und chargenbezogen vor. Wenn Qualitätsprüfungen als PDF-Berichte archiviert sind oder per-Schicht in Excel dokumentiert werden, ohne direkte Verknüpfung zu Auftrags- und Kundennummern, ist der erste Schritt Digitalisierung, nicht Modellierung. Dieser Schritt dauert in der Praxis ein bis zwei Jahre und sollte unabhängig von diesem Use Case priorisiert werden.

  3. ERP und QC-System haben keinen gemeinsamen Schlüssel. Wenn Auftrags- und Chargennummern in beiden Systemen nicht systematisch verknüpft sind, ist die manuelle Rekonstruktion dieser Verknüpfung für mehrere Jahre historische Daten ein Mehrmonatsprojekt. Das lohnt sich, ist aber kein Einstieg — es ist die Voraussetzung.

Das kannst du heute noch tun

Der erste Schritt ist nicht technisch — er ist diagnostisch. Beantworte für dein Werk die folgende Frage manuell: Nimm drei Bestandskunden, die in den letzten 18 Monaten keine Beschwerden hatten. Kannst du für jeden dieser Kunden in unter einer Stunde herausfinden, welche QC-Kennwerte ihre letzten zehn Chargen hatten, und ob diese Werte alle innerhalb der Primärspezifikation lagen? Wenn ja: Die Datenbasis ist grundsätzlich brauchbar. Wenn nein: Hier beginnt das Projekt.

Der zweite Schritt ist ein Pilot mit einem einzigen Kunden. Suche den Kunden heraus, der in den letzten zwei Jahren die meisten sortenbedingten Rückfragen oder kleineren Qualitätsdiskussionen erzeugt hat. Erstelle manuell ein Anforderungsprofil — welche QC-Parameter waren bei Lieferungen ohne Probleme im Schnitt anders als bei Lieferungen mit Diskussionen? Dieser manuelle Abgleich zeigt dir, ob das Muster erkennbar ist. Wenn es erkennbar ist, kann ein Modell es skalieren.

Für die erste KI-gestützte Analyse ohne eigenes Tool: Lade eine anonymisierte Liste von QC-Kennwerten und Reklamationsstatus für 30–50 Chargen in ein KI-Assistenztool und formuliere folgende Aufgabe:

Prompt: Erster Qualitätsprofil-Abgleich für einen Kunden
Du bist ein Datenanalyst in einem Spezialpapierwerk. Ich gebe dir eine Tabelle mit Qualitätskennwerten von [ANZAHL] Papierchargen. Jede Zeile enthält: - Chargennummer - Sorte ([SORTENLISTE]) - Kundennummer - Qualitätsparameter: [PARAMETERLIST, z.B. Grammatur, Glättung Bekk, Feuchte, Reißlänge...] - Status: "ohne Beschwerde" oder "Qualitätsdiskussion/Reklamation" [TABELLE HIER EINFÜGEN] Aufgabe: 1. Welche Qualitätsparameter unterscheiden sich systematisch zwischen Chargen mit und ohne Qualitätsdiskussionen für Kunden [KUNDENNUMMER]? 2. Welche Parameter zeigen bei diesem Kunden eine engere Toleranz als in der Sortenspezifikation angegeben? 3. Gibt es einen erkennbaren Schwellenwert bei einem oder mehreren Parametern, unterhalb / oberhalb dessen Beschwerden gehäuft auftreten? 4. Welche der anderen Sorten im Portfolio würde die identifizierten Engparameter besser abdecken? Antworte konkret mit Parameterbezeichnungen und Zahlenwerten aus den Daten.
Funktioniert mit ChatGPT Plus (Data Analyst), Claude Pro, Gemini Advanced
Beispiel-Ausgabe

Mitarbeiter:in

Kundennummer K-0471 hat 8 von 23 Chargen der Sorte Label-7-Standard als 'Qualitätsdiskussion' markiert. Alle betroffenen Chargen haben einen Glättewert Bekk zwischen 420 und 480 s, während Chargen ohne Beschwerde über 520 s lagen.

KI-Assistent

Systematischer Befund für Kunde K-0471: Kritischer Parameter: Oberflächenglättung (Bekk-Methode) Schwellenwert: Chargen unter ~510 s führen gehäuft zu Qualitätsdiskussionen Spezifikation Label-7-Standard: 380–560 s (breites Toleranzfenster) Kundenbedarf (implizit): ≥ 510 s Bekk Vergleich mit Sortenportfolio: • Label-9-Premium: Spezifikation 520–620 s Bekk — würde Kundenbedarf dauerhaft abdecken • Label-7-Standard: Nur 60–65% der Chargen erfüllen ≥ 510 s Bekk zuverlässig Empfehlung: Gespräch mit K-0471 vorbereiten mit Fokus auf stabilere Verarbeitungsbedingungen durch Label-9-Premium. Potenzielle Argumentation: weniger Ausschuss in der Verarbeitung, konsistentere Applikationsqualität. Hinweis: Diese Analyse basiert auf historischen Daten. Vor Gesprächsvorbereitung sollte geprüft werden, ob K-0471 bereits eine formelle Spezifikation mit Mindest-Bekk-Wert hinterlegt hat.

Quellen & Methodik

  • McKinsey & Company: “Driving Above-Market Growth in B2B”, Digital Sales & Analytics Compendium (2023). Daten zu Nutzung von Kundendaten in B2B-Vertriebsprozessen: weniger als 20 Prozent der verfügbaren Daten werden aktiv genutzt. (mckinsey.com)

  • ProcessMiner / AI in Pulp and Paper Manufacturing (2024): Dokumentierte Ergebnisse von AI-Qualitätsprogrammen in Papierwerken (Evergreen Packaging, Kruger, Georgia-Pacific, Liberty Paper): „returns of more than $500K a year per manufacturing line”, „ROI of up to 500% when fully deployed”. Kontext: Prozessoptimierung, nicht Kundenmatching. Zeigt die Größenordnung strukturierter Datennutzung im Papiersektor. (processminer.com/pulp-paper/)

  • dataPARC / KapStone Paper (Fallstudie, undatiert): Nutzung von Grade-Based-Analytics und „Golden Run”-Methodik zur Qualitätsbenchmarkierung je Papiersorte. Belegt die Verbreitung sortenbasierter Datenanalyse in Papierwerken. (dataparc.com/pulp-paper/)

  • Datenintegrations-Realität (ERP/LIMS/QMS-Silos): Mehrere Branchenquellen zur Systemintegration (Qualityze, LabWare, Matroid QC-MES-ERP-Integration) dokumentieren, dass isolierte QC- und ERP-Systeme „teams left fighting over data veracity” und „critical decisions based on outdated information” produzieren. Die 3–6-Monats-Schätzung für Datenintegration basiert auf Erfahrungswerten aus Integrationsprojekten in der Prozessindustrie.

  • Margenverbesserungswerte: 15–22% Margenverbesserung bei Neuzuordnung ist ein Erfahrungswert aus B2B-Produktmatching-Projekten in der Prozessindustrie (nicht papierbranchenspezifisch). Produktwerte von 500–800 Euro/Tonne für Spezialpapier: EUWID Papier und Zellstoff, Marktdaten 2023.


Du willst wissen, ob deine Datenbasis für ein solches Pilotprojekt taugt — oder welche Sorten in eurem Portfolio das größte Matching-Potenzial haben? Meld dich — das klären wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar