Zum Inhalt springen
Einzelhandel & E-Commerce lieferantenrisikomanagementeinkauf

KI-gestützte Lieferantenbewertung und Risikoanalyse

KI aggregiert interne Lieferdaten und externe Risikosignale zu einem kontinuierlichen Lieferanten-Score — statt Bauchgefühl und Jahresgespräch als einzige Erkenntnisquellen.

⚡ Auf einen Blick
Problem
Lieferantenentscheidungen basieren oft auf persönlichem Eindruck, ein paar Schlüsselkennzahlen und dem letzten Jahresgespräch. Qualitätsprobleme, Lieferverzögerungen und Insolvenzrisiken werden erst erkannt, wenn der Schaden schon eingetreten ist.
KI-Lösung
KI aggregiert interne Lieferdaten aus dem ERP (Pünktlichkeit, Reklamationsquote, Qualitätsprüfungen) und externe Signale (Bonitätsinformationen, Nachrichtenmonitoring) zu einem kontinuierlich aktualisierten Lieferanten-Score.
Typischer Nutzen
Lieferverzögerungen sinken durch frühzeitige Risikoerkennung; Einkaufsentscheidungen werden auf Datenbasis getroffen; kritische Lieferantenkonzentrationen werden sichtbar — bevor ein Ausfall passiert.
Setup-Zeit
3–6 Monate bis belastbare Scores vorliegen
Kosteneinschätzung
vermiedene Notfallbeschaffungen: 20–80 T€ pro Ausfall
Datenintegration aus ERP und Wareneingang, kombiniert mit externen Daten-Feeds und automatisierten Scoring-Modellen.
Worum geht's?

Es ist Donnerstag, 7:51 Uhr. Melanie Dörner, Einkaufsleiterin bei einem mittelständischen Sportartikelgroßhändler in Augsburg, öffnet die Eingangsmail des Tages — und liest, dass Lieferant Nr. 14 die vereinbarte Herbstkollektion nicht termingerecht liefern kann. Produktionsengpass, heißt es. Restbestände seien in vier bis sechs Wochen verfügbar.

Vier bis sechs Wochen. Der Saisonstart ist in drei.

Melanie kennt diesen Lieferanten seit Jahren. Persönlich angenehm, immer zuverlässig gewesen — bis auf die Reklamationswelle im Frühjahr, die das Team intern abgehakt hat. Und die verspätete Lieferung im September letzten Jahres, die ins Tagesgeschäft eingetragen wurde, aber nie ausgewertet. Und die kurze Nachricht vor zwei Monaten, dass sie einen neuen Vertriebspartner haben, der die Kapazitäten neu ordnet.

Diese drei Signale zusammen hätten ein Frühwarnzeichen ergeben. Keines der drei war im ERP als Muster sichtbar. Niemand hatte sie in Verbindung gebracht.

Jetzt läuft Melanie die Alternativen durch: anderer Lieferant, Expressorder, Lücke im Sortiment. Jede Option kostet Zeit und Geld. Die Notfallbeschaffung, die sie gerade organisiert, wird schätzungsweise 18.000 bis 25.000 Euro über dem ursprünglichen Einkaufspreis liegen — und das nur für diese eine Produktgruppe.

Das echte Ausmaß des Problems

Lieferantenentscheidungen in Handelsunternehmen basieren häufig auf drei Quellen: dem Jahresgespräch, dem Bauchgefühl des Einkaufs und dem ERP-System — dessen Lieferantendaten zwar vorhanden, aber selten systematisch ausgewertet werden.

Das ist kein Organisationsversagen. Es ist ein Kapazitätsproblem. Wer 40 oder 60 aktive Lieferanten betreut, kann nicht für jeden wöchentlich Liefertreue, Reklamationsquoten, Bonitätssignale und aktuelle Branchennachrichten manuell zusammenführen. In der Praxis wird bewertet, wenn etwas schiefläuft — nicht vorher.

Das Onventis Einkaufsbarometer Mittelstand zeigt ein klares Bild: Nur ein Bruchteil der befragten Einkaufsorganisationen wertet interne Performancedaten systematisch für Lieferantenentscheidungen aus. Die meisten Unternehmen kennen ihre Liefertreue-Quote pro Lieferant nicht aus dem Kopf — sie schätzen.

Laut einer CRIF-Analyse aus 2023 sind rund 20 Prozent aller Unternehmensinsolvenzen auf Dominoeffekte entlang der Lieferkette zurückzuführen. Für Handelsunternehmen bedeutet das: Ein einzelner strategischer Lieferantenausfall kann Lieferengpässe in mehreren Produktkategorien gleichzeitig auslösen — besonders dann, wenn die Abhängigkeit von diesem Lieferanten nie quantifiziert wurde.

Die konkreten Konsequenzen, die in der Praxis auftreten:

  • Notfallbeschaffungen: Teurer, langsamer, oft mit Kompromissen bei Qualität oder Sortimentstiefe
  • Lieferlücken im Regal: Kundenzufriedenheit sinkt, Wettbewerber gewinnen Anteile
  • Qualitätskosten: Reklamationsbearbeitung, Retouren, Kundenverlust — oft nicht einem Lieferanten direkt zugeordnet
  • Verhandlungsschwäche: Wer seinen Lieferanten nicht mit Daten kennt, verhandelt mit leerem Blatt

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit KI-gestütztem Lieferanten-Scoring
Aktualisierung Lieferantenbewertung1–2 × jährlich (Jahresgespräch)Kontinuierlich automatisch
Erkennungszeit für QualitätstrendsErst nach Häufung von Reklamationen4–8 Wochen früher erkennbar
Transparenz LieferantenkonzentrationSubjektiv geschätztAutomatisch nach Umsatzanteil berechnet
Frühwarnung bei BonitätsrisikenKeine — bis zum AusfallSignale aus Kreditauskünften und Nachrichtenmonitoring
Aufwand für manuelle Lieferantenanalyse4–8 Stunden je Lieferant/Quartal30–60 Minuten (Review des generierten Scores)
LkSG-DokumentationsaufwandManuell, projektweiseFortlaufend automatisiert

Die Werte im Vergleich basieren auf Erfahrungsberichten aus Einkaufsprojekten bei deutschen Handels- und Industrieunternehmen. Die Spannweiten spiegeln unterschiedliche Unternehmensgrößen und Datenqualitätsniveaus wider.

Einschätzung auf einen Blick

Zeitersparnis — mittel (3/5) Der größte Zeitgewinn liegt nicht in der Bewertung selbst, sondern in der Beseitigung von Recherchearbeit: Wer heute für eine Lieferantenentscheidung vier bis acht Stunden Excel-Auswertung, Kreditauskunftsabfragen und Branchensuchen investiert, reduziert das auf einen 30-minütigen Score-Review. In der Gesamtschau spart das bei 50 Lieferanten im Quartal zwei bis vier Vollarbeitstage im Einkauf. Kein dramatischer Hebel verglichen mit Kundensupport-Automatisierung oder Produktbeschreibungen, aber solide.

Kosteneinsparung — hoch (4/5) Eine verhinderte Notfallbeschaffung kann in Abhängigkeit vom Sortimentssegment 10.000 bis 80.000 Euro Mehrkosten einsparen. Handelsunternehmen, die Lieferkettenkrisen aus den Jahren 2020 bis 2022 erlebt haben, kennen das aus bitterer Erfahrung. Tacto dokumentiert bei Kundenunternehmen wie HYMER konkrete Einsparungen von 250.000 Euro durch KI-gestützte Einkaufsoptimierung innerhalb eines Jahres. Nicht jede dieser Einsparungen ist auf Lieferanten-Risikoscoring zurückzuführen — aber der Beitrag ist real.

Schnelle Umsetzung — niedrig (2/5) Belastbare Scores liegen frühestens nach drei bis sechs Monaten vor. Voraussetzung: saubere Lieferantenstammdaten im ERP, historische Liefer- und Qualitätsdaten aus mindestens 12 Monaten, und eine definierte Scoring-Logik. Tools wie Tacto können mit dem Onboarding in sechs bis acht Wochen starten — aber „Onboarding gestartet” und „Score, dem ich vertraue” sind zwei verschiedene Dinge. Für Händler mit vielen Lieferanten und wenig ERP-Datenpflege ist das der ehrliche Aufwand.

ROI-Sicherheit — niedrig (2/5) Das ist die schwächste Achse dieses Use Case. Der Nutzen entsteht genau dann, wenn ein Ausfall verhindert wird — und damit ist er prinzipiell nie sicher messbar. Man kann nicht beweisen, dass ein Lieferant ausgefallen wäre, wenn man nicht früh gewarnt hätte. Der ROI ist ein kontrafaktisches Argument. Für größere Handelsunternehmen mit nachgewiesener Lieferkettenvulnerabilität ist das ein akzeptables Risiko — für kleinere Betriebe mit stabilen Lieferantenbeziehungen ist die Investition schwerer zu rechtfertigen.

Skalierbarkeit — mittel (3/5) Das System wächst mit der Lieferantenbasis mit — aber nicht kostenlos. Jeder neue Lieferant braucht eine Ersterfassung, Datenanreicherung und eine Kalibrierung, ob vorhandene Scoringkriterien passen. Bei Lieferanten aus Risikoregionen oder mit Nischenprodukten sind externe Datenquellen oft dünn. Skalierungspotenzial ist vorhanden, aber nicht linear.

Richtwerte — stark abhängig von ERP-Datenqualität, Lieferantenanzahl und ob ein dedizierter Einkaufsmitarbeitender das System betreut.

Was das KI-System konkret macht

Das Grundprinzip ist einfacher als es klingt: Ein Machine Learning-Modell aggregiert Daten aus mehreren Quellen und berechnet daraus einen Risiko-Score für jeden Lieferanten — ähnlich wie eine Kreditwürdigkeitsprüfung, aber auf Lieferantenperformance statt Bonität zugeschnitten.

Interne Datenquellen — Das ERP des Unternehmens enthält alles Notwendige, wird aber selten ausgewertet:

  • Liefertreue-Quote (pünktlich geliefert vs. versprochen)
  • Reklamationsrate (Stückzahl oder Wert, nach Lieferant aufgeschlüsselt)
  • Qualitätsprüfungsergebnisse aus dem Wareneingang
  • Preisabweichungen zwischen Angebot und Rechnung
  • Kommunikationsverhalten (Antwortzeiten, Reaktion auf Mahnungen)

Externe Datenquellen — Hier liegt der eigentliche Mehrwert der KI:

  • Bonitätsauskünfte und Insolvenz-Frühwarnsignale (Creditreform, Bürgel, CRIF)
  • Nachrichtenmonitoring: Streiks, Brände, geopolitische Ereignisse am Lieferantenstandort
  • ESG-Bewertungen für LkSG-relevante Sorgfaltspflichten
  • Branchenentwicklungen, die auf Kapazitätsengpässe hindeuten

Die KI verbindet beides zu einem Score, priorisiert Warnmeldungen nach Relevanz für das eigene Unternehmen und macht Risikokonzentrationen sichtbar — zum Beispiel: „35 % eures Sortiments in der Kategorie Outdoor-Textilien hängen an zwei Lieferanten, von denen einer seit drei Monaten Lieferverzögerungen zeigt.”

Was das System nicht kann

Ein Lieferanten-Scoring-System berechnet Wahrscheinlichkeiten, keine Gewissheiten. Ein Lieferant mit niedrigem Score kann sich erholen. Ein Lieferant mit hohem Score kann trotzdem überraschend ausfallen. Das System ist ein Frühwarnsystem, kein Orakel — und es ist immer nur so gut wie die Datenbasis, auf der es arbeitet.

LkSG-Sorgfaltspflichten als neue Minimalanforderung

Das Lieferkettensorgfaltspflichtengesetz (LkSG) gilt seit Januar 2023 für Unternehmen ab 3.000 Mitarbeitenden — und seit Januar 2024 für Unternehmen ab 1.000 Mitarbeitenden. Händler dieser Größenklasse sind verpflichtet, Risiken in ihrer Lieferkette systematisch zu analysieren und zu dokumentieren: Menschenrechtsverletzungen, Umweltverstöße, Arbeitsschutz beim direkten Lieferanten und, in abgeschwächter Form, auch beim mittelbaren Lieferanten.

Für den Einkauf bedeutet das: Wer LkSG-pflichtig ist, muss sowieso eine risikobasierte Lieferantenbewertung durchführen. Die Frage ist nur, ob das manuell und einmalig im Jahresbericht passiert — oder kontinuierlich mit KI-Unterstützung.

Die Konsequenzen bei Verstößen sind erheblich: Bußgelder bis zu 2 % des weltweiten Jahresumsatzes, plus Ausschluss von öffentlichen Vergabeverfahren für bis zu drei Jahre.

Wichtige Abgrenzung: Kleinere Handelsunternehmen unter 1.000 Mitarbeitenden sind vom LkSG aktuell nicht direkt betroffen — werden aber oft von ihren größeren Lieferanten oder Kunden zunehmend nach ESG-Daten gefragt. Die EU-Lieferkettenrichtlinie (CSDDD) dehnt Sorgfaltspflichten perspektivisch auf weitere Unternehmensgrößen aus; die finale Umsetzung ins deutsche Recht ist noch in Arbeit.

Praxishinweis: Tacto und riskmethods bieten explizit Compliance-Module für LkSG- und ESG-Berichtspflichten an. Wer ohnehin LkSG-pflichtig ist, sollte prüfen, ob die Investition in KI-gestütztes Lieferanten-Scoring die manuelle Dokumentationsarbeit ersetzt und gleichzeitig das operative Risikomanagement verbessert — das rechtfertigt den Business Case deutlich besser als Zeitersparnis allein.

Was die KI nicht sieht: verdeckte Risiken in Tier-2-Lieferketten

Das Hauptproblem bei KI-gestütztem Lieferanten-Scoring im Handel: Die meisten Systeme sehen nur direkte Lieferanten (Tier 1). Der kritische Rohstofflieferant des Lieferanten (Tier 2) oder dessen Vorlieferant (Tier 3) bleibt unsichtbar — dabei entstehen dort erfahrungsgemäß die überraschendsten Ausfälle.

Ein Beispiel aus der Textilbranche: Ein Händler bewertet seinen Konfektionär (Tier 1) als zuverlässig — korrekte Liefertreue, niedrige Reklamationsquote, gute Bonität. Was das System nicht sieht: Der Konfektionär bezieht kritische Stoffe ausschließlich von einem einzigen Spinnereilieferanten in Südostasien (Tier 2), der 2023 eine Produktionsanlage verloren hat. Sechs Wochen nach dem Ereignis, als der Konfektionär die Bestellung nicht mehr erfüllen kann, ist es zu spät für präventive Maßnahmen.

Systeme wie riskmethods (jetzt Teil von Sphera) bieten Tier-2- und Tier-3-Überwachung als explizites Feature — aber das setzt voraus, dass die Lieferanten ihre eigene Lieferkette offenlegen, was nicht alle bereit sind zu tun.

Praktische Konsequenz für Händler: Selbst mit KI-Scoring solltest du für deine fünf bis zehn kritischsten Lieferanten eine manuelle Risikoanalyse der Tier-2-Abhängigkeiten durchführen: Wo kommen deren kritische Vorprodukte her? Gibt es Einzel-Anbieter-Abhängigkeiten? Das ist keine Automatisierungsaufgabe — das ist eine strategische Einkaufsentscheidung, die einmalig dokumentiert und jährlich überprüft wird.

Konkrete Werkzeuge — was wann passt

Die richtige Werkzeugwahl hängt vor allem von drei Faktoren ab: Anzahl der Lieferanten, vorhandenes ERP-System und Budget.

Tacto — für deutschen Industriemittelstand Münchner Startup, gegründet 2020, finanziert durch Sequoia und Index Ventures. Verbindet ERP-Daten (SAP, Microsoft Dynamics, proAlpha) mit externen Marktdaten und bietet eigenständige KI-Agenten für Spend-Analyse, Risikoüberwachung und Lieferantenbewertung. Expliziter LkSG-Compliance-Modul. EU-Hosting, deutschsprachiger Support. Jahreslizenzen typisch vierstellig bis niedrig fünfstellig je nach Modulwahl. Referenzkunden: HYMER, VEMAG, Miele. Einschränkung: kein öffentliches Pricing, Onboarding dauert sechs bis acht Wochen.

riskmethods (jetzt Sphera) — für komplexe mehrstufige Lieferketten Ursprünglich in München gegründet, heute Teil von Sphera. Stärkste Funktion: Frühwarnsystem für Tier-1- bis Tier-3-Lieferanten, überwacht Fabrikbrände, Naturkatastrophen, Insolvenzsignale und geopolitische Ereignisse. Unterstützt LkSG- und CSRD-Berichtspflichten explizit. EU-Datenhosting. Enterprise-Pricing ohne öffentliche Preistransparenz. Sinnvoll für Händler mit globalem Lieferantennetzwerk und komplexen Abhängigkeiten. Einschränkung: hoher Onboarding-Aufwand, verlangsamte Produktentwicklung nach der Sphera-Übernahme.

SAP Ariba — für SAP-Kunden mit eigenem Procurement-Team Wenn das Unternehmen bereits SAP S/4HANA betreibt, bietet das Risk-Modul in Ariba Lieferantenbewertung direkt in der bestehenden Infrastruktur. Vorteil: keine Duplizierung von Lieferantenstammdaten. Nachteil: Enterprise-Pricing (typisch ab 80.000 bis 200.000 Euro/Jahr für das Sourcing-Modul), komplexes Onboarding, und lohnt sich erst ab einem Einkaufsvolumen von mindestens 50 Millionen Euro jährlich.

Einstieg ohne Plattform-Investition Für Händler, die noch keine dedizierte Procurement-Plattform einsetzen wollen: ChatGPT oder Claude können als Syntheseassistent eingesetzt werden — ERP-Export als CSV, Bonitätsbericht als PDF, aktuelle Branchennachrichten als Texteingabe, dann strukturierte Lieferantenbewertung als Ausgabe. Das ersetzt kein automatisiertes Scoring, ist aber ein valider erster Schritt und kostet 20 bis 30 Euro pro Monat.

Zusammenfassung: Wann welcher Ansatz

  • Industriemittelstand, 20–500 Mio. EUR Einkaufsvolumen, kein SAP → Tacto
  • Handel mit globalem Lieferantennetz, LkSG-pflichtig → riskmethods/Sphera
  • SAP-Kunde, bestehendes Procurement-Team → SAP Ariba Risk-Modul
  • Kleiner Händler, unter 30 Lieferanten, Einstieg testen → Excel + KI-Assistent

Datenschutz und Datenhaltung

Lieferantenbewertungen enthalten sowohl Unternehmensdaten (Bonitätsinformationen, Preise, Konditionen) als auch in der Praxis oft personenbezogene Daten von Ansprechpartnern beim Lieferanten. Das macht die DSGVO relevant — insbesondere Art. 28 für die Auftragsverarbeitung.

Für die genannten Werkzeuge gilt:

  • Tacto: EU-Hosting (entwickelt und betrieben in Deutschland), kein Training auf Kundendaten, AVV standardmäßig verfügbar. Für den deutschen Mittelstand eine der datenschutzsichersten Optionen in diesem Segment.
  • riskmethods/Sphera: EU-Datenhosting bestätigt, AVV nach Art. 28 DSGVO im Enterprise-Vertrag geregelt. Wenn Lieferantenkontaktdaten verarbeitet werden, muss geprüft werden, ob Informationspflichten nach Art. 13/14 DSGVO gegenüber den Kontaktpersonen erfüllt sind.
  • SAP Ariba: EU-Rechenzentren verfügbar (Frankfurt, Amsterdam), müssen vertraglich festgeschrieben werden. AVV ist Standardbestandteil des SAP-Vertrags.
  • ChatGPT / Claude für manuelle Analyse: Wenn Lieferantendaten als CSV oder PDF in die KI eingegeben werden, gilt: Keine Daten mit Personenbezug (Kontaktdaten, Vertragskonditionen Einzelpersonen) ohne DSGVO-konforme Grundlage hochladen. Enterprise-Pläne beider Anbieter mit EU-Vertragsvereinbarung sind für sensible Geschäftsdaten der sicherere Weg.

Empfehlung: Vor der Einführung prüfen, welche Datenfelder aus dem ERP tatsächlich in das Scoring-System übermittelt werden — nicht alle Lieferantendaten sind für die Bewertung relevant, und eine restriktive Datenweitergabe reduziert den DSGVO-Handlungsbedarf erheblich.

Was es kostet — realistisch gerechnet

Einmalige Einrichtungskosten

  • Datenbestandsaufnahme und ERP-Audit: intern 2–4 Wochen Aufwand (wessen Aufgabe ist das?)
  • Implementierung einer Plattformlösung wie Tacto: 4–8 Wochen Onboarding, teils mit externem Implementierungspartner
  • Einrichtungskosten (extern): 5.000–20.000 Euro je nach ERP-Komplexität und Lieferantenanzahl

Laufende Kosten (monatlich/jährlich)

  • Tacto: Jahreslizenzen typisch 15.000–60.000 Euro je nach Modulwahl und Lieferantenanzahl (keine öffentlichen Preise — Richtwert aus Marktberichten)
  • riskmethods/Sphera: Enterprise-Pricing, Richtwerte auf Anfrage; vergleichbar mit Tacto oder höher
  • SAP Ariba: ab 80.000 Euro/Jahr für Sourcing-Modul, zzgl. Implementierung
  • KI-Assistent (manueller Ansatz): 20–30 Euro/Monat für ChatGPT Plus oder Claude Pro, Zeitaufwand intern ca. 2–4 Stunden/Woche

Wie der Nutzen tatsächlich entsteht Der ROI dieses Use Case ist kein direkter — er ist ein Versicherungsargument. Du zahlst für das System in Monaten, in denen nichts schiefläuft. Der Nutzen entsteht in dem Moment, in dem das System einen drohenden Lieferantenausfall vier Wochen früher signalisiert, als du ihn ohne KI bemerkt hättest.

Eine verhinderte Notfallbeschaffung in einer größeren Produktkategorie (zum Beispiel Saisonware vor dem Saisonstart) kann 20.000 bis 80.000 Euro Mehrkosten bedeuten — plus entgangene Umsätze durch Regalleerstände, die deutlich schwerer zu quantifizieren sind.

Konservative Rechnung: Bei zwei verhinderten Notfallbeschaffungen pro Jahr mit je 15.000 Euro Mehrkosten — das sind 30.000 Euro Einsparung. Bei Jahreskosten von 20.000 bis 40.000 Euro für eine Tacto-Einzel-Modul-Lösung: knapp kostendeckend im ersten Jahr, profitabel ab dem zweiten. Das setzt voraus, dass das System tatsächlich früh genug warnt — und dass der Einkauf auf die Warnung reagiert.

Typische Einstiegsfehler

1. Das Scoring-Projekt beginnt mit dem Tool, nicht mit den Daten. Der häufigste Fehler: Plattformlizenz gekauft, Onboarding gestartet, dann festgestellt, dass die Lieferdaten im ERP nur auf Bestellkopf-Ebene liegen — ohne aufgeschlüsselte Informationen zu Teillieferungen, Qualitätsprüfungen oder Reklamationen. Die KI berechnet dann Scores auf unvollständiger Basis. Lösung: Vor dem Tool-Kauf einen ERP-Datenaudit machen: Welche Lieferdaten sind auf Lieferantenebene tatsächlich auswertbar? Diese Frage kostet zwei Tage intern und spart Monate Frustration.

2. Externe Risikodaten werden überschätzt, interne Performancedaten unterschätzt. Viele Einführungsprojekte investieren viel in externe Datenfeed-Anbindungen (Insolvenzwarnungen, Nachrichtenmonitoring) und vernachlässigen die interne Datenbasis. In der Praxis sind interne Signale — Reklamationsquoten, Liefertreue, Antwortzeiten — aussagekräftiger als die meisten externen Quellen, weil sie spezifisch für die eigene Geschäftsbeziehung sind. Ein Lieferant, der externe Risikobewertungen gut besteht, aber bei dir seit sechs Monaten überdurchschnittlich viele Qualitätsrügen hat, ist wahrscheinlich das größere Problem.

3. Scores werden berechnet, aber nicht gehandelt. Ein Scoring-System, das Risikoampeln auf Orange setzt, bringt nichts, wenn niemand definiert hat, was „Orange” bedeutet — wer wird benachrichtigt, welche Maßnahmen werden eingeleitet, bis wann? In der Praxis landen Warnungen im Postfach des Einkaufs und werden im Tagesgeschäft verdrängt. Lösung: Vor dem Go-live einen klaren Eskalationsprozess definieren: Bei Risiko-Score X wird Maßnahme Y eingeleitet — und diese Logik muss ins System oder in den Prozess eingebaut sein.

4. Lieferantenpflege wird nach der Einführung vergessen. Das ist der langfristig gefährlichste Fehler. Ein Lieferant-Score, der auf veralteten Stammdaten basiert — falscher Unternehmensname nach Übernahme, veraltete Kontaktdaten, fehlende neue Qualitätsprüfungen — gibt falsche Sicherheit. Wer das System einmal aufbaut und dann sich selbst überlässt, hat nach 18 Monaten ein System, das Vertrauen signalisiert, das nicht mehr gerechtfertigt ist. Lösung: Eine Person namentlich für die Datenpflege benennen und einen Review-Zyklus definieren — mindestens einmal jährlich für alle Lieferanten, quartalsweise für die zehn bis zwanzig kritischsten.

Was mit der Einführung wirklich passiert — und was nicht

Die technische Seite ist in der Regel das kleinere Problem. Die größeren Hürden liegen im Einkaufsteam selbst.

Erfahrene Einkäufer verteidigen ihre Einschätzungen gegen den Score. Wer seit zehn Jahren mit einem Lieferanten arbeitet und ihn persönlich schätzt, wird einen Score, der ihn als „mittleres Risiko” einordnet, zunächst als falsch empfinden — und im Zweifel der eigenen Erfahrung trauen. Das ist kein Problem, das sich mit besseren Algorithmen lösen lässt. Es löst sich durch Transparenz: Wenn der Score erklärt, welche Einzeldaten zu diesem Ergebnis geführt haben (drei Lieferverzögerungen, ein Qualitätsproblem, ein Nachrichtenartikel über Lieferantenstreit), kann der Einkäufer das Ergebnis einordnen und gegebenenfalls mit eigener Einschätzung ergänzen. Scoring ersetzt nicht Urteilsvermögen — es informiert es.

Das erste halbe Jahr ist ein Kalibrierungsprojekt. Jede neue Scoring-Logik produziert zunächst Ergebnisse, die das Team hinterfragt. Lieferanten mit hohem persönlichen Vertrauen, die plötzlich als riskant eingestuft werden. Lieferanten mit wenig Datenbasis, die neutral gescort werden, obwohl bekannte Probleme existieren. Das ist kein Fehler des Systems — es ist Feedback, das zeigt, welche Daten noch fehlen oder welche Gewichtungen angepasst werden müssen. Wer das als Iterationsprozess versteht und nicht als Systemfehler, kommt nach sechs Monaten zu einem Score, dem das Team tatsächlich vertraut.

Was konkret hilft:

  • Das erste Scoring-Review gemeinsam mit dem Einkaufsteam durchführen — nicht als „Hier ist euer neues System”, sondern als „Lasst uns die Ergebnisse gemeinsam verstehen”
  • Abweichungen zwischen Score und Eigenerfahrung dokumentieren — diese Abweichungen sind wertvolles Feedback für Gewichtungsanpassungen
  • Bewusst mit zwei bis drei unstrittigen Hochrisiko-Lieferanten starten, bei denen das System offensichtlich recht hat — das baut Vertrauen in die Methodik

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
DatenbestandsaufnahmeWoche 1–2ERP-Audit: Welche Lieferdaten sind vorhanden? Vollständig?Daten weniger strukturiert als angenommen — Bereinigung notwendig
Lieferantenliste & PriorisierungWoche 2–3Welche Lieferanten sind kritisch? Welche Daten fehlen?Uneinigkeit im Team, welche Lieferanten als „strategisch” eingestuft werden
Tool-Auswahl & KonfigurationWoche 3–8Demo, Angebot, Vertragsabschluss, ERP-AnbindungOnboarding dauert länger als versprochen — Puffer einplanen
Pilotbetrieb mit 10–15 LieferantenWoche 8–14Erste Scores, Vergleich mit Eigenerfahrung, KalibrierungScores decken sich nicht mit Bauchgefühl — führt zu Akzeptanzdebatte
Ausrollung auf alle LieferantenWoche 14–24Vollständiges Scoring aktiv, Eskalationsprozess liveDatenpflege wird unterschätzt — ohne Wartungskonzept veralten Scores
RegelbetriebAb Monat 6Quartalsreviews, Jährliche Neukalibrierung, LkSG-BerichteOhne klare Ownership verfällt die Datenbasis still und leise

Häufige Einwände — und was dahintersteckt

„Wir kennen unsere Lieferanten persönlich — da brauchen wir kein System.” Das ist selten der vollständige Stand der Dinge. Persönliche Beziehungen sind wertvoll — aber sie decken blinde Flecken nicht ab. Wer fünfzig Lieferanten betreut, erinnert sich aus dem Kopf an die fünf bis zehn, mit denen er oft zu tun hat. Den Lieferanten, von dem alle zwei Monate eine stille Teillieferung kommt, kennt der Einkauf kaum mehr als eine Kontonummer. Das Scoring-System kennt seine Reklamationsquote.

„Wir sind zu klein dafür.” Das stimmt für manche — aber der Grenzwert liegt niedriger als erwartet. Ab dreißig bis vierzig aktiven Lieferanten zahlt sich eine strukturierte Bewertung aus, weil die Komplexität manuell nicht mehr handhabbar ist. Und der Einstieg muss nicht mit einer Enterprise-Plattform beginnen: Ein strukturiertes Excel-Template, das quartalsweise mit ERP-Daten befüllt wird, plus ein KI-Assistent für die Interpretation, ist ein legitimer Startpunkt für Unternehmen mit kleinerem Budget.

„Die Daten, die wir haben, sind zu schlecht für KI.” Das ist der ehrlichste der drei Einwände — und es gibt einen richtigen Kern. Schlechte Datenbasis produziert schlechte Scores. Aber statt daraus das Argument abzuleiten, nichts zu tun, sollte man die Gegenfrage stellen: Woher kommt die schlechte Datenbasis? Wenn Lieferungseingaben im ERP unstrukturiert sind, ist das ein Prozessfehler, der auch unabhängig von KI behoben werden sollte. Wer die Datenqualität verbessert, um KI zu ermöglichen, verbessert gleichzeitig die Grundlage für jede andere Form der Lieferantenanalyse.

Woran du merkst, dass das zu dir passt

Das passt zu dir:

  • Du hast mehr als 30 aktive Lieferanten und kannst die Liefertreue der letzten zwölf Monate nicht für jeden aus dem Kopf nennen
  • In den letzten zwei Jahren gab es mindestens einen Lieferantenausfall oder eine unerwartete Qualitätskrise, die euch operativ getroffen hat
  • Im ERP liegen historische Lieferdaten, die heute nicht für Bewertungsentscheidungen genutzt werden
  • Ihr seid LkSG-pflichtig und die Dokumentation der Risikoanalyse läuft noch manuell und lückenhaft
  • Das Einkaufsteam hat Kapazität für strategische Arbeit, aber nicht für aufwändige manuelle Lieferantenanalyse

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Unter 25–30 aktiven Lieferanten. Bei dieser Größe ist eine quartalsweise manuelle Bewertung mit einem einfachen Excel-Template genauso effektiv — und ohne vier- bis fünfstellige Einrichtungskosten. Die Komplexität eines KI-Systems rechtfertigt sich erst, wenn die Lieferantenbasis zu groß für manuelles Management ist.

  2. Kein strukturiertes ERP mit historischen Lieferdaten. Ein Scoring-System, das ausschließlich auf externen Risikodaten basiert (Insolvenzwarnungen, Branchennachrichten), ist teuer und wenig aussagekräftig. Der Kern des Wertes liegt in der internen Leistungsdaten-Analyse. Wenn diese Daten nicht strukturiert vorhanden sind, ist der sinnvollste erste Schritt die Verbesserung der ERP-Datenpflege — nicht der Kauf eines KI-Systems.

  3. Keine dedizierte Einkaufsrolle, die auf Score-Warnungen reagieren kann. Ein Frühwarnsystem ist nur so wertvoll wie die Fähigkeit des Teams, auf Warnungen zu reagieren. Wenn der Einkauf vollständig im operativen Tagesgeschäft versinkt und keine Kapazität hat, auf eine Risikoampel hin Gespräche zu führen oder Alternativen vorzubereiten, ist das System Dekoration.

Das kannst du heute noch tun

Exportiere aus deinem ERP die letzten zwölf Monate Lieferdaten: mindestens Bestelldatum, zugesagtes Lieferdatum, tatsächliches Lieferdatum, Lieferant und Warenwert. Das geht in fast jedem ERP-System als CSV-Export.

Öffne dann ChatGPT oder Claude und lade die Datei hoch. Verwende den folgenden Prompt als Startpunkt:

Fertiger Prompt für deine erste Lieferantenanalyse
Du bist ein erfahrener Einkaufsanalyst. Ich lade dir eine Excel- oder CSV-Datei mit Lieferdaten der letzten 12 Monate hoch. Analysiere die Daten und erstelle für mich: 1. Eine Übersicht der Lieferanten nach Liefertreue-Quote (pünktliche Lieferungen / Gesamtlieferungen in %) 2. Die fünf Lieferanten mit der schlechtesten Liefertreue — mit konkreten Zahlen 3. Lieferanten mit auffälliger Verschlechterung im Trend (die letzten 3 Monate schlechter als die Monate davor) 4. Lieferanten, bei denen die tatsächliche Liefermenge regelmäßig von der bestellten abweicht 5. Eine kurze Bewertung: Welche drei Lieferanten würdest du als Priorität für ein Lieferantengespräch empfehlen — und warum? Formatiere die Ergebnisse als Tabelle. Wenn Daten fehlen oder unklar sind, weise mich explizit darauf hin. [HIER DEINE CSV-DATEI HOCHLADEN]
Funktioniert mit ChatGPT (mit Datei-Upload), Claude
Beispiel-Ausgabe

Mitarbeiter:in

CSV mit 8 Lieferanten, je 20–60 Bestellungen, Spalten: Bestellnummer, Lieferant, Bestelldatum, Zugesagtes-Lieferdatum, Tatsächliches-Lieferdatum, Bestellmenge, Gelieferte-Menge

KI-Assistent

Liefertreue-Analyse (12 Monate, n=324 Bestellungen): | Lieferant | Liefertreue | Trend (Q4 vs Q3) | Ø Verzug (Tage) | |-----------|-------------|-----------------|-----------------| | Muster GmbH | 94 % | stabil | 1,2 | | Omega Textil AG | 71 % | verschlechternd (-12 %) | 6,8 | | Alpen Import | 88 % | stabil | 2,1 | | Fast Fashion KG | 63 % | verschlechternd (-19 %) | 9,4 | | Premium Leder | 97 % | leicht verbessernd | 0,8 | Priorität für Lieferantengespräche: 1. Fast Fashion KG: Liefertreue 63 %, Trend stark negativ. Im letzten Quartal 4 von 12 Lieferungen mit mehr als 10 Tagen Verzug. Dringend klären, ob strukturelle Probleme vorliegen. 2. Omega Textil AG: Trotz 71 % Liefertreue ist der Verschlechterungstrend besorgniserregend — von 83 % (Q3) auf 71 % (Q4). Frühe Analyse sinnvoll, bevor sich das weiter festigt. Hinweis: Die Mengenspalte zeigt bei 3 Lieferanten regelmäßige Unterlieferungen (5–15 % unter Bestellmenge). Das könnte auf Kapazitätsprobleme hindeuten — empfehle, das in den Gesprächen anzusprechen.

Das dauert 20 bis 30 Minuten. Was du danach hast: eine datenbasierte Ersteinschätzung deiner Lieferantenperformance — ohne Plattform-Investment, ohne Setup-Aufwand. Und wahrscheinlich ein oder zwei Überraschungen.

Quellen & Methodik

  • Onventis Einkaufsbarometer Mittelstand 2025/2026: Onventis, BME und ESB Business School, jährliche Studie zur digitalen Beschaffung im Mittelstand (DACH). Methodisch: repräsentative Befragung von Einkaufsverantwortlichen, veröffentlicht unter onventis.de/umfrage-einkaufsbarometer/.
  • Tacto-Referenzkunden: HYMER (250.000 Euro Einsparung 2023/2024 durch KI-gestützte Preisanalyse), VEMAG (400.000+ Euro). Quellen: Referenzseite tacto.ai/de/referenzen und Handelsblatt-Bericht über Einkaufsoptimierung mit KI im Mittelstand (2024).
  • CRIF Insolvenz-Dominoeffekte: CRIF Deutschland, Pressemitteilung zu Lieferkettenausfällen und Insolvenzdomino (2023): crif.de. Zahl: Rund 20 % aller Unternehmensinsolvenzen auf Dominoeffekte zurückzuführen.
  • Vemag / Florian Greulich: Handelsblatt, „Mittelstand: Wie Mittelständler mit KI ihre Einkaufskosten deutlich senken” (2024). URL: handelsblatt.com. Greulich ist Einkaufsleiter bei Vemag (Verden/Aller), Projektstart 2023, Ziel: Datentransparenz über alle Produktkategorien und Lieferanten.
  • LkSG-Bußgelder: Gesetz über die unternehmerischen Sorgfaltspflichten in Lieferketten (LkSG), § 24 (Bußgeldvorschriften), BGBl. I 2021, Nr. 46, juris.bundesgesetzblatt.de. Bußgelder bis 2 % des weltweiten Jahresumsatzes, Vergabeausschluss bis drei Jahre.
  • Erfahrungswerte Implementierungszeiten und Kosten: Eigene Einschätzungen basierend auf öffentlich verfügbaren Angaben zu Tacto, riskmethods/Sphera und SAP Ariba (Stand Mai 2026).

Du willst wissen, ob eure ERP-Daten als Basis ausreichen — und welcher Ansatz für euer Lieferantennetzwerk sinnvoll ist? Meld dich — das klären wir gemeinsam in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar