Zum Inhalt springen
Maschinenbau lieferantenbewertungeinkaufqualitaetsmanagement

Lieferantenbewertung automatisieren

KI aggregiert Liefertreue, Qualitätskennzahlen und Reklamationsdaten kontinuierlich aus dem ERP — und erstellt standardisierte Lieferantenberichte statt manueller Excel-Auswertungen einmal im Jahr.

⚡ Auf einen Blick
Problem
Lieferantenbewertungen laufen einmal jährlich, basieren auf unvollständigen Daten und binden 2–5 Arbeitstage je Zyklus im Einkauf.
KI-Lösung
Automatische Datenaggregation aus ERP, Wareneingang und Reklamationsmanagement — LLM erstellt Bewertungsberichte mit konkreten Handlungsempfehlungen.
Typischer Nutzen
Bewertungszyklen von jährlich auf quartalsweise möglich. Einkauf spart 70–80 % der manuellen Auswertungszeit je Zyklus.
Setup-Zeit
6–12 Wochen bei sauberem ERP, 3–6 Monate bei Datenproblemen
Kosteneinschätzung
Investition in Tools, keine direkten Einsparungen — ROI über Zeit
ERP-Datenintegration + LLM-Reporting (Tacto, SAP Ariba, Power BI + LLM-Schicht)
Worum geht's?

Es ist Anfang Februar.

Marcus Berger, Einkaufsleiter bei einem mittelständischen Sondermaschinenbauer in Bayern, weiß genau, was die nächsten drei Wochen bedeuten: der jährliche Lieferantenbewertungszyklus. 120 aktive Lieferanten. Er öffnet das Excel-Template, das sein Vorgänger 2018 angelegt hat. Dann öffnet er die SAP-Transaktion ME61, das Qualitätsmanagementsystem und die Reklamationsübersicht — drei verschiedene Systeme, die nicht miteinander reden.

Er fängt an, Daten zusammenzutragen. Liefertreue aus SAP, Qualitätsrate aus dem QM-Tool, Anzahl der 8D-Reports aus der Reklamationsliste. Manche Felder stimmen nicht überein — ein Lieferant taucht in SAP unter zwei verschiedenen Nummern auf, weil jemand vor Jahren eine Zweigniederlassung separat angelegt hat. Eines seiner Teammitglieder verbringt zwei Tage damit, Duplikate zu bereinigen.

Drei Wochen später liegt der Bericht vor. Vierzig Lieferanten haben einen kritischen Status. Zwölf davon waren es auch letztes Jahr. Was in der Zwischenzeit passiert ist — ob sich etwas verbessert hat, ob es einen Trend gibt — steht nicht im Bericht. Dafür gab die Zeit nicht.

Das ist kein Ausnahmefall. Laut einer Erhebung von erp-management.de bewerten 82 Prozent der Unternehmen nur einen Teil ihrer Lieferantenbasis überhaupt, weil der manuelle Aufwand den Rest schlicht verhindert.

Das echte Ausmaß des Problems

Die Lieferantenbewertung gehört in jedem ISO-9001-zertifizierten Maschinenbauunternehmen zum Pflichtprogramm — und ist trotzdem in den meisten Betrieben ein Schmerzpunkt. Die Ursache ist strukturell: Die Daten, die für eine fundierte Bewertung gebraucht werden, liegen in verschiedenen Systemen, werden unterschiedlich gepflegt und lassen sich nicht auf Knopfdruck zusammenführen.

Was das in Zahlen bedeutet:

  • 82 Prozent der Unternehmen bewerten nur einen Teil ihrer Lieferanten, weil der Aufwand für eine vollständige Erhebung zu hoch ist (erp-management.de, Studie Datenqualität im Lieferanten-Risikomanagement)
  • Durchschnittlich 4,5 Systeme verwalten Lieferantendaten in einem Industriebetrieb — und die meisten davon sind nicht miteinander verknüpft (ebd.)
  • 2–5 Arbeitstage kostet ein vollständiger Bewertungszyklus bei 50–150 Lieferanten, wenn er manuell durchgeführt wird — und das typischerweise nur einmal im Jahr
  • Wer jährlich bewertet, sieht Trends zu spät: Ein Lieferant, der im März anfängt schlechter zu werden, fällt erst im nächsten Februar im Bericht auf — wenn der Schaden schon eingetreten ist

Das Besondere an diesem Usecase: Der Engpass liegt nicht in der Analyse, sondern in der Datenbeschaffung. Wer die Daten einmal strukturiert und automatisch fließen lässt, gewinnt nicht nur Zeit — er gewinnt eine Bewertungsdichte, die mit manuellem Arbeiten nie erreichbar wäre.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne AutomatisierungMit automatisierter Bewertung
BewertungsfrequenzJährlichQuartalsweise oder monatlich möglich
Zeitaufwand je Zyklus2–5 Arbeitstage intern2–4 Stunden für Review + Freigabe
Abdeckung des LieferantenportfoliosTypisch 50–70 %100 % (alle Lieferanten mit ERP-Aktivität)
Reaktionszeit bei Qualitätsverschlechterung6–12 Monate (bis zum nächsten Zyklus)4–6 Wochen (beim nächsten Quartalsdurchlauf)
DatenbasisManuell zusammengeführte StichprobenVollständige Transaktionsdaten aus ERP + QM
Dokumentationsqualität für ISO-AuditHängt von Sorgfalt des Bearbeiters abStandardisierter Bericht, revisionssicher
LiefertrendanalysePunktmessung je ZyklusAutomatisches Trending über alle Perioden

Die Qualitätsverbesserung durch Automatisierung passiert nicht durch ein besseres Scoring-Modell — sie passiert, weil der Zyklus häufiger läuft und alle Lieferanten erfasst werden, nicht nur die, für die gerade Zeit war.

Einschätzung auf einen Blick

Zeitersparnis — hoch (4/5) Der Bewertungszyklus schrumpft von 2–5 Tagen auf 2–4 Stunden für Sichtung und Freigabe. Das ist ein echter Hebel für Einkaufsteams mit wenig Kapazität. Warum nicht 5? Weil der initiale Aufwand für Datenintegration und Konfiguration erheblich ist — und weil der Aufwand für die Datenpflege (Stammdaten, Dubletten, Fehlbuchungen) dauerhaft bleibt. Die Zeitersparnis tritt verlässlich ein, aber erst ab dem zweiten oder dritten automatisierten Zyklus.

Kosteneinsparung — begrenzt (2/5) Die direkte Kosteneinsparung durch automatisierte Lieferantenbewertung ist gering: Du sparst Personalzeit im Einkauf, aber keine direkten Materialkosten. Der wirtschaftliche Nutzen ist mittelbar — bessere Lieferantensteuerung reduziert Qualitätsmängel und Lieferverzögerungen, die sich in Produktionsunterbrechungen und Nacharbeit niederschlagen. Dieser Effekt ist real, aber schwer in einer einzelnen Zahl zu isolieren. Unter den Maschinenbau-Anwendungsfällen einer der schwächeren direkten Kostenhebel.

Schnelle Umsetzung — gut (4/5) Wer ein sauberes ERP hat und einen Anbieter wie Tacto nutzt, kann in 6–10 Wochen zur ersten automatisierten Bewertungsrunde kommen. Schlechter steht es aus, wenn das SAP über 15 Jahre stark individualisiert wurde — dann sind 3–6 Monate für die Datenextraktion allein realistisch. Auch Power BI mit einer LLM-Schicht ist bei vorhandener M365-Infrastruktur schnell startklar. Score 4 gilt für den Normalfall, nicht für stark fragmentierte ERP-Landschaften.

ROI-Sicherheit — mittel (3/5) Die Zeitersparnis ist klar messbar — Stunden je Zyklus vor und nach der Einführung. Schwieriger zu quantifizieren: ob bessere Lieferantensteuerung tatsächlich Qualitätsmängel reduziert hat, und ob das an der Bewertung oder an anderen Faktoren liegt. Für ISO-9001-Audits ist der Compliance-Nutzen eindeutig — dort ist die Dokumentation Pflicht, unabhängig vom ROI. Dieser indirekte Wert ist real, aber in einem Business Case schwer bezifferbar.

Skalierbarkeit — sehr hoch (5/5) Hier liegt der stärkste Vorteil: Einmal eingerichtet, läuft das System für 50 oder 500 Lieferanten mit identischem Aufwand. Wenn das Unternehmen wächst oder neue Lieferanten ins Portfolio kommen, sind sie automatisch Teil des nächsten Zyklus — ohne dass jemand mehr Zeit investiert. Das ist der Kern-Skalierungsvorteil dieses Anwendungsfalls.

Richtwerte — stark abhängig von ERP-Reife, Unternehmensgröße und vorhandener Systemlandschaft.

Was das System konkret macht

Das technische Prinzip ist einfacher als es klingt: Das System zieht aus dem ERP die transaktionalen Daten, die ohnehin schon gebucht werden — Wareneingänge, Rechnungsprüfungen, Qualitätsmeldungen, Liefertermin-Soll-Ist-Vergleiche — und verdichtet sie zu einem Score je Lieferant.

Die vier Kernkennzahlen, die sich zuverlässig aus ERP-Bewegungsdaten extrahieren lassen:

  1. Liefertreue: Verhältnis von zugesagtem zu tatsächlichem Liefertermin — automatisch buchungsbasiert aus Bestellung und Wareneingang
  2. Mengentreue: Verhältnis von bestellter zu gelieferter Menge inkl. Teillieferungen
  3. Qualitätsrate: Anteil der Wareneingangspositionen ohne Qualitätsbeanstandung aus dem QM-Modul
  4. Reklamationsfrequenz: Anzahl der ausgelösten 8D-Reports oder Qualitätsmeldungen je Lieferant und Periode

Auf diesen strukturierten Kennzahlen setzt das LLM auf — nicht um die Zahlen zu berechnen, sondern um sie zu interpretieren und in einen narrativen Bericht zu verwandeln. Ein LLM-gestützter Bericht fasst zusammen, was die Daten zeigen, nennt den Trend gegenüber der Vorperiode, markiert kritische Lieferanten automatisch und schlägt konkrete nächste Schritte vor (Lieferantengespräch, Eskalation, Qualitätssicherungsmaßnahme).

Der Mehrwert des Machine Learning-Layers entsteht bei ausreichender Datenbasis: Das System erkennt Muster, die im manuellen Excel nicht sichtbar werden — etwa dass ein Lieferant in der zweiten Jahreshälfte systematisch schlechter performt, oder dass Qualitätsprobleme bei einem bestimmten Material-Cluster konzentriert sind, nicht bei einem einzelnen Lieferanten.

Was das System nicht macht: Es ersetzt das Einkäufer-Urteil nicht. Ob ein Lieferant mit temporär schlechter Liefertreue entschuldbare Gründe hat (Rohstoffkrise, Produktionsumstellung), entscheidet weiterhin ein Mensch. Das System liefert die Faktenbasis — das Gespräch führt der Einkauf.

Datenqualität als Voraussetzung

Hier liegt der Elefant im Raum, der in den meisten KI-Einkauf-Pitches verschwiegen wird: Das Scoring-Modell ist das einfachere Problem. Die Herausforderung ist die Datenextraktion.

Maschinenbauunternehmen, die seit 10–20 Jahren SAP betreiben, haben in der Regel stark individualisierte Systeme. Module wurden nachgerüstet, Schnittstellen selbst gebaut, Felder zweckentfremdet, Nummernkreise mehrfach vergeben. Das Ergebnis: Was auf dem Papier “Wareneingangsdaten” heißt, ist in Wirklichkeit ein Flickenteppich aus halbautomatischen Buchungen, manuell korrigierten Einträgen und historischen Altlasten.

Konkrete Probleme, die in fast jedem Projekt auftauchen:

  • Lieferantendubletten: Ein Lieferant ist unter zwei oder drei Nummern gebucht (Niederlassungen, Akquisitionen, alte vs. neue Nummerierung). Scores werden auf Splitdaten berechnet — beide Nummern sehen besser aus als sie sind
  • Fehlende Materialzuordnungen: Wareneingangsbuchungen ohne vollständige Bestellreferenz lassen sich keiner Bestellung und keinem Liefertermin zuordnen — sie fallen aus der Liefertreuemessung heraus
  • QM-Daten nicht buchungsseitig: Qualitätsmeldungen werden in einem getrennten System erfasst, das keine automatische ERP-Gegenbuchung hat — manuelle Verknüpfung nötig
  • Historische Fehlbuchungen: Altbestände, die nie bereinigt wurden, verzerren Langzeittrends

Was das bedeutet: Bevor der erste automatisierte Bericht läuft, ist Datenbereinigung und Stammdatenharmonisierung nötig. Bei stark individualisierten SAP-Systemen dauert diese Phase laut Erfahrungsberichten von Implementierungspartnern 3–6 Monate — nicht 3–6 Wochen.

Die ehrliche Faustregel: Wer seine aktuellen Lieferantenbewertungen aus SAP ME61 schon heute halbwegs verlässlich ziehen kann, hat in 6–10 Wochen einen automatisierten Prozess. Wer bei der Frage “Welche Liefertreue hat Lieferant X laut SAP?” keine einheitliche Antwort bekommt, ist zuerst ein Datenprojekt und dann ein KI-Projekt.

Was ISO 9001 und IATF 16949 von euch verlangen

Die Lieferantenbewertung ist in der deutschen Maschinenbaubranche kein optionales Best-Practice-Instrument — sie ist normativ gefordert.

ISO 9001:2015, Abschnitt 8.4.1 (Steuerung extern bereitgestellter Prozesse, Produkte und Dienstleistungen) schreibt vor, dass das Unternehmen Kriterien für die Bewertung und Auswahl externer Anbieter festlegen und dokumentierte Informationen über die Ergebnisse der Bewertung und über erforderliche Maßnahmen aufbewahren muss. Das Schlüsselwort ist “dokumentierte Informationen” — mündliche Eindrücke und nicht archivierte Excel-Sheets genügen im Audit nicht.

IATF 16949 (relevant für alle Maschinenbauunternehmen, die Automotive-Zulieferer direkt oder indirekt beliefern) geht weiter: Es verlangt eine kaskadierte Lieferantenentwicklung — das Unternehmen muss nicht nur seine eigenen Tier-1-Lieferanten bewerten, sondern sicherstellen, dass auch diese ihre Lieferanten qualifiziert steuern. Im Audit wird gefragt, wie oft Bewertungen durchgeführt werden, welche Kriterien gelten und welche Maßnahmen aus schlechten Bewertungen resultiert haben.

Was das für die Automatisierung bedeutet: Ein automatisiertes System erfüllt die Compliance-Anforderungen nicht einfach durch sein Vorhandensein — es muss die richtigen Dokumentationsformate produzieren. Der Ausgabebericht muss revisionssicher archiviert, mit Datum und verantwortlicher Person gestempelt sein und die verwendeten Bewertungskriterien enthalten. Das ist konfigurierbar, muss aber explizit in der Systemeinrichtung adressiert werden.

Der Compliance-Gewinn ist real: Ein automatisierter, quartalsweiser Zyklus mit revisionssicherer Dokumentation ist im ISO-Audit deutlich besser vertretbar als ein jährlicher Zyklus mit Excel-Dateien, bei dem nicht klar ist, wer welche Version wann geändert hat.

Konkrete Werkzeuge — was wann passt

Tacto — für den deutschen Industriemittelstand Tacto ist ein Münchner SRM-Anbieter, der auf Industriemittelstand in Deutschland spezialisiert ist. Das Tool bindet SAP, Microsoft Dynamics und proAlpha an, normiert die ERP-Daten in einem eigenen Datenlayer und liefert Lieferantenscoring, Spend-Analyse und Compliance-Monitoring auf einer Oberfläche. Besonders relevant: EU-Hosting, deutscher Support und ein Onboarding-Ansatz, der explizit auf fragmentierte mittelständische ERP-Landschaften ausgelegt ist — kein 12-Monats-Implementierungsprojekt. Jahreslizenzen im vier- bis fünfstelligen Bereich, individuell verhandelt. Sinnvoll für Unternehmen ab ca. 20–30 strategischen Lieferanten und einem Beschaffungsvolumen ab 5–10 Mio. Euro.

SAP Ariba — für SAP-Kunden mit Einkaufsvolumen >50 Mio. Euro SAP Ariba ist die vollständigste Source-to-Pay-Suite für Unternehmen, die bereits in der SAP-Welt leben. Ariba Supplier Performance Management bewertet Lieferanten kontinuierlich anhand von Scorecard-Dimensionen und integriert das direkt in S/4HANA. Die Stärke ist die Prozesskette ohne Systembruch — Bewertung, Eskalation, Vertragsverlängerung und Audit-Trail alles in einer Plattform. Der Preis dafür: Enterprise-Implementierungsprojekte dauern 6–18 Monate und kosten inklusive Beratung typischerweise 300.000 bis 800.000 Euro. Für KMU ohne SAP-Basis nicht geeignet.

Microsoft Power BI + LLM-Schicht — für M365-Nutzer mit Budget für einen Eigenentwicklungsanteil Wer Microsoft 365 betreibt und ein SAP-System hat, kann über Power BI Direktkonnektoren eine Lieferantenscoring-Lösung ohne zusätzliche Procurement-Plattform aufbauen. Power BI Pro kostet 12,10 Euro pro Nutzer und Monat; die LLM-Schicht für die Berichtsgenerierung kommt über Azure OpenAI oder ChatGPT. Der Vorteil: Volle Datenkontrolle, keine Drittanbieter-Abhängigkeit, EU-Hosting durch M365. Der Nachteil: Dieser Ansatz erfordert einen internen Data-Analysten oder externen Implementierungspartner — er ist kein Produkt, das man kaufen und in drei Wochen live schalten kann. Erfahrungsgemäß 60–120 Tage Aufbauzeit, dann aber maximal flexibel.

Jaggaer ONE — für Unternehmen im oberen Mittelstand mit komplexen Sourcing-Anforderungen Jaggaer ist eine US-amerikanische Source-to-Contract-Plattform mit starkem Lieferantenmanagement-Modul. Besonders bei Unternehmen mit intensiven Ausschreibungszyklen und komplexen Lieferanten-Scorecard-Anforderungen (Nachhaltigkeit, Innovationsfähigkeit, geopolitisches Risiko) ist Jaggaer oft stärker als SAP Ariba. Jaggaer Copilot (seit 2024) unterstützt bei der Bewertungsauswertung via natürlicher Sprache. Einstiegspreise ab ca. 45.000 USD/Jahr. Kein deutschsprachiger Support im SMB-Segment, Onboarding typisch 3–6 Monate.

Zusammenfassung: Wann welcher Ansatz

  • Industriemittelstand, SAP oder Dynamics, deutschsprachige Betreuung gewünscht → Tacto
  • SAP-Konzern oder Großmittelstand mit eigenem IT-Team → SAP Ariba
  • M365-Umgebung, Eigenentwicklung möglich → Power BI + LLM-Schicht
  • Oberer Mittelstand mit komplexen Ausschreibungszyklen → Jaggaer
  • Lieferkettenrisiken strategisch überwachen (ergänzend) → Resilinc

Datenschutz und Datenhaltung

Lieferantenbewertungsdaten sind aus DSGVO-Sicht zweigeteilt: Die Leistungsdaten der Lieferantenunternehmen selbst (Liefertreue, Qualitätsrate) sind keine personenbezogenen Daten. Sobald aber Kontaktpersonen, Ansprechpartner oder individuelle Leistungsbeurteilungen einzelner Mitarbeitender des Lieferanten verarbeitet werden, greift Art. 4 Nr. 1 DSGVO.

Für die ERP-seitige Datenaggregation (rein betriebliche Kennzahlen) ist das kein Thema. Wenn die KI-Schicht aber Freitexte aus Qualitätsmeldungen auswertet — 8D-Reports, Reklamationsbeschreibungen, Kommunikation mit dem Lieferanten — können dort durchaus personenbezogene Daten enthalten sein.

Konkrete Empfehlungen:

  • Tacto: EU-Datenhosting, deutsches Unternehmen, AVV standardmäßig Teil des Vertrags — empfehlenswert für DSGVO-sensible Umgebungen
  • SAP Ariba: EU-Rechenzentren verfügbar (Frankfurt), AVV Standardbestandteil des SAP-Vertrags — EU-Datenhaltung explizit vertraglich festschreiben
  • Power BI: M365 EU Data Boundary verfügbar — für Microsoft-Kunden die unkomplizierteste EU-Hosting-Option
  • LLM-API-Calls: Wenn Freitexte aus Reklamationen an externe LLMs geschickt werden, muss das über ein EU-kompatibles Modell laufen (Azure OpenAI in EU-Region oder Anthropic über AWS Bedrock Frankfurt) — oder Freitexte werden vor der Übergabe an das Modell anonymisiert

Was es kostet — realistisch gerechnet

Einmalige Aufbaukosten

  • Datenbereinigung und Stammdatenharmonisierung im ERP: 20–80 Personentage intern oder extern (je nach ERP-Zustand); externer Berater kostet 1.200–1.800 Euro/Tag → Bandbreite 25.000–120.000 Euro, wenn extern vergeben
  • Tool-Implementierung: Bei Tacto und vergleichbaren Plattformen typisch 5–15 Beratertage Onboarding zusätzlich zur Lizenz; bei Power BI-Eigenentwicklung 20–60 Entwicklertage
  • Gesamt Setup (ohne Bereinigung): 10.000–50.000 Euro, stark von Komplexität abhängig

Laufende Kosten (monatlich)

  • Tacto: vier- bis fünfstellige Jahreslizenz, individuell → ergibt typisch 1.500–5.000 Euro/Monat
  • SAP Ariba Supplier Management: Enterprise-Lizenz ab ca. 80.000 Euro/Jahr, plus Implementierungskosten
  • Power BI Pro: 12,10 Euro/Nutzer/Monat; LLM-API-Kosten ca. 50–200 Euro/Monat für typische Reportingvolumina
  • Jaggaer ONE: ab ca. 45.000 USD/Jahr

Nutzen dagegen gerechnet Ein Einkaufsteam mit zwei Personen, das pro Bewertungszyklus bisher 3 Arbeitstage aufgewendet hat (= 6 Personentage), bei vier Zyklen im Jahr = 24 Personentage. Bei einem internen Tagessatz von 450–700 Euro: 10.800 bis 16.800 Euro eingesparte Personalzeit pro Jahr — nur durch die Zeiteinsparung im Zyklus selbst.

Hinzu kommen: Frühere Erkennung von Lieferantenproblemen (Produktionsunterbrechungen sind teurer als jede Software), bessere ISO-Audit-Vorbereitung und systematischere Lieferantenentwicklung. Diese Effekte sind real, aber nur indirekt quantifizierbar.

Was du dagegenrechnen kannst: Im konservativen Szenario (Zeitersparnis allein, keine Qualitätseffekte) amortisiert sich eine Tacto-Lizenz im unteren Bereich bei einem Einkaufsteam mit zwei Personen in ca. 12–18 Monaten. Bei Power BI lohnt sich die Investition früher, wenn die interne Entwicklungskapazität schon vorhanden ist.

Typische Einstiegsfehler

1. Mit der KI-Schicht anfangen statt mit den Daten. Der häufigste Fehler ist, ein Lieferantenscoring-Tool einzuführen, ohne vorher zu prüfen, ob die ERP-Daten überhaupt eine verlässliche Grundlage bieten. Das Ergebnis: Das System rechnet Scores auf Basis von Buchungsfehlern und Dubletten — und produziert Bewertungen, die die Realität verzerren. Bevor du ein Tool kaufst, lass dir eine Stichprobenauswertung aus deinem ERP ziehen: Welche Liefertreue hat dein größter Lieferant laut SAP ME61? Stimmt das mit dem überein, was dein Einkauf erlebt? Wenn nicht, weißt du, womit du anfangen musst.

2. Den Bewertungsrhythmus zu ambitioniert starten. Von “einmal im Jahr” sofort auf “monatlich” zu schalten ist selten produktiv. Die Kapazität für Reviews, Eskalationsgespräche und Korrekturmaßnahmen muss mitgedacht werden. Wer automatisiert quartalsweise bewertet und bei zehn Lieferanten kritische Scores sieht, muss auch die Zeit haben, mit diesen zehn Lieferanten zu sprechen. Sonst ist die Bewertung nur ein Dokument für die Schublade.

3. Die Bewertungskriterien nicht transparent mit den Lieferanten kommunizieren. Lieferanten sollten wissen, nach welchen Kriterien sie bewertet werden — Überraschungen im Jahresgespräch führen zu Vertrauensverlust. Wer seine Kriterien automatisiert, sollte sie gleichzeitig transparenter machen: Kommuniziere die Scorecard, erkläre die Gewichtung. Das verbessert die Lieferantenbeziehung statt sie zu belasten.

4. Das System läuft, aber niemand macht etwas mit den Ergebnissen. Das ist der gefährlichste Langzeitfehler. Ein automatisierter Bericht, der auf einem Server liegt und niemanden alarmiert, hat keinen Wert. Die technische Einrichtung des Systems muss mit der Einrichtung klarer Eskalationsprozesse verbunden sein: Wer erhält welchen Alert bei welchem Score-Threshold? Wer führt das Gespräch mit dem kritischen Lieferanten? Wer genehmigt die Delistung? Ohne diese Antworten ist die Automatisierung ein teures Reporting-Tool — kein Steuerungsinstrument.

Was mit der Einführung wirklich passiert — und was nicht

Die Erwartung ist oft: Wir führen das Tool ein, es rechnet automatisch, und der Einkauf spart drei Wochen im Jahr. Die Realität in den ersten sechs Monaten sieht anders aus.

Phase 1 (Wochen 1–8): Datenprobleme ans Licht. Das Projekt startet mit einer unerwarteten Entdeckung: Das ERP ist nicht so ordentlich, wie gedacht. Dubletten, Fehlbuchungen, fehlende Referenzen — all das kommt in den ersten Wochen auf den Tisch. Das ist kein Zeichen, dass das Projekt falsch aufgesetzt ist. Es ist ein Zeichen, dass es nötig war. Dieser Teil des Projekts fühlt sich nicht nach “KI-Einführung” an — er fühlt sich nach Datenbankarbeit an. Das ist normal.

Phase 2 (Monat 2–4): Die erste automatisierte Runde. Der erste vollautomatische Bewertungslauf produziert Ergebnisse, die überprüft werden müssen. Nicht alle Scores stimmen sofort. Manche Lieferanten erscheinen zu gut, weil bestimmte Buchungsarten noch nicht erfasst sind. Das Feintuning der Gewichtungen kostet Zeit. Erwarte, dass die erste automatische Bewertung noch einen halben Tag manuellen Review braucht — das ist kein Rückschritt, sondern Teil des Kalibrierungsprozesses.

Was nicht passiert: Das System übernimmt keine Lieferantenentscheidungen. Es erkennt keinen guten Lieferanten, den der Einkauf übersehen hatte. Es identifiziert keine neuen Einsparpotenziale. Das sind alles andere Anwendungsfälle. Wer das von einem Scoring-Tool erwartet, wird enttäuscht sein. Wer es als strukturierte Grundlage für bessere Gespräche mit Lieferanten versteht, wird es schätzen.

Typisches Widerstandsmuster: Ältere Einkäufer kennen “ihre” Lieferanten oft aus jahrelanger Zusammenarbeit und vertrauen dem Score weniger als ihrem Bauchgefühl. Das ist nicht dumm — Erfahrung ist wertvoll. Hilfreicher als Überzeugungsarbeit ist es, beide Wahrheiten nebeneinander zu stellen: “Das System sagt Liefertreue 68 %. Du sagst, der Grund dafür ist die Umstellungsphase im Q3. Lass uns das im nächsten Gespräch mit dem Lieferanten dokumentieren.” Das System wird zum Gesprächsprotokoll, nicht zum Richter.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
ERP-Daten-AuditWoche 1–2Stichprobe ziehen, Datenqualität bewerten, Dubletten und Fehlbuchungen quantifizierenDatenqualität ist schlechter als erwartet → Zeitplan verlängert sich
Datenbereinigungs-SprintWoche 2–6 (oder länger)Stammdaten harmonisieren, Dubletten bereinigen, Buchungsregeln klärenBei stark individualisiertem SAP: externe SAP-Berater nötig, Kosten steigen
Tool-Auswahl und ImplementierungWoche 4–8 (parallel möglich)Anbieter evaluieren, Demoinstanzen testen, Konnektoren einrichtenVendor Lock-in, wenn Anbindung proprietär und Wechsel teuer
Konfiguration der ScorecardWoche 6–10Bewertungskriterien und Gewichtungen definieren, ISO-9001-Audit-Anforderungen prüfenZu viele interne Stakeholder ohne Einigung → Scoring bleibt generisch
Pilotlauf und KalibrierungWoche 8–12Ersten automatischen Zyklus durchführen, Ergebnisse mit manuellem Vergleich validierenAbweichungen zwischen System und Realität → Datenpflege-Runde nötig
Rollout + EskalationsprozesseAb Woche 12Regelmäßigen Rhythmus etablieren, Alerting einrichten, Review-Prozess dokumentierenSystem läuft, aber niemand handelt auf Ergebnisse → Adoption-Problem

Gesamtdauer bis produktivem Einsatz: Bei sauberem ERP 8–12 Wochen. Bei fragmentierter ERP-Landschaft realistisch 4–6 Monate bis zur zuverlässigen ersten Runde.

Häufige Einwände — und was dahintersteckt

“Wir kennen unsere Lieferanten — wir brauchen kein System dafür.” Stimmt für den Stamm von Tier-1-Lieferanten, die jeder Einkäufer persönlich kennt. Stimmt nicht für die 60–80 Prozent des Portfolios, die selten genug bestellt werden, um im aktiven Gedächtnis zu bleiben. Genau die werden in manuellen Prozessen überbewertet — weil kein schlechtes Erlebnis erinnerlich ist, obwohl die Daten einen Trend zeigen würden. Das System ist kein Ersatz für Beziehungswissen — es ist die Ergänzung für alles, was sich im Kopf nicht hält.

“Unsere ISO-9001-Bewertung haben wir immer gut bestanden.” Das kann sein. Die Frage ist, ob der Prüfer bei einer zukünftigen Erweiterung der Anforderungen (IATF 16949, CSRD-Lieferkettendaten, Lieferkettensorgfaltspflichtengesetz) noch zufrieden ist. Automatisierte Systeme sind zukunftssicherer als manuelle Prozesse, wenn regulatorische Anforderungen steigen — und sie steigen gerade in der deutschen Industrie. Ein System, das heute ausreicht, muss in zwei Jahren erweitert werden; besser, die Infrastruktur steht dann bereits.

“Das ist nichts für uns — wir sind zu klein.” Das kommt auf die Lieferantenanzahl an, nicht auf die Unternehmensgröße. Ein Betrieb mit 30 Mitarbeitenden und 80 aktiven Lieferanten hat denselben Aufwand für manuelle Bewertungen wie ein Betrieb mit 300 Mitarbeitenden. Die Frage ist: Hat der kleinere Betrieb eine Person, die zwei Wochen im Jahr für das Thema freistellen kann? Wenn nicht, ist Automatisierung auch hier sinnvoll — aber mit einer schlanken Lösung (Power BI + LLM), nicht mit einer Enterprise-Plattform.

Woran du merkst, dass das zu dir passt

Das spricht für eine Einführung:

  • Du hast mehr als 30 aktive Lieferanten und führst ihre Bewertung aktuell jährlich oder seltener durch
  • Dein Einkauf verbringt mehr als einen Arbeitstag pro Monat mit dem Zusammentragen von Lieferantendaten aus verschiedenen Systemen
  • Du hast in letzter Zeit Überraschungen bei Lieferanten erlebt — Probleme, deren frühes Signal du übersehen hast, weil Bewertungsdaten nur einmal im Jahr auf dem Tisch lagen
  • Du trägst ISO-9001-Verantwortung und deine aktuelle Dokumentation wäre im Audit ohne größere Nacharbeit nicht belastbar
  • Du belieferst die Automobilindustrie und willst IATF-16949-Anforderungen systematischer erfüllen

Drei harte Ausschlusskriterien:

  1. Weniger als 25–30 strategische Lieferanten mit nennenswertem Bestellvolumen. Bei einem kleinen Portfolio ist ein gut strukturiertes quartalsweises Excel mit zwei bis drei Stunden Aufwand die effizientere Lösung. Der Implementierungsaufwand für ein automatisiertes System amortisiert sich nicht.

  2. Kein standardisierter Wareneingangs- und QM-Prozess im ERP. Wenn Qualitätsmeldungen nicht systematisch in SAP oder einem angebundenen QM-Tool gebucht werden, hat das System keine Datenbasis für die Qualitätskennzahl. Wer erst Prozesse standardisieren müsste, sollte das unabhängig vom KI-Projekt tun — und danach die Automatisierung angehen.

  3. ERP stark individualisiert ohne dokumentiertes Datenschema, kein SAP-internes Know-how im Team. Wenn niemand im Unternehmen weiß, welche SAP-Transaktion die Liefertreue abbildet oder wo Qualitätsmeldungen gebucht werden, ist das kein “kurzes Onboarding beim Anbieter” — das ist ein Consulting-Projekt von 3–6 Monaten. Das muss im Budget und im Zeitplan stehen, bevor die Entscheidung fällt.

Das kannst du heute noch tun

Starte mit einem kostenlosen Datencheck statt mit einem Tool-Kauf. Öffne SAP ME61 (oder das Äquivalent in deinem ERP) und lass für fünf deiner Hauptlieferanten die automatische Lieferantenbewertung der letzten 12 Monate laufen. Vergleiche das Ergebnis mit dem, was dein Einkaufsteam aus dem Bauch heraus sagen würde.

Wenn die Ergebnisse übereinstimmen: Dein ERP ist eine gute Datenbasis — der Schritt zur Automatisierung ist technisch machbar.

Wenn die Ergebnisse divergieren: Finde heraus warum. Fehlbuchungen? Dublettenprobleme? Unvollständige Daten? Die Antwort sagt dir, wie viel Datenarbeit vor der KI-Einführung liegt.

Parallel kannst du mit folgendem Prompt einen ersten Bewertungsbericht aus vorhandenen Daten erstellen — kein ERP-Connector nötig, nur eine Excel-Tabelle mit Lieferantendaten.

Lieferantenbewertung aus ERP-Daten
Du bist ein Einkaufsassistent für einen Maschinenbauer. Ich gebe dir Rohdaten zur Lieferantenperformance und du erstellst daraus einen strukturierten Bewertungsbericht. Die Daten kommen aus unserem ERP und umfassen folgende Spalten: [LIEFERANTENNAME] | [LIEFERTREUE in %] | [QUALITÄTSRATE in %] | [ANZAHL REKLAMATIONEN] | [OFFENE 8D-REPORTS] | [TREND ZUR VORPERIODE: besser/gleich/schlechter] Meine Daten: [HIER DEINE TABELLE EINFÜGEN — ca. 5-20 Lieferanten] Erstelle pro Lieferant: 1. Eine Ampelklassifikation (Grün / Gelb / Rot) basierend auf: Rot = Liefertreue <75% ODER Qualitätsrate <95% ODER >2 offene 8D-Reports; Gelb = Liefertreue 75-85% ODER Qualitätsrate 95-98%; Grün = alle Werte oberhalb 2. Eine 2-3-Satz-Einschätzung: Was zeigen die Daten? Was ist der Trend? 3. Einen konkreten empfohlenen nächsten Schritt (Gespräch ansetzen / Qualitätssicherungsmaßnahme / kein Handlungsbedarf) Abschluss: Eine Zusammenfassung, die ich direkt als Grundlage für ein Management-Reporting nutzen kann (max. 150 Wörter). Schreibe auf Deutsch. Bleib sachlich und faktenbasiert — keine Einschätzungen, die über die Daten hinausgehen.
Funktioniert mit ChatGPT, Claude, Gemini
Beispiel-Ausgabe

Mitarbeiter:in

Lieferant A GmbH | 91% | 98,2% | 1 | 0 | besser Müller Hydraulik | 72% | 94,5% | 4 | 2 | schlechter Berndt Präzision | 96% | 99,1% | 0 | 0 | gleich

KI-Assistent

**Lieferant A GmbH — Gelb** Liefertreue mit 91% im Gelbbereich, hat sich aber gegenüber der Vorperiode verbessert. Qualitätsrate und Reklamationsfrequenz unauffällig. → Empfehlung: Entwicklung beobachten, kein sofortiger Handlungsbedarf. Beim nächsten regulären Kontakt Lieferterminsituation ansprechen. **Müller Hydraulik — Rot** Kritische Bewertung: Liefertreue 72% (Schwellenwert unterschritten), Qualitätsrate knapp unter 95%, vier Reklamationen bei zwei noch offenen 8D-Reports — negative Trendentwicklung. → Empfehlung: Eskalationsgespräch innerhalb von 2 Wochen ansetzen. Gemeinsam Ursachenanalyse für Lieferverzögerungen klären, klaren Verbesserungsplan mit Meilensteinen vereinbaren. **Berndt Präzision — Grün** Sehr gute Performance in allen Kennzahlen, stabiler Trend. → Empfehlung: Kein Handlungsbedarf. Ggf. für strategische Partnerschaft oder Rahmenvertragsausbau vormerken. --- **Management-Zusammenfassung (Bewertungsrunde Q2 2026):** Von drei bewerteten Lieferanten erreicht einer (Berndt Präzision) grünen Status, einer (Lieferant A GmbH) gelben Status mit positivem Trend. Ein Lieferant (Müller Hydraulik) wurde als kritisch eingestuft und erfordert sofortige Maßnahmen. Eskalationsgespräch wurde für KW 21 geplant. Nächste vollständige Bewertungsrunde: Q3 2026.

Quellen & Methodik


Willst du wissen, ob deine ERP-Datenbasis für eine automatisierte Lieferantenbewertung reif genug ist — und welcher Ansatz zu deiner Infrastruktur passt? Schreib uns, wir helfen beim strukturierten Datencheck.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar