Lieferantenbewertung automatisieren
KI aggregiert Liefertreue, Qualitätskennzahlen und Reklamationsdaten kontinuierlich aus dem ERP — und erstellt standardisierte Lieferantenberichte statt manueller Excel-Auswertungen einmal im Jahr.
- Problem
- Lieferantenbewertungen laufen einmal jährlich, basieren auf unvollständigen Daten und binden 2–5 Arbeitstage je Zyklus im Einkauf.
- KI-Lösung
- Automatische Datenaggregation aus ERP, Wareneingang und Reklamationsmanagement — LLM erstellt Bewertungsberichte mit konkreten Handlungsempfehlungen.
- Typischer Nutzen
- Bewertungszyklen von jährlich auf quartalsweise möglich. Einkauf spart 70–80 % der manuellen Auswertungszeit je Zyklus.
- Setup-Zeit
- 6–12 Wochen bei sauberem ERP, 3–6 Monate bei Datenproblemen
- Kosteneinschätzung
- Investition in Tools, keine direkten Einsparungen — ROI über Zeit
Es ist Anfang Februar.
Marcus Berger, Einkaufsleiter bei einem mittelständischen Sondermaschinenbauer in Bayern, weiß genau, was die nächsten drei Wochen bedeuten: der jährliche Lieferantenbewertungszyklus. 120 aktive Lieferanten. Er öffnet das Excel-Template, das sein Vorgänger 2018 angelegt hat. Dann öffnet er die SAP-Transaktion ME61, das Qualitätsmanagementsystem und die Reklamationsübersicht — drei verschiedene Systeme, die nicht miteinander reden.
Er fängt an, Daten zusammenzutragen. Liefertreue aus SAP, Qualitätsrate aus dem QM-Tool, Anzahl der 8D-Reports aus der Reklamationsliste. Manche Felder stimmen nicht überein — ein Lieferant taucht in SAP unter zwei verschiedenen Nummern auf, weil jemand vor Jahren eine Zweigniederlassung separat angelegt hat. Eines seiner Teammitglieder verbringt zwei Tage damit, Duplikate zu bereinigen.
Drei Wochen später liegt der Bericht vor. Vierzig Lieferanten haben einen kritischen Status. Zwölf davon waren es auch letztes Jahr. Was in der Zwischenzeit passiert ist — ob sich etwas verbessert hat, ob es einen Trend gibt — steht nicht im Bericht. Dafür gab die Zeit nicht.
Das ist kein Ausnahmefall. Laut einer Erhebung von erp-management.de bewerten 82 Prozent der Unternehmen nur einen Teil ihrer Lieferantenbasis überhaupt, weil der manuelle Aufwand den Rest schlicht verhindert.
Das echte Ausmaß des Problems
Die Lieferantenbewertung gehört in jedem ISO-9001-zertifizierten Maschinenbauunternehmen zum Pflichtprogramm — und ist trotzdem in den meisten Betrieben ein Schmerzpunkt. Die Ursache ist strukturell: Die Daten, die für eine fundierte Bewertung gebraucht werden, liegen in verschiedenen Systemen, werden unterschiedlich gepflegt und lassen sich nicht auf Knopfdruck zusammenführen.
Was das in Zahlen bedeutet:
- 82 Prozent der Unternehmen bewerten nur einen Teil ihrer Lieferanten, weil der Aufwand für eine vollständige Erhebung zu hoch ist (erp-management.de, Studie Datenqualität im Lieferanten-Risikomanagement)
- Durchschnittlich 4,5 Systeme verwalten Lieferantendaten in einem Industriebetrieb — und die meisten davon sind nicht miteinander verknüpft (ebd.)
- 2–5 Arbeitstage kostet ein vollständiger Bewertungszyklus bei 50–150 Lieferanten, wenn er manuell durchgeführt wird — und das typischerweise nur einmal im Jahr
- Wer jährlich bewertet, sieht Trends zu spät: Ein Lieferant, der im März anfängt schlechter zu werden, fällt erst im nächsten Februar im Bericht auf — wenn der Schaden schon eingetreten ist
Das Besondere an diesem Usecase: Der Engpass liegt nicht in der Analyse, sondern in der Datenbeschaffung. Wer die Daten einmal strukturiert und automatisch fließen lässt, gewinnt nicht nur Zeit — er gewinnt eine Bewertungsdichte, die mit manuellem Arbeiten nie erreichbar wäre.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne Automatisierung | Mit automatisierter Bewertung |
|---|---|---|
| Bewertungsfrequenz | Jährlich | Quartalsweise oder monatlich möglich |
| Zeitaufwand je Zyklus | 2–5 Arbeitstage intern | 2–4 Stunden für Review + Freigabe |
| Abdeckung des Lieferantenportfolios | Typisch 50–70 % | 100 % (alle Lieferanten mit ERP-Aktivität) |
| Reaktionszeit bei Qualitätsverschlechterung | 6–12 Monate (bis zum nächsten Zyklus) | 4–6 Wochen (beim nächsten Quartalsdurchlauf) |
| Datenbasis | Manuell zusammengeführte Stichproben | Vollständige Transaktionsdaten aus ERP + QM |
| Dokumentationsqualität für ISO-Audit | Hängt von Sorgfalt des Bearbeiters ab | Standardisierter Bericht, revisionssicher |
| Liefertrendanalyse | Punktmessung je Zyklus | Automatisches Trending über alle Perioden |
Die Qualitätsverbesserung durch Automatisierung passiert nicht durch ein besseres Scoring-Modell — sie passiert, weil der Zyklus häufiger läuft und alle Lieferanten erfasst werden, nicht nur die, für die gerade Zeit war.
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) Der Bewertungszyklus schrumpft von 2–5 Tagen auf 2–4 Stunden für Sichtung und Freigabe. Das ist ein echter Hebel für Einkaufsteams mit wenig Kapazität. Warum nicht 5? Weil der initiale Aufwand für Datenintegration und Konfiguration erheblich ist — und weil der Aufwand für die Datenpflege (Stammdaten, Dubletten, Fehlbuchungen) dauerhaft bleibt. Die Zeitersparnis tritt verlässlich ein, aber erst ab dem zweiten oder dritten automatisierten Zyklus.
Kosteneinsparung — begrenzt (2/5) Die direkte Kosteneinsparung durch automatisierte Lieferantenbewertung ist gering: Du sparst Personalzeit im Einkauf, aber keine direkten Materialkosten. Der wirtschaftliche Nutzen ist mittelbar — bessere Lieferantensteuerung reduziert Qualitätsmängel und Lieferverzögerungen, die sich in Produktionsunterbrechungen und Nacharbeit niederschlagen. Dieser Effekt ist real, aber schwer in einer einzelnen Zahl zu isolieren. Unter den Maschinenbau-Anwendungsfällen einer der schwächeren direkten Kostenhebel.
Schnelle Umsetzung — gut (4/5) Wer ein sauberes ERP hat und einen Anbieter wie Tacto nutzt, kann in 6–10 Wochen zur ersten automatisierten Bewertungsrunde kommen. Schlechter steht es aus, wenn das SAP über 15 Jahre stark individualisiert wurde — dann sind 3–6 Monate für die Datenextraktion allein realistisch. Auch Power BI mit einer LLM-Schicht ist bei vorhandener M365-Infrastruktur schnell startklar. Score 4 gilt für den Normalfall, nicht für stark fragmentierte ERP-Landschaften.
ROI-Sicherheit — mittel (3/5) Die Zeitersparnis ist klar messbar — Stunden je Zyklus vor und nach der Einführung. Schwieriger zu quantifizieren: ob bessere Lieferantensteuerung tatsächlich Qualitätsmängel reduziert hat, und ob das an der Bewertung oder an anderen Faktoren liegt. Für ISO-9001-Audits ist der Compliance-Nutzen eindeutig — dort ist die Dokumentation Pflicht, unabhängig vom ROI. Dieser indirekte Wert ist real, aber in einem Business Case schwer bezifferbar.
Skalierbarkeit — sehr hoch (5/5) Hier liegt der stärkste Vorteil: Einmal eingerichtet, läuft das System für 50 oder 500 Lieferanten mit identischem Aufwand. Wenn das Unternehmen wächst oder neue Lieferanten ins Portfolio kommen, sind sie automatisch Teil des nächsten Zyklus — ohne dass jemand mehr Zeit investiert. Das ist der Kern-Skalierungsvorteil dieses Anwendungsfalls.
Richtwerte — stark abhängig von ERP-Reife, Unternehmensgröße und vorhandener Systemlandschaft.
Was das System konkret macht
Das technische Prinzip ist einfacher als es klingt: Das System zieht aus dem ERP die transaktionalen Daten, die ohnehin schon gebucht werden — Wareneingänge, Rechnungsprüfungen, Qualitätsmeldungen, Liefertermin-Soll-Ist-Vergleiche — und verdichtet sie zu einem Score je Lieferant.
Die vier Kernkennzahlen, die sich zuverlässig aus ERP-Bewegungsdaten extrahieren lassen:
- Liefertreue: Verhältnis von zugesagtem zu tatsächlichem Liefertermin — automatisch buchungsbasiert aus Bestellung und Wareneingang
- Mengentreue: Verhältnis von bestellter zu gelieferter Menge inkl. Teillieferungen
- Qualitätsrate: Anteil der Wareneingangspositionen ohne Qualitätsbeanstandung aus dem QM-Modul
- Reklamationsfrequenz: Anzahl der ausgelösten 8D-Reports oder Qualitätsmeldungen je Lieferant und Periode
Auf diesen strukturierten Kennzahlen setzt das LLM auf — nicht um die Zahlen zu berechnen, sondern um sie zu interpretieren und in einen narrativen Bericht zu verwandeln. Ein LLM-gestützter Bericht fasst zusammen, was die Daten zeigen, nennt den Trend gegenüber der Vorperiode, markiert kritische Lieferanten automatisch und schlägt konkrete nächste Schritte vor (Lieferantengespräch, Eskalation, Qualitätssicherungsmaßnahme).
Der Mehrwert des Machine Learning-Layers entsteht bei ausreichender Datenbasis: Das System erkennt Muster, die im manuellen Excel nicht sichtbar werden — etwa dass ein Lieferant in der zweiten Jahreshälfte systematisch schlechter performt, oder dass Qualitätsprobleme bei einem bestimmten Material-Cluster konzentriert sind, nicht bei einem einzelnen Lieferanten.
Was das System nicht macht: Es ersetzt das Einkäufer-Urteil nicht. Ob ein Lieferant mit temporär schlechter Liefertreue entschuldbare Gründe hat (Rohstoffkrise, Produktionsumstellung), entscheidet weiterhin ein Mensch. Das System liefert die Faktenbasis — das Gespräch führt der Einkauf.
Datenqualität als Voraussetzung
Hier liegt der Elefant im Raum, der in den meisten KI-Einkauf-Pitches verschwiegen wird: Das Scoring-Modell ist das einfachere Problem. Die Herausforderung ist die Datenextraktion.
Maschinenbauunternehmen, die seit 10–20 Jahren SAP betreiben, haben in der Regel stark individualisierte Systeme. Module wurden nachgerüstet, Schnittstellen selbst gebaut, Felder zweckentfremdet, Nummernkreise mehrfach vergeben. Das Ergebnis: Was auf dem Papier “Wareneingangsdaten” heißt, ist in Wirklichkeit ein Flickenteppich aus halbautomatischen Buchungen, manuell korrigierten Einträgen und historischen Altlasten.
Konkrete Probleme, die in fast jedem Projekt auftauchen:
- Lieferantendubletten: Ein Lieferant ist unter zwei oder drei Nummern gebucht (Niederlassungen, Akquisitionen, alte vs. neue Nummerierung). Scores werden auf Splitdaten berechnet — beide Nummern sehen besser aus als sie sind
- Fehlende Materialzuordnungen: Wareneingangsbuchungen ohne vollständige Bestellreferenz lassen sich keiner Bestellung und keinem Liefertermin zuordnen — sie fallen aus der Liefertreuemessung heraus
- QM-Daten nicht buchungsseitig: Qualitätsmeldungen werden in einem getrennten System erfasst, das keine automatische ERP-Gegenbuchung hat — manuelle Verknüpfung nötig
- Historische Fehlbuchungen: Altbestände, die nie bereinigt wurden, verzerren Langzeittrends
Was das bedeutet: Bevor der erste automatisierte Bericht läuft, ist Datenbereinigung und Stammdatenharmonisierung nötig. Bei stark individualisierten SAP-Systemen dauert diese Phase laut Erfahrungsberichten von Implementierungspartnern 3–6 Monate — nicht 3–6 Wochen.
Die ehrliche Faustregel: Wer seine aktuellen Lieferantenbewertungen aus SAP ME61 schon heute halbwegs verlässlich ziehen kann, hat in 6–10 Wochen einen automatisierten Prozess. Wer bei der Frage “Welche Liefertreue hat Lieferant X laut SAP?” keine einheitliche Antwort bekommt, ist zuerst ein Datenprojekt und dann ein KI-Projekt.
Was ISO 9001 und IATF 16949 von euch verlangen
Die Lieferantenbewertung ist in der deutschen Maschinenbaubranche kein optionales Best-Practice-Instrument — sie ist normativ gefordert.
ISO 9001:2015, Abschnitt 8.4.1 (Steuerung extern bereitgestellter Prozesse, Produkte und Dienstleistungen) schreibt vor, dass das Unternehmen Kriterien für die Bewertung und Auswahl externer Anbieter festlegen und dokumentierte Informationen über die Ergebnisse der Bewertung und über erforderliche Maßnahmen aufbewahren muss. Das Schlüsselwort ist “dokumentierte Informationen” — mündliche Eindrücke und nicht archivierte Excel-Sheets genügen im Audit nicht.
IATF 16949 (relevant für alle Maschinenbauunternehmen, die Automotive-Zulieferer direkt oder indirekt beliefern) geht weiter: Es verlangt eine kaskadierte Lieferantenentwicklung — das Unternehmen muss nicht nur seine eigenen Tier-1-Lieferanten bewerten, sondern sicherstellen, dass auch diese ihre Lieferanten qualifiziert steuern. Im Audit wird gefragt, wie oft Bewertungen durchgeführt werden, welche Kriterien gelten und welche Maßnahmen aus schlechten Bewertungen resultiert haben.
Was das für die Automatisierung bedeutet: Ein automatisiertes System erfüllt die Compliance-Anforderungen nicht einfach durch sein Vorhandensein — es muss die richtigen Dokumentationsformate produzieren. Der Ausgabebericht muss revisionssicher archiviert, mit Datum und verantwortlicher Person gestempelt sein und die verwendeten Bewertungskriterien enthalten. Das ist konfigurierbar, muss aber explizit in der Systemeinrichtung adressiert werden.
Der Compliance-Gewinn ist real: Ein automatisierter, quartalsweiser Zyklus mit revisionssicherer Dokumentation ist im ISO-Audit deutlich besser vertretbar als ein jährlicher Zyklus mit Excel-Dateien, bei dem nicht klar ist, wer welche Version wann geändert hat.
Konkrete Werkzeuge — was wann passt
Tacto — für den deutschen Industriemittelstand Tacto ist ein Münchner SRM-Anbieter, der auf Industriemittelstand in Deutschland spezialisiert ist. Das Tool bindet SAP, Microsoft Dynamics und proAlpha an, normiert die ERP-Daten in einem eigenen Datenlayer und liefert Lieferantenscoring, Spend-Analyse und Compliance-Monitoring auf einer Oberfläche. Besonders relevant: EU-Hosting, deutscher Support und ein Onboarding-Ansatz, der explizit auf fragmentierte mittelständische ERP-Landschaften ausgelegt ist — kein 12-Monats-Implementierungsprojekt. Jahreslizenzen im vier- bis fünfstelligen Bereich, individuell verhandelt. Sinnvoll für Unternehmen ab ca. 20–30 strategischen Lieferanten und einem Beschaffungsvolumen ab 5–10 Mio. Euro.
SAP Ariba — für SAP-Kunden mit Einkaufsvolumen >50 Mio. Euro SAP Ariba ist die vollständigste Source-to-Pay-Suite für Unternehmen, die bereits in der SAP-Welt leben. Ariba Supplier Performance Management bewertet Lieferanten kontinuierlich anhand von Scorecard-Dimensionen und integriert das direkt in S/4HANA. Die Stärke ist die Prozesskette ohne Systembruch — Bewertung, Eskalation, Vertragsverlängerung und Audit-Trail alles in einer Plattform. Der Preis dafür: Enterprise-Implementierungsprojekte dauern 6–18 Monate und kosten inklusive Beratung typischerweise 300.000 bis 800.000 Euro. Für KMU ohne SAP-Basis nicht geeignet.
Microsoft Power BI + LLM-Schicht — für M365-Nutzer mit Budget für einen Eigenentwicklungsanteil Wer Microsoft 365 betreibt und ein SAP-System hat, kann über Power BI Direktkonnektoren eine Lieferantenscoring-Lösung ohne zusätzliche Procurement-Plattform aufbauen. Power BI Pro kostet 12,10 Euro pro Nutzer und Monat; die LLM-Schicht für die Berichtsgenerierung kommt über Azure OpenAI oder ChatGPT. Der Vorteil: Volle Datenkontrolle, keine Drittanbieter-Abhängigkeit, EU-Hosting durch M365. Der Nachteil: Dieser Ansatz erfordert einen internen Data-Analysten oder externen Implementierungspartner — er ist kein Produkt, das man kaufen und in drei Wochen live schalten kann. Erfahrungsgemäß 60–120 Tage Aufbauzeit, dann aber maximal flexibel.
Jaggaer ONE — für Unternehmen im oberen Mittelstand mit komplexen Sourcing-Anforderungen Jaggaer ist eine US-amerikanische Source-to-Contract-Plattform mit starkem Lieferantenmanagement-Modul. Besonders bei Unternehmen mit intensiven Ausschreibungszyklen und komplexen Lieferanten-Scorecard-Anforderungen (Nachhaltigkeit, Innovationsfähigkeit, geopolitisches Risiko) ist Jaggaer oft stärker als SAP Ariba. Jaggaer Copilot (seit 2024) unterstützt bei der Bewertungsauswertung via natürlicher Sprache. Einstiegspreise ab ca. 45.000 USD/Jahr. Kein deutschsprachiger Support im SMB-Segment, Onboarding typisch 3–6 Monate.
Zusammenfassung: Wann welcher Ansatz
- Industriemittelstand, SAP oder Dynamics, deutschsprachige Betreuung gewünscht → Tacto
- SAP-Konzern oder Großmittelstand mit eigenem IT-Team → SAP Ariba
- M365-Umgebung, Eigenentwicklung möglich → Power BI + LLM-Schicht
- Oberer Mittelstand mit komplexen Ausschreibungszyklen → Jaggaer
- Lieferkettenrisiken strategisch überwachen (ergänzend) → Resilinc
Datenschutz und Datenhaltung
Lieferantenbewertungsdaten sind aus DSGVO-Sicht zweigeteilt: Die Leistungsdaten der Lieferantenunternehmen selbst (Liefertreue, Qualitätsrate) sind keine personenbezogenen Daten. Sobald aber Kontaktpersonen, Ansprechpartner oder individuelle Leistungsbeurteilungen einzelner Mitarbeitender des Lieferanten verarbeitet werden, greift Art. 4 Nr. 1 DSGVO.
Für die ERP-seitige Datenaggregation (rein betriebliche Kennzahlen) ist das kein Thema. Wenn die KI-Schicht aber Freitexte aus Qualitätsmeldungen auswertet — 8D-Reports, Reklamationsbeschreibungen, Kommunikation mit dem Lieferanten — können dort durchaus personenbezogene Daten enthalten sein.
Konkrete Empfehlungen:
- Tacto: EU-Datenhosting, deutsches Unternehmen, AVV standardmäßig Teil des Vertrags — empfehlenswert für DSGVO-sensible Umgebungen
- SAP Ariba: EU-Rechenzentren verfügbar (Frankfurt), AVV Standardbestandteil des SAP-Vertrags — EU-Datenhaltung explizit vertraglich festschreiben
- Power BI: M365 EU Data Boundary verfügbar — für Microsoft-Kunden die unkomplizierteste EU-Hosting-Option
- LLM-API-Calls: Wenn Freitexte aus Reklamationen an externe LLMs geschickt werden, muss das über ein EU-kompatibles Modell laufen (Azure OpenAI in EU-Region oder Anthropic über AWS Bedrock Frankfurt) — oder Freitexte werden vor der Übergabe an das Modell anonymisiert
Was es kostet — realistisch gerechnet
Einmalige Aufbaukosten
- Datenbereinigung und Stammdatenharmonisierung im ERP: 20–80 Personentage intern oder extern (je nach ERP-Zustand); externer Berater kostet 1.200–1.800 Euro/Tag → Bandbreite 25.000–120.000 Euro, wenn extern vergeben
- Tool-Implementierung: Bei Tacto und vergleichbaren Plattformen typisch 5–15 Beratertage Onboarding zusätzlich zur Lizenz; bei Power BI-Eigenentwicklung 20–60 Entwicklertage
- Gesamt Setup (ohne Bereinigung): 10.000–50.000 Euro, stark von Komplexität abhängig
Laufende Kosten (monatlich)
- Tacto: vier- bis fünfstellige Jahreslizenz, individuell → ergibt typisch 1.500–5.000 Euro/Monat
- SAP Ariba Supplier Management: Enterprise-Lizenz ab ca. 80.000 Euro/Jahr, plus Implementierungskosten
- Power BI Pro: 12,10 Euro/Nutzer/Monat; LLM-API-Kosten ca. 50–200 Euro/Monat für typische Reportingvolumina
- Jaggaer ONE: ab ca. 45.000 USD/Jahr
Nutzen dagegen gerechnet Ein Einkaufsteam mit zwei Personen, das pro Bewertungszyklus bisher 3 Arbeitstage aufgewendet hat (= 6 Personentage), bei vier Zyklen im Jahr = 24 Personentage. Bei einem internen Tagessatz von 450–700 Euro: 10.800 bis 16.800 Euro eingesparte Personalzeit pro Jahr — nur durch die Zeiteinsparung im Zyklus selbst.
Hinzu kommen: Frühere Erkennung von Lieferantenproblemen (Produktionsunterbrechungen sind teurer als jede Software), bessere ISO-Audit-Vorbereitung und systematischere Lieferantenentwicklung. Diese Effekte sind real, aber nur indirekt quantifizierbar.
Was du dagegenrechnen kannst: Im konservativen Szenario (Zeitersparnis allein, keine Qualitätseffekte) amortisiert sich eine Tacto-Lizenz im unteren Bereich bei einem Einkaufsteam mit zwei Personen in ca. 12–18 Monaten. Bei Power BI lohnt sich die Investition früher, wenn die interne Entwicklungskapazität schon vorhanden ist.
Typische Einstiegsfehler
1. Mit der KI-Schicht anfangen statt mit den Daten. Der häufigste Fehler ist, ein Lieferantenscoring-Tool einzuführen, ohne vorher zu prüfen, ob die ERP-Daten überhaupt eine verlässliche Grundlage bieten. Das Ergebnis: Das System rechnet Scores auf Basis von Buchungsfehlern und Dubletten — und produziert Bewertungen, die die Realität verzerren. Bevor du ein Tool kaufst, lass dir eine Stichprobenauswertung aus deinem ERP ziehen: Welche Liefertreue hat dein größter Lieferant laut SAP ME61? Stimmt das mit dem überein, was dein Einkauf erlebt? Wenn nicht, weißt du, womit du anfangen musst.
2. Den Bewertungsrhythmus zu ambitioniert starten. Von “einmal im Jahr” sofort auf “monatlich” zu schalten ist selten produktiv. Die Kapazität für Reviews, Eskalationsgespräche und Korrekturmaßnahmen muss mitgedacht werden. Wer automatisiert quartalsweise bewertet und bei zehn Lieferanten kritische Scores sieht, muss auch die Zeit haben, mit diesen zehn Lieferanten zu sprechen. Sonst ist die Bewertung nur ein Dokument für die Schublade.
3. Die Bewertungskriterien nicht transparent mit den Lieferanten kommunizieren. Lieferanten sollten wissen, nach welchen Kriterien sie bewertet werden — Überraschungen im Jahresgespräch führen zu Vertrauensverlust. Wer seine Kriterien automatisiert, sollte sie gleichzeitig transparenter machen: Kommuniziere die Scorecard, erkläre die Gewichtung. Das verbessert die Lieferantenbeziehung statt sie zu belasten.
4. Das System läuft, aber niemand macht etwas mit den Ergebnissen. Das ist der gefährlichste Langzeitfehler. Ein automatisierter Bericht, der auf einem Server liegt und niemanden alarmiert, hat keinen Wert. Die technische Einrichtung des Systems muss mit der Einrichtung klarer Eskalationsprozesse verbunden sein: Wer erhält welchen Alert bei welchem Score-Threshold? Wer führt das Gespräch mit dem kritischen Lieferanten? Wer genehmigt die Delistung? Ohne diese Antworten ist die Automatisierung ein teures Reporting-Tool — kein Steuerungsinstrument.
Was mit der Einführung wirklich passiert — und was nicht
Die Erwartung ist oft: Wir führen das Tool ein, es rechnet automatisch, und der Einkauf spart drei Wochen im Jahr. Die Realität in den ersten sechs Monaten sieht anders aus.
Phase 1 (Wochen 1–8): Datenprobleme ans Licht. Das Projekt startet mit einer unerwarteten Entdeckung: Das ERP ist nicht so ordentlich, wie gedacht. Dubletten, Fehlbuchungen, fehlende Referenzen — all das kommt in den ersten Wochen auf den Tisch. Das ist kein Zeichen, dass das Projekt falsch aufgesetzt ist. Es ist ein Zeichen, dass es nötig war. Dieser Teil des Projekts fühlt sich nicht nach “KI-Einführung” an — er fühlt sich nach Datenbankarbeit an. Das ist normal.
Phase 2 (Monat 2–4): Die erste automatisierte Runde. Der erste vollautomatische Bewertungslauf produziert Ergebnisse, die überprüft werden müssen. Nicht alle Scores stimmen sofort. Manche Lieferanten erscheinen zu gut, weil bestimmte Buchungsarten noch nicht erfasst sind. Das Feintuning der Gewichtungen kostet Zeit. Erwarte, dass die erste automatische Bewertung noch einen halben Tag manuellen Review braucht — das ist kein Rückschritt, sondern Teil des Kalibrierungsprozesses.
Was nicht passiert: Das System übernimmt keine Lieferantenentscheidungen. Es erkennt keinen guten Lieferanten, den der Einkauf übersehen hatte. Es identifiziert keine neuen Einsparpotenziale. Das sind alles andere Anwendungsfälle. Wer das von einem Scoring-Tool erwartet, wird enttäuscht sein. Wer es als strukturierte Grundlage für bessere Gespräche mit Lieferanten versteht, wird es schätzen.
Typisches Widerstandsmuster: Ältere Einkäufer kennen “ihre” Lieferanten oft aus jahrelanger Zusammenarbeit und vertrauen dem Score weniger als ihrem Bauchgefühl. Das ist nicht dumm — Erfahrung ist wertvoll. Hilfreicher als Überzeugungsarbeit ist es, beide Wahrheiten nebeneinander zu stellen: “Das System sagt Liefertreue 68 %. Du sagst, der Grund dafür ist die Umstellungsphase im Q3. Lass uns das im nächsten Gespräch mit dem Lieferanten dokumentieren.” Das System wird zum Gesprächsprotokoll, nicht zum Richter.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| ERP-Daten-Audit | Woche 1–2 | Stichprobe ziehen, Datenqualität bewerten, Dubletten und Fehlbuchungen quantifizieren | Datenqualität ist schlechter als erwartet → Zeitplan verlängert sich |
| Datenbereinigungs-Sprint | Woche 2–6 (oder länger) | Stammdaten harmonisieren, Dubletten bereinigen, Buchungsregeln klären | Bei stark individualisiertem SAP: externe SAP-Berater nötig, Kosten steigen |
| Tool-Auswahl und Implementierung | Woche 4–8 (parallel möglich) | Anbieter evaluieren, Demoinstanzen testen, Konnektoren einrichten | Vendor Lock-in, wenn Anbindung proprietär und Wechsel teuer |
| Konfiguration der Scorecard | Woche 6–10 | Bewertungskriterien und Gewichtungen definieren, ISO-9001-Audit-Anforderungen prüfen | Zu viele interne Stakeholder ohne Einigung → Scoring bleibt generisch |
| Pilotlauf und Kalibrierung | Woche 8–12 | Ersten automatischen Zyklus durchführen, Ergebnisse mit manuellem Vergleich validieren | Abweichungen zwischen System und Realität → Datenpflege-Runde nötig |
| Rollout + Eskalationsprozesse | Ab Woche 12 | Regelmäßigen Rhythmus etablieren, Alerting einrichten, Review-Prozess dokumentieren | System läuft, aber niemand handelt auf Ergebnisse → Adoption-Problem |
Gesamtdauer bis produktivem Einsatz: Bei sauberem ERP 8–12 Wochen. Bei fragmentierter ERP-Landschaft realistisch 4–6 Monate bis zur zuverlässigen ersten Runde.
Häufige Einwände — und was dahintersteckt
“Wir kennen unsere Lieferanten — wir brauchen kein System dafür.” Stimmt für den Stamm von Tier-1-Lieferanten, die jeder Einkäufer persönlich kennt. Stimmt nicht für die 60–80 Prozent des Portfolios, die selten genug bestellt werden, um im aktiven Gedächtnis zu bleiben. Genau die werden in manuellen Prozessen überbewertet — weil kein schlechtes Erlebnis erinnerlich ist, obwohl die Daten einen Trend zeigen würden. Das System ist kein Ersatz für Beziehungswissen — es ist die Ergänzung für alles, was sich im Kopf nicht hält.
“Unsere ISO-9001-Bewertung haben wir immer gut bestanden.” Das kann sein. Die Frage ist, ob der Prüfer bei einer zukünftigen Erweiterung der Anforderungen (IATF 16949, CSRD-Lieferkettendaten, Lieferkettensorgfaltspflichtengesetz) noch zufrieden ist. Automatisierte Systeme sind zukunftssicherer als manuelle Prozesse, wenn regulatorische Anforderungen steigen — und sie steigen gerade in der deutschen Industrie. Ein System, das heute ausreicht, muss in zwei Jahren erweitert werden; besser, die Infrastruktur steht dann bereits.
“Das ist nichts für uns — wir sind zu klein.” Das kommt auf die Lieferantenanzahl an, nicht auf die Unternehmensgröße. Ein Betrieb mit 30 Mitarbeitenden und 80 aktiven Lieferanten hat denselben Aufwand für manuelle Bewertungen wie ein Betrieb mit 300 Mitarbeitenden. Die Frage ist: Hat der kleinere Betrieb eine Person, die zwei Wochen im Jahr für das Thema freistellen kann? Wenn nicht, ist Automatisierung auch hier sinnvoll — aber mit einer schlanken Lösung (Power BI + LLM), nicht mit einer Enterprise-Plattform.
Woran du merkst, dass das zu dir passt
Das spricht für eine Einführung:
- Du hast mehr als 30 aktive Lieferanten und führst ihre Bewertung aktuell jährlich oder seltener durch
- Dein Einkauf verbringt mehr als einen Arbeitstag pro Monat mit dem Zusammentragen von Lieferantendaten aus verschiedenen Systemen
- Du hast in letzter Zeit Überraschungen bei Lieferanten erlebt — Probleme, deren frühes Signal du übersehen hast, weil Bewertungsdaten nur einmal im Jahr auf dem Tisch lagen
- Du trägst ISO-9001-Verantwortung und deine aktuelle Dokumentation wäre im Audit ohne größere Nacharbeit nicht belastbar
- Du belieferst die Automobilindustrie und willst IATF-16949-Anforderungen systematischer erfüllen
Drei harte Ausschlusskriterien:
-
Weniger als 25–30 strategische Lieferanten mit nennenswertem Bestellvolumen. Bei einem kleinen Portfolio ist ein gut strukturiertes quartalsweises Excel mit zwei bis drei Stunden Aufwand die effizientere Lösung. Der Implementierungsaufwand für ein automatisiertes System amortisiert sich nicht.
-
Kein standardisierter Wareneingangs- und QM-Prozess im ERP. Wenn Qualitätsmeldungen nicht systematisch in SAP oder einem angebundenen QM-Tool gebucht werden, hat das System keine Datenbasis für die Qualitätskennzahl. Wer erst Prozesse standardisieren müsste, sollte das unabhängig vom KI-Projekt tun — und danach die Automatisierung angehen.
-
ERP stark individualisiert ohne dokumentiertes Datenschema, kein SAP-internes Know-how im Team. Wenn niemand im Unternehmen weiß, welche SAP-Transaktion die Liefertreue abbildet oder wo Qualitätsmeldungen gebucht werden, ist das kein “kurzes Onboarding beim Anbieter” — das ist ein Consulting-Projekt von 3–6 Monaten. Das muss im Budget und im Zeitplan stehen, bevor die Entscheidung fällt.
Das kannst du heute noch tun
Starte mit einem kostenlosen Datencheck statt mit einem Tool-Kauf. Öffne SAP ME61 (oder das Äquivalent in deinem ERP) und lass für fünf deiner Hauptlieferanten die automatische Lieferantenbewertung der letzten 12 Monate laufen. Vergleiche das Ergebnis mit dem, was dein Einkaufsteam aus dem Bauch heraus sagen würde.
Wenn die Ergebnisse übereinstimmen: Dein ERP ist eine gute Datenbasis — der Schritt zur Automatisierung ist technisch machbar.
Wenn die Ergebnisse divergieren: Finde heraus warum. Fehlbuchungen? Dublettenprobleme? Unvollständige Daten? Die Antwort sagt dir, wie viel Datenarbeit vor der KI-Einführung liegt.
Parallel kannst du mit folgendem Prompt einen ersten Bewertungsbericht aus vorhandenen Daten erstellen — kein ERP-Connector nötig, nur eine Excel-Tabelle mit Lieferantendaten.
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- 82 % partielle Bewertungsabdeckung / durchschnittlich 4,5 Systeme: erp-management.de, „Datenqualität im Lieferanten-Risikomanagement” (abgerufen Mai 2026). https://erp-management.de/artikel/datenqualitaet-im-lieferanten-risikomanagement/
- ISO 9001:2015 Abschnitt 8.4.1: ISO 9001:2015, „Control of externally provided processes, products and services — General” — Anforderung an dokumentierte Information über Bewertungsergebnisse und Maßnahmen. Abschnitt 8.4.1 Abs. 3. Aktuelle Normfassung.
- Tacto Technologies — Einsparungen 2024: Tacto-Produktseite und Erfahrungsberichte (tacto.ai, Mai 2026); Pressemitteilungen UnternehmerTUM zu €50M-Finanzierungsrunde (Sequoia/Index Ventures, 2024). https://www.unternehmertum.de/en/press/tacto-sichert-sich-50-millionen-euro-fuer-den-aufbau-zukunftssicherer-lieferketten-im-mittelstand
- Jaggaer ONE Einstiegspreise: Gartner Peer Insights / SelectHub, „JAGGAER ONE Reviews & Ratings 2026” (abgerufen Mai 2026). https://www.selecthub.com/p/procurement-software/jaggaer-one/
- SAP ME61 Lieferantenbewertung — Methoden: Rewion IT-Beratung, „Lieferantenbewertung in SAP: Drei bewährte Methoden im Überblick” (abgerufen Mai 2026). https://www.rewion.com/lieferantenbewertung-in-sap-drei-bewaehrte-methoden-im-ueberblick/
- IATF 16949 Lieferantenanforderungen: Kontor-Gruppe, „IATF 16949 Zertifizierung — Anforderungen, Ablauf und Vorteile” (abgerufen Mai 2026). https://www.kontor-gruppe.de/iatf-16949.html
- Power BI Pro Preise: Microsoft offizielle Preisliste Power BI (Stand Mai 2026). https://powerbi.microsoft.com
- Zeitaufwand Lieferantenaudit: Tacto Einkäufer-Lexikon, „Lieferantenaudit: Definition, Methoden und Best Practices” (abgerufen Mai 2026); qualitative Praxisberichte. https://www.tacto.ai/de/einkaufer-lexikon/lieferantenaudit
Willst du wissen, ob deine ERP-Datenbasis für eine automatisierte Lieferantenbewertung reif genug ist — und welcher Ansatz zu deiner Infrastruktur passt? Schreib uns, wir helfen beim strukturierten Datencheck.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Predictive Maintenance: Ausfälle vorhersagen statt reparieren
Maschinenausfälle ankündigen sich durch Vibration, Temperatur und Stromaufnahme — Wochen bevor sie passieren. KI-Modelle erkennen diese Muster und ermöglichen gezielten Eingriff.
Mehr erfahrenQualitätskontrolle per Kamera: Sichtprüfung automatisieren
Visuelle Inspektion von Bauteilen auf Kratzer, Maßabweichungen und Oberflächenfehler per KI-Kamerasystem — schneller und konsistenter als manuelle Prüfung.
Mehr erfahrenTechnische Dokumentation automatisch erstellen
CAD-Daten, Stücklisten und interne Spezifikationen per KI in normgerechte Betriebsanleitungen und Wartungshandbücher umwandeln — Redaktionsaufwand halbieren.
Mehr erfahren