Maschinenbau lieferantenbewertungeinkaufqualitaetsmanagement

Lieferantenbewertung automatisieren

KI aggregiert Liefertreue, Qualitätskennzahlen und Reklamationsdaten kontinuierlich aus dem ERP, und erstellt standardisierte Lieferantenberichte statt manueller Excel-Auswertungen einmal im Jahr.

⚡ Auf einen Blick

Problem: Lieferantenbewertungen laufen einmal jährlich, basieren auf unvollständigen Daten und binden 2–5 Arbeitstage je Zyklus im Einkauf.
KI-Lösung: Automatische Datenaggregation aus ERP, Wareneingang und Reklamationsmanagement, LLM erstellt Bewertungsberichte mit konkreten Handlungsempfehlungen.
Typischer Nutzen: Bewertungszyklen von jährlich auf quartalsweise möglich. Einkauf spart 70–80 % der manuellen Auswertungszeit je Zyklus.
Setup-Zeit: 6–12 Wochen bei sauberem ERP, 3–6 Monate bei Datenproblemen
Kosteneinschätzung: 10.000–50.000 € Einrichtung, 1.500–5.000 €/Monat laufend (Tacto-Größenordnung)

Excel + ChatGPT/Claude für BerichtePower BI + LLM-Schicht (Azure OpenAI)Tacto, SAP Ariba oder Jaggaer ONE

Worum geht's?

Es ist Anfang Februar.

Marcus Berger, Einkaufsleiter bei einem mittelständischen Sondermaschinenbauer in Bayern, weiß genau, was die nächsten drei Wochen bedeuten: der jährliche Lieferantenbewertungszyklus. 120 aktive Lieferanten. Er öffnet das Excel-Template, das sein Vorgänger 2018 angelegt hat. Dann öffnet er die SAP-Transaktion ME61, das Qualitätsmanagementsystem und die Reklamationsübersicht, drei verschiedene Systeme, die nicht miteinander reden.

Er fängt an, Daten zusammenzutragen. Liefertreue aus SAP, Qualitätsrate aus dem QM-Tool, Anzahl der 8D-Reports aus der Reklamationsliste. Manche Felder stimmen nicht überein, ein Lieferant taucht in SAP unter zwei verschiedenen Nummern auf, weil jemand vor Jahren eine Zweigniederlassung separat angelegt hat. Eines seiner Teammitglieder verbringt zwei Tage damit, Duplikate zu bereinigen.

Drei Wochen später liegt der Bericht vor. Vierzig Lieferanten haben einen kritischen Status. Zwölf davon waren es auch letztes Jahr. Was in der Zwischenzeit passiert ist, ob sich etwas verbessert hat, ob es einen Trend gibt, steht nicht im Bericht. Dafür gab die Zeit nicht.

Das ist kein Ausnahmefall. Laut einer Erhebung von erp-management.de bewerten 82 Prozent der Unternehmen nur einen Teil ihrer Lieferantenbasis überhaupt, weil der manuelle Aufwand den Rest schlicht verhindert.

Für Unternehmen

Nicht nur lesen, umsetzen.

Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.

Für Unternehmen

Das echte Ausmaß des Problems

Die Lieferantenbewertung gehört in jedem ISO-9001-zertifizierten Maschinenbauunternehmen zum Pflichtprogramm, und ist trotzdem in den meisten Betrieben ein Schmerzpunkt. Die Ursache ist strukturell: Die Daten, die für eine fundierte Bewertung gebraucht werden, liegen in verschiedenen Systemen, werden unterschiedlich gepflegt und lassen sich nicht auf Knopfdruck zusammenführen.

Was das in Zahlen bedeutet:

82 Prozent der Unternehmen bewerten nur einen Teil ihrer Lieferanten, weil der Aufwand für eine vollständige Erhebung zu hoch ist (erp-management.de, Studie Datenqualität im Lieferanten-Risikomanagement)
Durchschnittlich 4,5 Systeme verwalten Lieferantendaten in einem Industriebetrieb, und die meisten davon sind nicht miteinander verknüpft (ebd.)
2–5 Arbeitstage kostet ein vollständiger Bewertungszyklus bei 50–150 Lieferanten, wenn er manuell durchgeführt wird, und das typischerweise nur einmal im Jahr
Wer jährlich bewertet, sieht Trends zu spät: Ein Lieferant, der im März anfängt schlechter zu werden, fällt erst im nächsten Februar im Bericht auf, wenn der Schaden schon eingetreten ist

Das Besondere an diesem Usecase: Der Engpass liegt nicht in der Analyse, sondern in der Datenbeschaffung. Wer die Daten einmal strukturiert und automatisch fließen lässt, gewinnt nicht nur Zeit, er gewinnt eine Bewertungsdichte, die mit manuellem Arbeiten nie erreichbar wäre.

Mit vs. ohne KI, ein ehrlicher Vergleich

Kennzahl	Ohne Automatisierung	Mit automatisierter Bewertung
Bewertungsfrequenz	Jährlich	Quartalsweise oder monatlich möglich
Zeitaufwand je Zyklus	2–5 Arbeitstage intern	2–4 Stunden für Sichtung + Freigabe
Abdeckung des Lieferantenportfolios	Typisch 50–70 %	100 % (alle Lieferanten mit ERP-Aktivität)
Reaktionszeit bei Qualitätsverschlechterung	6–12 Monate (bis zum nächsten Zyklus)	4–6 Wochen (beim nächsten Quartalsdurchlauf)
Datenbasis	Manuell zusammengeführte Stichproben	Vollständige Transaktionsdaten aus ERP + QM
Dokumentationsqualität für ISO-Audit	Hängt von Sorgfalt des Bearbeiters ab	Standardisierter Bericht, revisionssicher
Liefertrendanalyse	Punktmessung je Zyklus	Automatisches Trending über alle Perioden

Die Qualitätsverbesserung durch Automatisierung passiert nicht durch ein besseres Scoring-Modell, sie passiert, weil der Zyklus häufiger läuft und alle Lieferanten erfasst werden, nicht nur die, für die gerade Zeit war.

Einschätzung auf einen Blick

Zeitersparnis, hoch (4/5) Der Bewertungszyklus schrumpft von 2–5 Tagen auf 2–4 Stunden für Sichtung und Freigabe. Das ist ein echter Hebel für Einkaufsteams mit wenig Kapazität. Warum nicht 5? Weil der initiale Aufwand für Datenintegration und Konfiguration erheblich ist, und weil der Aufwand für die Datenpflege (Stammdaten, Dubletten, Fehlbuchungen) dauerhaft bleibt. Die Zeitersparnis tritt verlässlich ein, aber erst ab dem zweiten oder dritten automatisierten Zyklus.

Kosteneinsparung, begrenzt (2/5) Die direkte Kosteneinsparung durch automatisierte Lieferantenbewertung ist gering: Du sparst Personalzeit im Einkauf, aber keine direkten Materialkosten. Der wirtschaftliche Nutzen ist mittelbar, bessere Lieferantensteuerung reduziert Qualitätsmängel und Lieferverzögerungen, die sich in Produktionsunterbrechungen und Nacharbeit niederschlagen. Dieser Effekt ist real, aber schwer in einer einzelnen Zahl zu isolieren. Unter den Maschinenbau-Anwendungsfällen einer der schwächeren direkten Kostenhebel.

Schnelle Umsetzung, gut (4/5) Wer ein sauberes ERP hat und einen Anbieter wie Tacto nutzt, kann in 6–10 Wochen zur ersten automatisierten Bewertungsrunde kommen. Schlechter steht es aus, wenn das SAP über 15 Jahre stark individualisiert wurde, dann sind 3–6 Monate für die Datenextraktion allein realistisch. Auch Power BI mit einer LLM-Schicht ist bei vorhandener M365-Infrastruktur schnell startklar. Score 4 gilt für den Normalfall, nicht für stark fragmentierte ERP-Landschaften.

ROI-Sicherheit, mittel (3/5) Die Zeitersparnis ist klar messbar, Stunden je Zyklus vor und nach der Einführung. Schwieriger zu quantifizieren: ob bessere Lieferantensteuerung tatsächlich Qualitätsmängel reduziert hat, und ob das an der Bewertung oder an anderen Faktoren liegt. Für ISO-9001-Audits ist der Compliance-Nutzen eindeutig, dort ist die Dokumentation Pflicht, unabhängig vom ROI. Dieser indirekte Wert ist real, aber in einem Business Case schwer bezifferbar.

Skalierbarkeit, sehr hoch (5/5) Hier liegt der stärkste Vorteil: Einmal eingerichtet, läuft das System für 50 oder 500 Lieferanten mit identischem Aufwand. Wenn das Unternehmen wächst oder neue Lieferanten ins Portfolio kommen, sind sie automatisch Teil des nächsten Zyklus, ohne dass jemand mehr Zeit investiert. Das ist der Kern-Skalierungsvorteil dieses Anwendungsfalls.

Richtwerte, stark abhängig von ERP-Reife, Unternehmensgröße und vorhandener Systemlandschaft.

Was das System konkret macht

Das technische Prinzip ist einfacher als es klingt: Das System zieht aus dem ERP die transaktionalen Daten, die ohnehin schon gebucht werden, Wareneingänge, Rechnungsprüfungen, Qualitätsmeldungen, Liefertermin-Soll-Ist-Vergleiche, und verdichtet sie zu einem Score je Lieferant.

Die vier Kernkennzahlen, die sich zuverlässig aus ERP-Bewegungsdaten extrahieren lassen:

Liefertreue: Verhältnis von zugesagtem zu tatsächlichem Liefertermin, automatisch buchungsbasiert aus Bestellung und Wareneingang
Mengentreue: Verhältnis von bestellter zu gelieferter Menge inkl. Teillieferungen
Qualitätsrate: Anteil der Wareneingangspositionen ohne Qualitätsbeanstandung aus dem QM-Modul
Reklamationsfrequenz: Anzahl der ausgelösten 8D-Reports oder Qualitätsmeldungen je Lieferant und Periode

Auf diesen strukturierten Kennzahlen setzt das LLM auf, nicht um die Zahlen zu berechnen, sondern um sie zu interpretieren und in einen narrativen Bericht zu verwandeln. Ein LLM-gestützter Bericht fasst zusammen, was die Daten zeigen, nennt den Trend gegenüber der Vorperiode, markiert kritische Lieferanten automatisch und schlägt konkrete nächste Schritte vor (Lieferantengespräch, Eskalation, Qualitätssicherungsmaßnahme).

Der Mehrwert des Machine Learning-Layers entsteht bei ausreichender Datenbasis: Das System erkennt Muster, die im manuellen Excel nicht sichtbar werden, etwa dass ein Lieferant in der zweiten Jahreshälfte systematisch schlechter performt, oder dass Qualitätsprobleme bei einem bestimmten Material-Cluster konzentriert sind, nicht bei einem einzelnen Lieferanten.

Was das System nicht macht: Es ersetzt das Einkäufer-Urteil nicht. Ob ein Lieferant mit temporär schlechter Liefertreue entschuldbare Gründe hat (Rohstoffkrise, Produktionsumstellung), entscheidet weiterhin ein Mensch. Das System liefert die Faktenbasis, das Gespräch führt der Einkauf.

Datenqualität als Voraussetzung

Hier liegt der Elefant im Raum, der in den meisten KI-Einkauf-Pitches verschwiegen wird: Das Scoring-Modell ist das einfachere Problem. Die Herausforderung ist die Datenextraktion.

Maschinenbauunternehmen, die seit 10–20 Jahren SAP betreiben, haben in der Regel stark individualisierte Systeme. Module wurden nachgerüstet, Schnittstellen selbst gebaut, Felder zweckentfremdet, Nummernkreise mehrfach vergeben. Das Ergebnis: Was auf dem Papier “Wareneingangsdaten” heißt, ist in Wirklichkeit ein Flickenteppich aus halbautomatischen Buchungen, manuell korrigierten Einträgen und historischen Altlasten.

Konkrete Probleme, die in fast jedem Projekt auftauchen:

Lieferantendubletten: Ein Lieferant ist unter zwei oder drei Nummern gebucht (Niederlassungen, Akquisitionen, alte vs. neue Nummerierung). Scores werden auf Splitdaten berechnet, beide Nummern sehen besser aus als sie sind
Fehlende Materialzuordnungen: Wareneingangsbuchungen ohne vollständige Bestellreferenz lassen sich keiner Bestellung und keinem Liefertermin zuordnen, sie fallen aus der Liefertreuemessung heraus
QM-Daten nicht buchungsseitig: Qualitätsmeldungen werden in einem getrennten System erfasst, das keine automatische ERP-Gegenbuchung hat, manuelle Verknüpfung nötig
Historische Fehlbuchungen: Altbestände, die nie bereinigt wurden, verzerren Langzeittrends

Was das bedeutet: Bevor der erste automatisierte Bericht läuft, ist Datenbereinigung und Stammdatenharmonisierung nötig. Bei stark individualisierten SAP-Systemen dauert diese Phase laut Erfahrungsberichten von Implementierungspartnern 3–6 Monate, nicht 3–6 Wochen.

Die ehrliche Faustregel: Wer seine aktuellen Lieferantenbewertungen aus SAP ME61 schon heute halbwegs verlässlich ziehen kann, hat in 6–10 Wochen einen automatisierten Prozess. Wer bei der Frage “Welche Liefertreue hat Lieferant X laut SAP?” keine einheitliche Antwort bekommt, ist zuerst ein Datenprojekt und dann ein KI-Projekt.

Was ISO 9001 und IATF 16949 von euch verlangen

Die Lieferantenbewertung ist in der deutschen Maschinenbaubranche kein optionales Best-Practice-Instrument, sie ist normativ gefordert.

ISO 9001:2015, Abschnitt 8.4.1 (Steuerung extern bereitgestellter Prozesse, Produkte und Dienstleistungen) schreibt vor, dass das Unternehmen Kriterien für die Bewertung und Auswahl externer Anbieter festlegen und dokumentierte Informationen über die Ergebnisse der Bewertung und über erforderliche Maßnahmen aufbewahren muss. Das Schlüsselwort ist “dokumentierte Informationen”, mündliche Eindrücke und nicht archivierte Excel-Sheets genügen im Audit nicht.

IATF 16949 (relevant für alle Maschinenbauunternehmen, die Automotive-Zulieferer direkt oder indirekt beliefern) geht weiter: Es verlangt eine kaskadierte Lieferantenentwicklung, das Unternehmen muss nicht nur seine eigenen Tier-1-Lieferanten bewerten, sondern sicherstellen, dass auch diese ihre Lieferanten qualifiziert steuern. Im Audit wird gefragt, wie oft Bewertungen durchgeführt werden, welche Kriterien gelten und welche Maßnahmen aus schlechten Bewertungen resultiert haben.

Was das für die Automatisierung bedeutet: Ein automatisiertes System erfüllt die Compliance-Anforderungen nicht einfach durch sein Vorhandensein, es muss die richtigen Dokumentationsformate produzieren. Der Ausgabebericht muss revisionssicher archiviert, mit Datum und verantwortlicher Person gestempelt sein und die verwendeten Bewertungskriterien enthalten. Das ist konfigurierbar, muss aber explizit in der Systemeinrichtung adressiert werden.

Der Compliance-Gewinn ist real: Ein automatisierter, quartalsweiser Zyklus mit revisionssicherer Dokumentation ist im ISO-Audit deutlich besser vertretbar als ein jährlicher Zyklus mit Excel-Dateien, bei dem nicht klar ist, wer welche Version wann geändert hat.

Konkrete Werkzeuge, was wann passt

Tacto, für den deutschen Industriemittelstand Tacto ist ein Münchner SRM-Anbieter, der auf Industriemittelstand in Deutschland spezialisiert ist. Das Tool bindet SAP, Microsoft Dynamics und proAlpha an, normiert die ERP-Daten in einem eigenen Datenlayer und liefert Lieferantenscoring, Spend-Analyse und Compliance-Monitoring auf einer Oberfläche. Besonders relevant: EU-Hosting, deutscher Support und ein Onboarding-Ansatz, der explizit auf fragmentierte mittelständische ERP-Landschaften ausgelegt ist, kein 12-Monats-Implementierungsprojekt. Jahreslizenzen im vier- bis fünfstelligen Bereich, individuell verhandelt. Sinnvoll für Unternehmen ab ca. 20–30 strategischen Lieferanten und einem Beschaffungsvolumen ab 5–10 Mio. Euro.

SAP Ariba, für SAP-Kunden mit Einkaufsvolumen >50 Mio. Euro SAP Ariba ist die vollständigste Source-to-Pay-Suite für Unternehmen, die bereits in der SAP-Welt leben. Ariba Supplier Performance Management bewertet Lieferanten kontinuierlich anhand von Scorecard-Dimensionen und integriert das direkt in S/4HANA. Die Stärke ist die Prozesskette ohne Systembruch, Bewertung, Eskalation, Vertragsverlängerung und Audit-Trail alles in einer Plattform. Der Preis dafür: Enterprise-Implementierungsprojekte dauern 6–18 Monate und kosten inklusive Beratung typischerweise 300.000 bis 800.000 Euro. Für KMU ohne SAP-Basis nicht geeignet.

Microsoft Power BI + LLM-Schicht, für M365-Nutzer mit Budget für einen Eigenentwicklungsanteil Wer Microsoft 365 betreibt und ein SAP-System hat, kann über Power BI Direktkonnektoren eine Lieferantenscoring-Lösung ohne zusätzliche Procurement-Plattform aufbauen. Power BI Pro kostet 12,10 Euro pro Nutzer und Monat; die LLM-Schicht für die Berichtsgenerierung kommt über Azure OpenAI oder ChatGPT. Der Vorteil: Volle Datenkontrolle, keine Drittanbieter-Abhängigkeit, EU-Hosting durch M365. Der Nachteil: Dieser Ansatz erfordert einen internen Data-Analysten oder externen Implementierungspartner, er ist kein Produkt, das man kaufen und in drei Wochen live schalten kann. Erfahrungsgemäß 60–120 Tage Aufbauzeit, dann aber maximal flexibel.

Jaggaer ONE, für Unternehmen im oberen Mittelstand mit komplexen Sourcing-Anforderungen Jaggaer ist eine US-amerikanische Source-to-Contract-Plattform mit starkem Lieferantenmanagement-Modul. Besonders bei Unternehmen mit intensiven Ausschreibungszyklen und komplexen Lieferanten-Scorecard-Anforderungen (Nachhaltigkeit, Innovationsfähigkeit, geopolitisches Risiko) ist Jaggaer oft stärker als SAP Ariba. Jaggaer Copilot (seit 2024) unterstützt bei der Bewertungsauswertung via natürlicher Sprache. Einstiegspreise ab ca. 45.000 USD/Jahr. Kein deutschsprachiger Support im SMB-Segment, Onboarding typisch 3–6 Monate.

Zusammenfassung: Wann welcher Ansatz

Industriemittelstand, SAP oder Dynamics, deutschsprachige Betreuung gewünscht → Tacto
SAP-Konzern oder Großmittelstand mit eigenem IT-Team → SAP Ariba
M365-Umgebung, Eigenentwicklung möglich → Power BI + LLM-Schicht
Oberer Mittelstand mit komplexen Ausschreibungszyklen → Jaggaer
Lieferkettenrisiken strategisch überwachen (ergänzend) → Resilinc

Datenschutz und Datenhaltung

Lieferantenbewertungsdaten sind aus DSGVO-Sicht zweigeteilt: Die Leistungsdaten der Lieferantenunternehmen selbst (Liefertreue, Qualitätsrate) sind keine personenbezogenen Daten. Sobald aber Kontaktpersonen, Ansprechpartner oder individuelle Leistungsbeurteilungen einzelner Mitarbeitender des Lieferanten verarbeitet werden, greift Art. 4 Nr. 1 DSGVO.

Für die ERP-seitige Datenaggregation (rein betriebliche Kennzahlen) ist das kein Thema. Wenn die KI-Schicht aber Freitexte aus Qualitätsmeldungen auswertet, 8D-Reports, Reklamationsbeschreibungen, Kommunikation mit dem Lieferanten, können dort durchaus personenbezogene Daten enthalten sein.

Konkrete Empfehlungen:

Tacto: EU-Datenhosting, deutsches Unternehmen, AVV standardmäßig Teil des Vertrags, empfehlenswert für DSGVO-sensible Umgebungen
SAP Ariba: EU-Rechenzentren verfügbar (Frankfurt), AVV Standardbestandteil des SAP-Vertrags, EU-Datenhaltung explizit vertraglich festschreiben
Power BI: M365 EU Data Boundary verfügbar, für Microsoft-Kunden die unkomplizierteste EU-Hosting-Option
LLM-API-Calls: Wenn Freitexte aus Reklamationen an externe LLMs geschickt werden, muss das über ein EU-kompatibles Modell laufen (Azure OpenAI in EU-Region oder Anthropic über AWS Bedrock Frankfurt), oder Freitexte werden vor der Übergabe an das Modell anonymisiert

Was es kostet, realistisch gerechnet

Einmalige Aufbaukosten

Datenbereinigung und Stammdatenharmonisierung im ERP: 20–80 Personentage intern oder extern (je nach ERP-Zustand); externer Berater kostet 1.200–1.800 Euro/Tag → Bandbreite 25.000–120.000 Euro, wenn extern vergeben
Tool-Implementierung: Bei Tacto und vergleichbaren Plattformen typisch 5–15 Beratertage Onboarding zusätzlich zur Lizenz; bei Power BI-Eigenentwicklung 20–60 Entwicklertage
Gesamt Setup (ohne Bereinigung): 10.000–50.000 Euro, stark von Komplexität abhängig

Laufende Kosten (monatlich)

Tacto: vier- bis fünfstellige Jahreslizenz, individuell → ergibt typisch 1.500–5.000 Euro/Monat
SAP Ariba Supplier Management: Enterprise-Lizenz ab ca. 80.000 Euro/Jahr, plus Implementierungskosten
Power BI Pro: 12,10 Euro/Nutzer/Monat; LLM-API-Kosten ca. 50–200 Euro/Monat für typische Reportingvolumina
Jaggaer ONE: ab ca. 45.000 USD/Jahr

Nutzen dagegen gerechnet Ein Einkaufsteam mit zwei Personen, das pro Bewertungszyklus bisher 3 Arbeitstage aufgewendet hat (= 6 Personentage), bei vier Zyklen im Jahr = 24 Personentage. Bei einem internen Tagessatz von 450–700 Euro: 10.800 bis 16.800 Euro eingesparte Personalzeit pro Jahr, nur durch die Zeiteinsparung im Zyklus selbst.

Hinzu kommen: Frühere Erkennung von Lieferantenproblemen (Produktionsunterbrechungen sind teurer als jede Software), bessere ISO-Audit-Vorbereitung und systematischere Lieferantenentwicklung. Diese Effekte sind real, aber nur indirekt quantifizierbar.

Was du dagegenrechnen kannst: Im konservativen Szenario (Zeitersparnis allein, keine Qualitätseffekte) amortisiert sich eine Tacto-Lizenz im unteren Bereich bei einem Einkaufsteam mit zwei Personen in ca. 12–18 Monaten. Bei Power BI lohnt sich die Investition früher, wenn die interne Entwicklungskapazität schon vorhanden ist.

Typische Einstiegsfehler

1. Mit der KI-Schicht anfangen statt mit den Daten. Der häufigste Fehler ist, ein Lieferantenscoring-Tool einzuführen, ohne vorher zu prüfen, ob die ERP-Daten überhaupt eine verlässliche Grundlage bieten. Das Ergebnis: Das System rechnet Scores auf Basis von Buchungsfehlern und Dubletten, und ein Lieferant mit realer Liefertreue von 70 % sieht im Score wie 88 % aus, weil seine zweite SAP-Nummer die Fehllieferungen nicht führt. Eskalationsgespräche werden nicht geführt, Qualitätsprobleme stauen sich, und wenn der Schaden kommt (Produktionsunterbrechung durch Lieferausfall), ist die Systemauswertung als Ursache nicht mehr nachweisbar. Bevor du ein Tool kaufst, lass dir eine Stichprobenauswertung aus deinem ERP ziehen: Welche Liefertreue hat dein größter Lieferant laut SAP ME61? Stimmt das mit dem überein, was dein Einkauf erlebt? Wenn nicht, weißt du, womit du anfangen musst.

2. Den Bewertungsrhythmus zu ambitioniert starten. Von “einmal im Jahr” sofort auf “monatlich” zu schalten ist selten produktiv. Die Kapazität für Auswertungsgespräche, Eskalationsgespräche und Korrekturmaßnahmen muss mitgedacht werden. Wer automatisiert quartalsweise bewertet und bei zehn Lieferanten kritische Scores sieht, muss auch die Zeit haben, mit diesen zehn Lieferanten zu sprechen. Sonst ist die Bewertung nur ein Dokument für die Schublade.

3. Die Bewertungskriterien nicht transparent mit den Lieferanten kommunizieren. Lieferanten sollten wissen, nach welchen Kriterien sie bewertet werden. Wenn ein Lieferant zum ersten Mal in einem automatisierten Bericht als “Rot” auftaucht und das Gespräch damit beginnt, ist die Reaktion fast immer Abwehr statt Verbesserungsbereitschaft, und im schlimmsten Fall kündigt ein strategisch wichtiger Lieferant die Partnerschaft, weil er sich ungerecht bewertet fühlt. Wer seine Kriterien automatisiert, sollte sie gleichzeitig transparenter machen: Scorecard vorab kommunizieren, Gewichtungen erklären, erstes schlechtes Ergebnis im Gespräch voranstellen statt per Bericht zuzustellen. Das verbessert die Lieferantenbeziehung statt sie zu belasten.

4. Das System läuft, aber niemand macht etwas mit den Ergebnissen. Das ist der gefährlichste Langzeitfehler. Ein automatisierter Bericht, der auf einem Server liegt und niemanden alarmiert, hat keinen Wert, der Betrieb zahlt 1.500–5.000 €/Monat für Reporting, das keine Entscheidung verändert. Die technische Einrichtung des Systems muss mit der Einrichtung klarer Eskalationsprozesse verbunden sein: Wer erhält welchen Alert bei welchem Score-Threshold? Wer führt das Gespräch mit dem kritischen Lieferanten? Wer genehmigt die Delistung? Ohne diese Antworten ist die Automatisierung ein teures Reporting-Tool, kein Steuerungsinstrument. Lösung: Eskalationspfade und Zuständigkeiten schriftlich vor dem ersten produktiven Lauf festlegen.

Was mit der Einführung wirklich passiert, und was nicht

Die Erwartung ist oft: Wir führen das Tool ein, es rechnet automatisch, und der Einkauf spart drei Wochen im Jahr. Die Realität in den ersten sechs Monaten sieht anders aus.

Phase 1 (Wochen 1–8): Datenprobleme ans Licht. Das Projekt startet mit einer unerwarteten Entdeckung: Das ERP ist nicht so ordentlich, wie gedacht. Dubletten, Fehlbuchungen, fehlende Referenzen, all das kommt in den ersten Wochen auf den Tisch. Das ist kein Zeichen, dass das Projekt falsch aufgesetzt ist. Es ist ein Zeichen, dass es nötig war. Dieser Teil des Projekts fühlt sich nicht nach “KI-Einführung” an, er fühlt sich nach Datenbankarbeit an. Das ist normal.

Phase 2 (Monat 2–4): Die erste automatisierte Runde. Der erste vollautomatische Bewertungslauf produziert Ergebnisse, die überprüft werden müssen. Nicht alle Scores stimmen sofort. Manche Lieferanten erscheinen zu gut, weil bestimmte Buchungsarten noch nicht erfasst sind. Das Feintuning der Gewichtungen kostet Zeit. Erwarte, dass die erste automatische Bewertung noch einen halben Tag manueller Prüfung braucht, das ist kein Rückschritt, sondern Teil des Kalibrierungsprozesses.

Was nicht passiert: Das System übernimmt keine Lieferantenentscheidungen. Es erkennt keinen guten Lieferanten, den der Einkauf übersehen hatte. Es identifiziert keine neuen Einsparpotenziale. Das sind alles andere Anwendungsfälle. Wer das von einem Scoring-Tool erwartet, wird enttäuscht sein. Wer es als strukturierte Grundlage für bessere Gespräche mit Lieferanten versteht, wird es schätzen.

Typisches Widerstandsmuster: Ältere Einkäufer kennen “ihre” Lieferanten oft aus jahrelanger Zusammenarbeit und vertrauen dem Score weniger als ihrem Bauchgefühl. Das ist nicht dumm, Erfahrung ist wertvoll. Hilfreicher als Überzeugungsarbeit ist es, beide Wahrheiten nebeneinander zu stellen: “Das System sagt Liefertreue 68 %. Du sagst, der Grund dafür ist die Umstellungsphase im Q3. Lass uns das im nächsten Gespräch mit dem Lieferanten dokumentieren.” Das System wird zum Gesprächsprotokoll, nicht zum Richter.

Realistischer Zeitplan mit Risikohinweisen

Phase	Dauer	Was passiert	Typisches Risiko
ERP-Daten-Audit	Woche 1–2	Stichprobe ziehen, Datenqualität bewerten, Dubletten und Fehlbuchungen quantifizieren	Datenqualität ist schlechter als erwartet → Zeitplan verlängert sich
Datenbereinigungs-Sprint	Woche 2–6 (oder länger)	Stammdaten harmonisieren, Dubletten bereinigen, Buchungsregeln klären	Bei stark individualisiertem SAP: externe SAP-Berater nötig, Kosten steigen
Tool-Auswahl und Implementierung	Woche 4–8 (parallel möglich)	Anbieter evaluieren, Demoinstanzen testen, Konnektoren einrichten	Vendor Lock-in, wenn Anbindung proprietär und Wechsel teuer
Konfiguration der Scorecard	Woche 6–10	Bewertungskriterien und Gewichtungen definieren, ISO-9001-Audit-Anforderungen prüfen	Zu viele interne Stakeholder ohne Einigung → Scoring bleibt generisch
Pilotlauf und Kalibrierung	Woche 8–12	Ersten automatischen Zyklus durchführen, Ergebnisse mit manuellem Vergleich validieren	Abweichungen zwischen System und Realität → Datenpflege-Runde nötig
Einführung + Eskalationsprozesse	Ab Woche 12	Regelmäßigen Rhythmus etablieren, Alerting einrichten, Prüfprozess dokumentieren	System läuft, aber niemand handelt auf Ergebnisse → Adoption-Problem

Gesamtdauer bis produktivem Einsatz: Bei sauberem ERP 8–12 Wochen. Bei fragmentierter ERP-Landschaft realistisch 4–6 Monate bis zur zuverlässigen ersten Runde.

Häufige Einwände, und was dahintersteckt

“Wir kennen unsere Lieferanten, wir brauchen kein System dafür.” Stimmt für den Stamm von Tier-1-Lieferanten, die jeder Einkäufer persönlich kennt. Stimmt nicht für die 60–80 Prozent des Portfolios, die selten genug bestellt werden, um im aktiven Gedächtnis zu bleiben. Genau die werden in manuellen Prozessen überbewertet, weil kein schlechtes Erlebnis erinnerlich ist, obwohl die Daten einen Trend zeigen würden. Das System ist kein Ersatz für Beziehungswissen, es ist die Ergänzung für alles, was sich im Kopf nicht hält.

“Unsere ISO-9001-Bewertung haben wir immer gut bestanden.” Das kann sein. Die Frage ist, ob der Prüfer bei einer zukünftigen Erweiterung der Anforderungen (IATF 16949, CSRD-Lieferkettendaten, Lieferkettensorgfaltspflichtengesetz) noch zufrieden ist. Automatisierte Systeme sind zukunftssicherer als manuelle Prozesse, wenn regulatorische Anforderungen steigen, und sie steigen gerade in der deutschen Industrie. Ein System, das heute ausreicht, muss in zwei Jahren erweitert werden; besser, die Infrastruktur steht dann bereits.

“Das ist nichts für uns, wir sind zu klein.” Das kommt auf die Lieferantenanzahl an, nicht auf die Unternehmensgröße. Ein Betrieb mit 30 Mitarbeitenden und 80 aktiven Lieferanten hat denselben Aufwand für manuelle Bewertungen wie ein Betrieb mit 300 Mitarbeitenden. Die Frage ist: Hat der kleinere Betrieb eine Person, die zwei Wochen im Jahr für das Thema freistellen kann? Wenn nicht, ist Automatisierung auch hier sinnvoll, aber mit einer schlanken Lösung (Power BI + LLM), nicht mit einer Enterprise-Plattform.

Woran du merkst, dass das zu dir passt

Das spricht für eine Einführung:

Du hast mehr als 30 aktive Lieferanten und führst ihre Bewertung aktuell jährlich oder seltener durch
Dein Einkauf verbringt mehr als einen Arbeitstag pro Monat mit dem Zusammentragen von Lieferantendaten aus verschiedenen Systemen
Du hast in letzter Zeit Überraschungen bei Lieferanten erlebt, Probleme, deren frühes Signal du übersehen hast, weil Bewertungsdaten nur einmal im Jahr auf dem Tisch lagen
Du trägst ISO-9001-Verantwortung und deine aktuelle Dokumentation wäre im Audit ohne größere Nacharbeit nicht belastbar
Du belieferst die Automobilindustrie und willst IATF-16949-Anforderungen systematischer erfüllen

Drei harte Ausschlusskriterien:

Weniger als 25–30 strategische Lieferanten mit nennenswertem Bestellvolumen. Bei einem kleinen Portfolio ist ein gut strukturiertes quartalsweises Excel mit zwei bis drei Stunden Aufwand die effizientere Lösung. Der Implementierungsaufwand für ein automatisiertes System amortisiert sich nicht.
Kein standardisierter Wareneingangs- und QM-Prozess im ERP. Wenn Qualitätsmeldungen nicht systematisch in SAP oder einem angebundenen QM-Tool gebucht werden, hat das System keine Datenbasis für die Qualitätskennzahl. Wer erst Prozesse standardisieren müsste, sollte das unabhängig vom KI-Projekt tun, und danach die Automatisierung angehen.
ERP stark individualisiert ohne dokumentiertes Datenschema, kein SAP-internes Know-how im Team. Wenn niemand im Unternehmen weiß, welche SAP-Transaktion die Liefertreue abbildet oder wo Qualitätsmeldungen gebucht werden, ist das kein “kurzes Onboarding beim Anbieter”, das ist ein Consulting-Projekt von 3–6 Monaten. Das muss im Budget und im Zeitplan stehen, bevor die Entscheidung fällt.

Das kannst du heute noch tun

Starte mit einem kostenlosen Datencheck statt mit einem Tool-Kauf. Öffne SAP ME61 (oder das Äquivalent in deinem ERP) und lass für fünf deiner Hauptlieferanten die automatische Lieferantenbewertung der letzten 12 Monate laufen. Vergleiche das Ergebnis mit dem, was dein Einkaufsteam aus dem Bauch heraus sagen würde.

Wenn die Ergebnisse übereinstimmen: Dein ERP ist eine gute Datenbasis, der Schritt zur Automatisierung ist technisch machbar.

Wenn die Ergebnisse divergieren: Finde heraus warum. Fehlbuchungen? Dublettenprobleme? Unvollständige Daten? Die Antwort sagt dir, wie viel Datenarbeit vor der KI-Einführung liegt.

Parallel kannst du mit folgendem Prompt einen ersten Bewertungsbericht aus vorhandenen Daten erstellen, kein ERP-Connector nötig, nur eine Excel-Tabelle mit Lieferantendaten.

Lieferantenbewertung aus ERP-Daten

Du bist ein Einkaufsassistent für einen Maschinenbauer. Ich gebe dir Rohdaten zur Lieferantenperformance und du erstellst daraus einen strukturierten Bewertungsbericht. Die Daten kommen aus unserem ERP und umfassen folgende Spalten: [LIEFERANTENNAME] | [LIEFERTREUE in %] | [QUALITÄTSRATE in %] | [ANZAHL REKLAMATIONEN] | [OFFENE 8D-REPORTS] | [TREND ZUR VORPERIODE: besser/gleich/schlechter] Meine Daten: [HIER DEINE TABELLE EINFÜGEN, ca. 5-20 Lieferanten] Erstelle pro Lieferant: 1. Eine Ampelklassifikation (Grün / Gelb / Rot) basierend auf: Rot = Liefertreue <75% ODER Qualitätsrate <95% ODER >2 offene 8D-Reports; Gelb = Liefertreue 75-85% ODER Qualitätsrate 95-98%; Grün = alle Werte oberhalb 2. Eine 2-3-Satz-Einschätzung: Was zeigen die Daten? Was ist der Trend? 3. Einen konkreten empfohlenen nächsten Schritt (Gespräch ansetzen / Qualitätssicherungsmaßnahme / kein Handlungsbedarf) Abschluss: Eine Zusammenfassung, die ich direkt als Grundlage für ein Management-Reporting nutzen kann (max. 150 Wörter). Schreibe auf Deutsch. Bleib sachlich und faktenbasiert, keine Einschätzungen, die über die Daten hinausgehen.

Funktioniert mit ChatGPT, Claude, Gemini

Beispiel-Ausgabe

Mitarbeiter:in

Lieferant A GmbH | 91% | 98,2% | 1 | 0 | besser Müller Hydraulik | 72% | 94,5% | 4 | 2 | schlechter Berndt Präzision | 96% | 99,1% | 0 | 0 | gleich

KI-Assistent

**Lieferant A GmbH, Gelb** Liefertreue mit 91% im Gelbbereich, hat sich aber gegenüber der Vorperiode verbessert. Qualitätsrate und Reklamationsfrequenz unauffällig. → Empfehlung: Entwicklung beobachten, kein sofortiger Handlungsbedarf. Beim nächsten regulären Kontakt Lieferterminsituation ansprechen. **Müller Hydraulik, Rot** Kritische Bewertung: Liefertreue 72% (Schwellenwert unterschritten), Qualitätsrate knapp unter 95%, vier Reklamationen bei zwei noch offenen 8D-Reports, negative Trendentwicklung. → Empfehlung: Eskalationsgespräch innerhalb von 2 Wochen ansetzen. Gemeinsam Ursachenanalyse für Lieferverzögerungen klären, klaren Verbesserungsplan mit Meilensteinen vereinbaren. **Berndt Präzision, Grün** Sehr gute Performance in allen Kennzahlen, stabiler Trend. → Empfehlung: Kein Handlungsbedarf. Ggf. für strategische Partnerschaft oder Rahmenvertragsausbau vormerken. --- **Management-Zusammenfassung (Bewertungsrunde Q2 2026):** Von drei bewerteten Lieferanten erreicht einer (Berndt Präzision) grünen Status, einer (Lieferant A GmbH) gelben Status mit positivem Trend. Ein Lieferant (Müller Hydraulik) wurde als kritisch eingestuft und erfordert sofortige Maßnahmen. Eskalationsgespräch wurde für KW 21 geplant. Nächste vollständige Bewertungsrunde: Q3 2026.

Quellen & Methodik

82 % partielle Bewertungsabdeckung / durchschnittlich 4,5 Systeme: erp-management.de, „Datenqualität im Lieferanten-Risikomanagement” (abgerufen Mai 2026). https://erp-management.de/artikel/datenqualitaet-im-lieferanten-risikomanagement/
ISO 9001:2015 Abschnitt 8.4.1: ISO 9001:2015, „Control of externally provided processes, products and services, General”, Anforderung an dokumentierte Information über Bewertungsergebnisse und Maßnahmen. Abschnitt 8.4.1 Abs. 3. Aktuelle Normfassung.
Tacto Technologies, Einsparungen 2024: Tacto-Produktseite und Erfahrungsberichte (tacto.ai, Mai 2026); Pressemitteilungen UnternehmerTUM zu €50M-Finanzierungsrunde (Sequoia/Index Ventures, 2024). https://www.unternehmertum.de/en/press/tacto-sichert-sich-50-millionen-euro-fuer-den-aufbau-zukunftssicherer-lieferketten-im-mittelstand
Jaggaer ONE Einstiegspreise: Gartner Peer Insights / SelectHub, „JAGGAER ONE Reviews & Ratings 2026” (abgerufen Mai 2026). https://www.selecthub.com/p/procurement-software/jaggaer-one/
SAP ME61 Lieferantenbewertung, Methoden: Rewion IT-Beratung, „Lieferantenbewertung in SAP: Drei bewährte Methoden im Überblick” (abgerufen Mai 2026). https://www.rewion.com/lieferantenbewertung-in-sap-drei-bewaehrte-methoden-im-ueberblick/
IATF 16949 Lieferantenanforderungen: Kontor-Gruppe, „IATF 16949 Zertifizierung, Anforderungen, Ablauf und Vorteile” (abgerufen Mai 2026). https://www.kontor-gruppe.de/iatf-16949.html
Power BI Pro Preise: Microsoft offizielle Preisliste Power BI (Stand Mai 2026). https://powerbi.microsoft.com
Zeitaufwand Lieferantenaudit: Tacto Einkäufer-Lexikon, „Lieferantenaudit: Definition, Methoden und Best Practices” (abgerufen Mai 2026); qualitative Praxisberichte. https://www.tacto.ai/de/einkaufer-lexikon/lieferantenaudit

Willst du wissen, ob deine ERP-Datenbasis für eine automatisierte Lieferantenbewertung reif genug ist, und welcher Ansatz zu deiner Infrastruktur passt? Schreib uns, wir helfen beim strukturierten Datencheck.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

🤝

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.

Alle KI-Tools für Maschinenbau vergleichen

Weitere Use Cases

Predictive Maintenance: Ausfälle vorhersagen statt reparieren

Maschinenausfälle ankündigen sich durch Vibration, Temperatur und Stromaufnahme, Wochen bevor sie passieren. KI-Modelle erkennen diese Muster und ermöglichen gezielten Eingriff.

Mehr erfahren

Qualitätskontrolle per Kamera: Sichtprüfung automatisieren

Visuelle Inspektion von Bauteilen auf Kratzer, Maßabweichungen und Oberflächenfehler per KI-Kamerasystem, schneller und konsistenter als manuelle Prüfung.

Mehr erfahren

Technische Dokumentation automatisch erstellen

CAD-Daten, Stücklisten und interne Spezifikationen per KI in normgerechte Betriebsanleitungen und Wartungshandbücher umwandeln, Redaktionsaufwand halbieren.

Mehr erfahren

Zurück zu Maschinenbau

Frieda Funke

Konzeptentwicklerin

Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.

Fehlt dein Anwendungsfall? Mehr über das Team

Lieferantenbewertung automatisieren

Das echte Ausmaß des Problems

Mit vs. ohne KI, ein ehrlicher Vergleich

Einschätzung auf einen Blick

Was das System konkret macht

Datenqualität als Voraussetzung

Was ISO 9001 und IATF 16949 von euch verlangen

Konkrete Werkzeuge, was wann passt

Datenschutz und Datenhaltung

Solche Praxis-Analysen, regelmäßig in deinem Postfach

Was es kostet, realistisch gerechnet

Typische Einstiegsfehler

Was mit der Einführung wirklich passiert, und was nicht

Realistischer Zeitplan mit Risikohinweisen

Häufige Einwände, und was dahintersteckt

Woran du merkst, dass das zu dir passt

Das kannst du heute noch tun

Quellen & Methodik

Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?

Weitere Use Cases

Predictive Maintenance: Ausfälle vorhersagen statt reparieren

Qualitätskontrolle per Kamera: Sichtprüfung automatisieren

Technische Dokumentation automatisch erstellen

Bleib auf dem neuesten Stand der KI

Bleib auf dem neuesten
Stand der KI