Automatische Störungsanalyse
KI analysiert Maschinenstörungen und Fehlerprotokolle und identifiziert Ursachen und Muster schneller als manuelle Fehlersuche — und verhindert, dass dieselben Fehler sich wiederholen.
- Problem
- Nach einem Maschinenstillstand dauert die Ursachenanalyse oft länger als die eigentliche Reparatur. Ursachen bleiben unklar, Fehler wiederholen sich.
- KI-Lösung
- RAG-basierte Diagnose-KI durchsucht Maschinenlogs, Wartungsprotokolle und Sensordaten und identifiziert die wahrscheinlichste Ursache mit Lösungsvorschlag in Minuten.
- Typischer Nutzen
- Ursachenanalyse von durchschnittlich 90 Minuten auf unter 25 Minuten reduzieren; Wiederholstörungsrate durch systematische Ursachenbeseitigung um 30–50 % senken.
- Setup-Zeit
- 4–10 Wochen je nach Datenlage
- Kosteneinschätzung
- 20–40 €/Mo (LLM) oder 15–40 T€ Setup + 2–8 T€/Mo
Es ist Dienstagnachmittag, 14:22 Uhr. Die Anlage steht.
Rudi, 58, Instandhaltungstechniker seit 31 Jahren, kommt mit seiner Werkzeugkiste. Er schaut kurz auf die Steuerung — Fehlercode E-47, der dritte in diesem Quartal. Er weiß, was das wahrscheinlich ist. Hat er schon zweimal gehabt. Beim zweiten Mal hat er 40 Minuten gebraucht, um es einzugrenzen. Beim ersten Mal zwei Stunden.
Was er nicht weiß: In drei Jahren geht Rudi in Rente. Und sein Kollege Klaus, der das andere Gebäude betreut, sieht E-47 das erste Mal. Klaus wird 90 Minuten brauchen. Sein Nachfolger — wenn er irgendwann eingestellt wird — wird zwei Stunden brauchen, weil das Wissen, das Rudi im Kopf hat, nirgendwo steht.
Die Anlage läuft wieder um 15:09 Uhr. 47 Minuten Stillstand, 4.000 € Produktionsausfall — und Rudi schreibt den Eintrag ins Wartungsbuch: “E-47, Motorschutzrelais zurückgesetzt, Ursache unklar.”
In sechs Wochen ist er im Urlaub. Der Fehler kommt wieder.
Das echte Ausmaß des Problems
Laut einer Studie des Fraunhofer IPA dauert die Ursachenanalyse bei ungeplanten Stillständen im Schnitt 40 bis 60 Prozent der gesamten Stillstandszeit. Das heißt: Wenn eine Anlage 4 Stunden steht, werden davon 1,5 bis 2,5 Stunden damit verbracht, herauszufinden, was das Problem überhaupt ist — nicht es zu lösen.
Das Problem hat drei Wurzeln. Erstens ist Fehlerwissen personengebunden: Erfahrene Techniker wissen aus dem Bauch, wo man bei bestimmten Symptomen zuerst sucht — dieses Wissen ist nicht dokumentiert und geht mit jeder Pensionierung verloren. In deutschen Produktionsbetrieben werden bis 2030 mehr als 30 % der Instandhaltungs-Fachkräfte das Rentenalter erreichen (VDMA-Prognose 2023).
Zweitens sind Maschinenlogs unstrukturiert: Steuerungssysteme erzeugen Fehlercodes, aber diese sind oft kryptisch und ohne Kontext. “Error E47” sagt nichts darüber aus, ob das die zwölfte Meldung dieses Codes in diesem Monat ist oder das erste Mal.
Drittens werden Wiederholstörungen nicht systematisch bekämpft: Eine Anlage stoppt, wird repariert, läuft wieder — und niemand analysiert, ob dasselbe Problem drei Monate vorher schon einmal aufgetreten ist.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit KI-Störungsanalyse |
|---|---|---|
| Zeit für Ursachenanalyse | 40–60 % der Stillstandszeit | 10–20 % der Stillstandszeit |
| Wissensverfügbarkeit | Personengebunden, geht mit Rente | Im System, für alle Techniker abrufbar |
| Wiederholstörungsrate | Selten systematisch analysiert | Muster erkennbar, Ursachenbeseitigung möglich |
| Einarbeitung neuer Techniker | 12–24 Monate bis voller Kompetenz | 4–8 Monate durch Wissensdatenbank |
| Dokumentationsqualität | Variiert stark nach Techniker | Konsistent strukturiert |
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) 40–60 % weniger Fehlersuche je Stillstand ist konkret messbar. Bei drei Stillständen pro Woche und durchschnittlich 2 Stunden Fehlersuche sind das 2–3 Techniker-Stunden pro Woche — das summiert sich. Nicht ganz maximal bewertet, weil die eigentliche Reparatur gleich bleibt.
Kosteneinsparung — mittel (3/5) Kürzere Stillstände bedeuten weniger Produktionsausfall. Aber im Vergleich zu Predictive Maintenance oder Qualitätskontrolle ist der direkte Kostenhebel kleiner — weil nicht der Ausfall selbst verhindert, sondern “nur” die Diagnosetime verkürzt wird.
Schnelle Umsetzung — mittel (3/5) Vier bis zehn Wochen bis zu einer funktionierenden Wissensdatenbank und Mustererkennung — realistisch, wenn Maschinenlogs vorhanden sind. Wenn Logs in inkompatiblen Formaten oder nur auf Papier vorliegen, dauert die Datenaufbereitung länger.
ROI-Sicherheit — hoch (4/5) Stillstandsdauer ist messbar. Wenn die durchschnittliche Diagnosedauer von 90 auf 25 Minuten sinkt, lässt sich dieser Effekt nach 6 Monaten Betrieb belastbar zeigen. Klarer als die meisten indirekten KI-Nutzen.
Skalierbarkeit — mittel (3/5) Die Wissensdatenbank wächst mit jedem gelösten Fall wertvoller. Aber jeder neue Maschinentyp erfordert eigene Muster-Analyse und initiale Datenbasis. Nicht so skalierbar wie ein reines Software-Tool.
Richtwerte — stark abhängig von vorhandener Maschinendatenqualität und Techniker-Einbindung.
Was KI-Störungsanalyse konkret macht
Schritt 1 — Maschinenlogs und Wartungshistorie strukturieren: Alle vorhandenen Datenpunkte werden zusammengeführt: Fehlerprotokolle aus der Maschinensteuerung (PLC/SPS), Wartungsberichte aus dem CMMS, Sensor-Zeitreihen und manuelle Techniker-Notizen. Eine KI-Lösung liest diese Daten ein und normiert sie — verschiedene Fehlercodes aus verschiedenen Maschinentypen werden in ein einheitliches Schema überführt.
Schritt 2 — Ursachen-Muster-Erkennung: Die KI analysiert, welche Fehlerkombinationen typischerweise zusammen auftreten und welche zeitlichen Muster es gibt: Tritt Fehler E47 immer wenige Stunden nach Fehler E23 auf? Gibt es eine Korrelation zwischen erhöhter Vibrationsintensität und anschließendem Lagerausfall? Aus diesen Mustern entstehen Diagnoseregeln.
Schritt 3 — Echtzeit-Diagnose bei Störung: Wenn eine neue Störung eintritt, liefert das System sofort einen strukturierten Vorschlag: “Auf Basis der aktuellen Fehlercodes und der Wartungshistorie ist die wahrscheinlichste Ursache X (78 %) — alternativ Y (15 %). Empfohlene erste Prüfschritte: 1. Hydraulikdruck an Punkt A messen, 2. Lager B auf Spiel prüfen.” Der Techniker beginnt mit der wahrscheinlichsten Ursache statt systematisch alle Möglichkeiten durchzugehen.
Schritt 4 — Wissensaufbau und Ursachenbeseitigung: Jede gelöste Störung wird ins System zurückgespiegelt: Was war die tatsächliche Ursache? Welche Schritte haben geholfen? Dieses Feedback verbessert die Diagnosequalität laufend und baut gleichzeitig eine durchsuchbare Wissensbasis auf, die auch bei Personalwechsel erhalten bleibt.
Konkrete Werkzeuge — was wann passt
ChatGPT für Protokoll-Analyse — Wenn Wartungsprotokolle und Fehlerberichte als Text oder PDF vorliegen, kann ChatGPT dabei helfen, Muster zu identifizieren. “Analysiere diese 50 Wartungsberichte und zeige mir, welche Fehlertypen sich wiederholen.” Guter Einstieg ohne technische Integration. Ab 20 €/Monat.
Claude für Diagnose-Unterstützung — Claude ist besonders stark darin, technische Beschreibungen zu interpretieren und aus Fehlerbildern strukturierte Diagnose-Leitfäden zu erstellen. Gut geeignet, wenn Techniker unsicher sind und einen zweiten Blick brauchen. Ab 18 €/Monat.
Microsoft Power BI — Für die Visualisierung von Störungsstatistiken: Welche Anlagen haben die meisten Ausfälle? In welchen Schichten? Zu welcher Jahreszeit? Diese Auswertungen sind Grundlage für systematische Ursachenbeseitigung. Ab 10 €/Nutzer/Monat.
Notion AI — Für den Aufbau einer internen Störungs-Wissensdatenbank: Wartungsberichte, Lösungsschritte und Diagnose-Protokolle strukturiert ablegen, mit KI durchsuchbar. Besonders gut für Teams ohne spezialisiertes CMMS. Ab 10 €/Nutzer/Monat.
Für vollständige CMMS-Integration mit KI-Modul: IBM Maximo und Fiix bieten spezialisierte Diagnoseunterstützung. Kosten: 2.000–8.000 €/Monat je nach Unternehmensgröße.
Datenschutz und Datenhaltung
Störungsanalyse arbeitet mit Maschinendaten und Wartungsprotokollen — primär ohne Personenbezug. Relevant wird DSGVO, wenn Techniker-Notizen oder Schichtinformationen mit Maschinendaten verknüpft werden: Dann können Leistungsdaten einzelner Mitarbeitenden entstehen, was Mitbestimmungspflichten nach BetrVG §87 Abs. 1 Nr. 6 auslöst.
Praxis-Empfehlung: Störungsanalyse-Systeme so konfigurieren, dass Auswertungen nur auf Anlagen-Ebene, nicht auf Techniker-Ebene aggregiert werden — außer wenn eine Betriebsvereinbarung das explizit regelt und der Betriebsrat zugestimmt hat.
Was es kostet — realistisch gerechnet
Einstieg (KI als Analyse-Werkzeug, keine Systemintegration):
- ChatGPT oder Claude: 20–40 €/Monat
- Zeitaufwand: 3–5 Stunden/Woche für strukturierte Protokollanalyse
- Ergebnis: Erste Muster erkennbar, beginnende Wissensdatenbank
Skaliert (CMMS mit KI-Modul):
- IBM Maximo, Fiix: 2.000–8.000 €/Monat je nach Unternehmensgröße
- Implementierung: 15.000–40.000 € einmalig
- Ergebnis: Echtzeit-Diagnose, vollautomatische Musteranalyse
Konservatives ROI-Beispiel: Kunststoffverarbeitung, 12 Spritzgussmaschinen, 3 ungeplante Stillstände/Woche à 3,5 Stunden (davon 2,5 Stunden Fehlersuche), Stillstandskosten 4.500 €/Stunde. Mit KI-Diagnose sinkt die Fehlersuche von 2,5 Stunden auf 45 Minuten. Einsparung pro Stillstand: ca. 7.900 €. Bei 3 Stillständen/Woche: erhebliches Einsparpotenzial. Tool-Kosten: 3.000 €/Monat. ROI: positiv in den ersten Betriebswochen.
Typische Einstiegsfehler
1. Techniker nicht einbinden. Ohne die aktive Beteiligung erfahrener Techniker an der Wissensdatenbank und der Validierung von Diagnoseregeln entsteht ein System, dem niemand vertraut. Techniker müssen von Anfang an als Experten eingebunden sein, nicht als Systemnutzer.
2. Zu spät mit Datenpflege beginnen. Wenn gelöste Störungen nicht systematisch ins System zurückgespiegelt werden, lernt das System nicht. Die Rückmeldung “Ursache war X, Lösung war Y” nach jeder behobenen Störung muss als Prozessstandard etabliert werden.
3. Pilot auf stabile Anlage starten. Wer die Anlage mit den wenigsten Störungen als Pilot wählt, bekommt zu wenige Ereignisse für sinnvolle Musteranalyse. Start mit der Anlage mit der höchsten Störungsrate.
4. Modell als unveränderlich betrachten. Wenn eine Anlage umgebaut, neu kalibriert oder mit anderen Produkten bestückt wird, ändern sich die Fehlermuster. Das Modell muss dann überprüft und angepasst werden.
Was mit der Einführung wirklich passiert — und was nicht
Erfahrene Techniker sind zunächst skeptisch: “Ich weiß selbst am besten, wo der Fehler liegt.” Das ist berechtigt — und das System behauptet nicht das Gegenteil. Es hilft dem erfahrenen Techniker, schneller zu bestätigen, was er ohnehin vermutet. Und es hilft dem neuen Kollegen, nicht von null anzufangen.
Was oft passiert: Nach 3–4 Monaten beginnen Techniker, das System aktiv zu ergänzen — sie dokumentieren Lösungsschritte, die “nicht offensichtlich” waren, weil sie wissen, dass der nächste Kollege davon profitiert. Das ist der wertvollste Effekt.
Was nicht passiert: Das System diagnostiziert alle Fehler korrekt. Für unbekannte Fehlermuster, für die keine historischen Daten vorliegen, gibt es keine Diagnose — hier bleibt die menschliche Expertise unverzichtbar.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Datensichtung und -aufbereitung | Woche 1–2 | Fehlerprotokolle, Wartungsberichte, Maschinenprotokolle sichten | Daten in inkompatiblen Formaten — manueller Aufwand zum Aufbereiten |
| Pilotanlage auswählen | Woche 2–3 | Anlage mit höchster Störungsrate als Pilot definieren, historische Daten einlesen | Pilotanlage zu stabil — zu wenige Ereignisse für Musteranalyse |
| Muster-Analyse und Wissensbasis | Woche 3–6 | KI analysiert historische Daten, erste Diagnoseregeln entwickeln | Diagnoseregeln treffen nicht auf neue Störungstypen zu |
| Pilotbetrieb mit Technikern | Woche 6–10 | KI-Diagnose bei echten Störungen parallel zur manuellen Fehlersuche | Techniker misstrauen dem System — enge Einbindung von Anfang an |
| Einführung auf weitere Anlagen | Ab Monat 3–4 | Bewährte Regeln auf weitere Anlagen ausweiten | Qualitätsunterschiede zwischen Anlagentypen — jede braucht eigene Kalibrierung |
Häufige Einwände — und was dahintersteckt
„Unsere Techniker wissen selbst am besten, wo der Fehler liegt.” Erfahrene Techniker sind Gold wert — genau deshalb sollten sie nicht unnötig Zeit mit systematischem Ausprobieren verbringen. KI fokussiert die Expertise: der Techniker geht mit begründetem Verdacht an die Anlage. Und wenn er in Rente geht, bleibt sein Wissen im System.
„Unsere Maschinen sind zu alt für digitale Schnittstellen.” Für ältere Anlagen gibt es zwei Wege: Nachrüstung mit Sensoren (500–2.000 € pro Anlage) oder rein textbasierte Analyse der vorhandenen Wartungsprotokolle. Letzteres ist weniger präzise, aber ein guter Einstieg ohne Hardware-Investition.
„Wir haben zu wenige Störungen für eine aussagekräftige Analyse.” Weniger als 5 Störungen pro Monat: Musteranalyse ist schwierig. Aber die Wissensdatenbank lohnt sich trotzdem als strukturierte Ablage von Lösungswegen, die neue Techniker nutzen können.
Woran du merkst, dass das zu dir passt
- Ungeplante Maschinenstillstände dauern bei dir im Schnitt mehr als 2 Stunden — weil die Fehlersuche viel Zeit nimmt.
- Das Diagnose-Wissen steckt hauptsächlich in den Köpfen von ein oder zwei erfahrenen Technikern.
- Dieselben Fehler tauchen wiederholt auf, ohne dass die Ursache dauerhaft beseitigt wurde.
- Maschinenlogs existieren (im Steuerungssystem oder auf Papier), werden aber kaum ausgewertet.
Wer noch nicht bereit ist:
- Du hast keine Wartungshistorie — keine Protokolle, keine CMMS-Daten, nichts Schriftliches über vergangene Störungen.
- Deine Anlagen laufen stabil mit weniger als 1 Störung/Monat — zu wenig für belastbare Musteranalyse.
- Dein Instandhaltungsteam besteht aus einer Person — kein Wissenstransfer-Problem, keine Datenbasis.
Das kannst du heute noch tun
Sammle die Wartungsprotokolle oder Störungsberichte der letzten 6 Monate — egal in welchem Format — und frag ChatGPT: “Analysiere diese Wartungsberichte und zeige mir: Welche Fehlertypen tauchen am häufigsten auf? Gibt es Anlagen, die unverhältnismäßig oft betroffen sind? Welche Fehler wurden wiederholt ohne dauerhafte Lösung behoben?” Das dauert 20 Minuten und zeigt dir, ob ein System lohnt.
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Fraunhofer IPA — Studien zu Instandhaltungseffizienz und Stillstandszeiten im deutschen Maschinenbau, 2022/2023
- VDMA — Fachkräftestudie Instandhaltung, Prognose 2023–2030
- VDI 2886 — Methoden der Instandhaltung, Richtlinie für Wissensmanagement in der Instandhaltung
- IBM Maximo, Fiix — Produktdokumentation KI-basierte Störungsdiagnose, Stand April 2026
- Eigene Projekterfahrungen — Instandhaltungs-Digitalisierungsprojekte im deutschen Mittelstand 2022–2025; Stand April 2026
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Predictive Maintenance — Maschinenausfälle vorhersagen
KI analysiert Sensordaten von Maschinen und erkennt drohende Ausfälle Tage oder Wochen im Voraus — bevor die Anlage steht und die Produktion stillsteht.
Mehr erfahrenKI-Qualitätskontrolle in der Produktion
KI-Bildverarbeitungssysteme erkennen Produktionsfehler zuverlässiger und schneller als das menschliche Auge — und halten die Qualität auch bei hohem Durchsatz stabil.
Mehr erfahrenKI-optimierte Schichtplanung
KI erstellt Schichtpläne, die Produktionsbedarf, Mitarbeiterpräferenzen und Arbeitszeitvorgaben automatisch balancieren — in Minuten statt Stunden.
Mehr erfahren