Pumpen, Kompressoren und Reaktoren vorausschauend warten
ML-Modelle analysieren Vibrations-, Temperatur- und Drucksensordaten kontinuierlich und prognostizieren Komponentenausfälle Tage bis Wochen vor dem Stillstand.
- Problem
- Ungeplante Anlagenstillstände in der Chemie kosten je nach Anlage 10.000–100.000 € pro Stunde — plus Sicherheitsrisiken bei Hochdruckreaktoren und Druckbehältern. Präventive Wartungspläne nach Kalender ersetzen Teile oft zu früh oder zu spät.
- KI-Lösung
- Condition Monitoring + ML-Ausfallprognose (Isolation Forest für Anomalieerkennung, LSTM-Netze für Remaining Useful Life): Vibrationssensoren, Temperaturfühler und Stromsensoren liefern Echtzeitdaten; Degradationsmodelle berechnen Restnutzungsdauer je Komponente.
- Typischer Nutzen
- Ungeplante Stillstandszeiten um 30–50% reduziert. Wartungskosten durch bedarfsgerechte statt kalenderbasierte Intervalle um 15–25% gesenkt.
- Setup-Zeit
- 6–12 Monate bis zum produktiven Prognosemodell
- Kosteneinschätzung
- 80.000–150.000 € Gesamtinvestition Jahr 1 (ATEX-Sensoren, Montage, Plattform, Implementierung) für 30 Maschinen; laufend 30.000–60.000 €/Jahr Plattform
Es ist 2:17 Uhr. Werksinstandhaltungsleiter Jens Brauer wird angerufen.
Pumpe P-114 in der Kühlwasserversorgung des Reaktorblocks 3 hat ein Lager mit Totalschaden. Das Kühlsystem fährt auf Notlast, der Reaktor muss runter. Die Bestandsersatzlager reichen Norm 6310 — und Pumpenlieferant Grundfos hat den passenden Flanschtyp nicht auf Lager. Drei Tage Lieferzeit. Drei Tage Stillstand. Produktionsausfall: ungefähr 280.000 Euro.
Was Brauer zwei Tage später herausfindet: In den Vibrationsdaten der Pumpe war seit elf Tagen ein Muster, das auf fortschreitenden Lagerschaden hindeutete. Gemessen wurde es längst — der Druckluftmesswandler am Förderaggregat meldet seit Jahren brav in den Leitstand. Analysiert hat es niemand. Die Daten lagen im Historian. Unberührt.
Predictive Maintenance ist nicht das Problem, überhaupt Daten zu haben. Es ist das Problem, sie rechtzeitig auszuwerten — und zu wissen, worauf man schauen muss.
Das echte Ausmaß des Problems
Ungeplante Anlagenstillstände in der Prozessindustrie kosten laut McKinsey durchschnittlich 10.000 bis 100.000 Euro pro Stunde, abhängig von Anlagengröße und Produktmix. Im Spezialchemiebereich — wo ein Produktionsstopp nicht nur die laufende Charge gefährdet, sondern auch Freigabeprozesse und Kundenliefertermine — liegt der wirtschaftliche Schaden oft erheblich darüber.
Das Kernproblem ist nicht fehlende Messtechnik. Moderne Chemieanlagen sind mit Sensoren gut bestückt. Das Problem ist das Verhältnis zwischen generierten Daten und tatsächlich ausgewerteten Daten. Ein typisches Spezialchemiewerk mit 200 Messstellen erzeugt täglich mehrere Gigabyte Prozessdaten. Ausgewertet werden davon in der Regel: Schwellenwertüberschreitungen und Alarme. Alles unterhalb der Alarmgrenze — die schleichende Degradation, das sich verändernde Spektrum, der leicht steigende Strombedarf — geht unter.
Lagerschäden verursachen laut Branchenerhebungen 40–50 % aller Kreiselpumpenausfälle. Der Verlauf ist typisch: Frühes Spektralmuster → Lagerspiel nimmt zu → Grundfrequenz-Überhöhung → Totalschaden. Zwischen dem ersten detektierbaren Signal und dem Ausfall liegen je nach Drehzahl und Last 2–8 Wochen. Das ist das Fenster, das Predictive Maintenance öffnen will.
Dichtungsausfälle machen weitere 20–25 % der Pumpenausfälle aus. Ihre Frühsignale sind schwächer und weniger eindeutig als Lagersignale — mehr dazu im Abschnitt zu den Grenzen des Systems.
Das globale Chemieunternehmen Solvay hat bis 2024 mehr als 5.000 IIoT-Sensoren in 25 Werken über 11 Länder installiert und plant den Ausbau auf 9.000 Einheiten. Das zeigt den realen Investitionsumfang, den Konzerne für vertretbar halten. Für ein mittelständisches Chemiewerk bedeutet das aber auch: Solvay hat ein Programm über Jahre, erhebliche IT-Ressourcen und eine eigene Analytics-Abteilung. Wer das ohne diese Grundlagen replizieren will, braucht einen deutlich schmaleren Einstieg.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Kalenderbasierte Wartung | Predictive Maintenance |
|---|---|---|
| Stillstandserkennung | Erst beim Ausfall oder Routineinspektion | 2–8 Wochen Vorlauf bei Lagerschäden |
| Wartungsintervalle | Festgelegt (z. B. alle 8.000 Betriebsstunden) | Bedarfsgerecht nach Komponentenzustand |
| Teileverbrauch | Oft zu früh oder zu spät gewechselt | Nur bei tatsächlichem Bedarf |
| Notfall-Stillstände | 1–4 pro Jahr je nach Anlagengröße üblich | Reduktion um 30–50 % realistisch ¹ |
| Wartungskosten | Hoher Anteil unnötiger Wechsel | 15–25 % niedriger durch Bedarfsorientierung ¹ |
| Sicherheitsvorfälle | Druck-/Temperaturausfälle ohne Vorwarnung | Frühsignale bei thermisch kritischen Komponenten |
¹ Erfahrungswerte aus industriellen Pilotprojekten; tatsächliche Werte hängen stark von Anlagentyp, Sensorabdeckung und Modellqualität ab.
Einschätzung auf einen Blick
Zeitersparnis — niedrig (2/5) Predictive Maintenance spart keine direkte Arbeitszeit für Mitarbeitende — sie arbeiten nicht schneller, sie haben nicht weniger Aufgaben. Was sie haben: weniger Notfallschichten, weniger Wochenend-Einsätze bei Havarien. Das ist real, aber in keiner Arbeitsstatistik direkt messbar. Im Vergleich zu anderen Anwendungsfällen in dieser Branche — Chargendokumentation, Rohstoffpreistracking, HPLC-Auswertung — ist der direkte Zeiteffekt auf Personen minimal. Die Wirkung entfaltet sich im Stillstandsprotokoll, nicht in der Zeiterfassung.
Kosteneinsparung — maximal (5/5) Das ist der stärkste Hebel in der gesamten Branche: Ein einziger verhinderter Notstopp an einem Hochdruckreaktor kann 100.000 bis 500.000 Euro Produktionsausfall verhindern — und die Implementierungskosten eines PdM-Piloten für mehrere Jahre amortisieren. Auch bei einfacheren Kreiselpumpen sind vermiedene Notfall-Stillstände ein multiplizierender Faktor. Kein anderer KI-Anwendungsfall in der Chemie hat dieses direkte Kostenabschneide-Potential.
Schnelle Umsetzung — niedrig (2/5) Bis ein produktives Prognosemodell läuft, vergehen realistisch 6–12 Monate: Sensornachrüstung und Kabelführung in ATEX-Bereichen, Datenübertragungsinfrastruktur, mindestens 3–6 Monate Baseline-Datensammlung, Modelltraining, Validierung, Pilotbetrieb. Es gibt keinen Shortcut. Tools, die versprechen, in 4 Wochen Ergebnisse zu liefern, starten mit Anomalieerkennung auf Schwellenwertbasis — das ist nicht Predictive Maintenance, das ist digitalisierter Leitstand.
ROI-Sicherheit — hoch (5/5) Der ROI ist direkter messbar als bei fast jedem anderen KI-Anwendungsfall: Stillstandsprotokolle existieren, Stillstandskosten sind kalkulierbar, verhinderte Ausfälle sind nachweisbar. Ein Fertigungsunternehmen, das drei Jahre lang je 1–2 ungeplante Stopps pro Quartal hatte und danach keinen mehr, kann das beziffern. Anders als bei Wissensmanagement oder Sentiment-Analyse gibt es hier eine klare Kausalkette.
Skalierbarkeit — gut (4/5) Ein trainiertes Modell für Kreiselpumpen lässt sich innerhalb derselben Anlagenklasse auf weitere Pumpen des gleichen Typs übertragen — das skaliert gut. Was nicht skaliert: Das Modell für die Kreiselpumpe transferiert nicht auf den Schraubenkompressor oder den Rührwerksantrieb. Jede Anlagenklasse braucht eigene Trainingsdaten, eine eigene Merkmalsselektion und einen eigenen Validierungsprozess. Wer drei Anlagenklassen überwachen will, plant drei Projekte — nicht eines mal drei. Das ist der entscheidende Unterschied zu Software-Lösungen, die wirklich beliebig skalieren.
Richtwerte — stark abhängig von Anlagengröße, bestehender Sensorinfrastruktur und Datenverfügbarkeit.
Was das System konkret macht
Predictive Analytics für Industrieanlagen besteht aus vier aufeinander aufbauenden Schichten:
Schicht 1: Datenerfassung. Vibrationssensoren am Lagergehäuse (axial und radial), Temperaturfühler an Lager und Mediumaustritt, Strommessung am Motoranschluss — diese drei Messgrößen bilden für rotierende Maschinen das Fundament. Dazu kommen Prozessparameter aus dem bestehenden DCS oder Historian: Durchfluss, Förderdruck, Drehzahl.
Schicht 2: Merkmalsextraktion. Rohe Vibrationsdaten sind für Machine Learning wenig nützlich. Relevante Merkmale sind: Schwingungsspitzenwerte (0–1 kHz für Unwucht, 1–10 kHz für Lagerverschleiß), Kurtosis als Maß für impulshafte Schwingungen, Spektrallinien bei den Lager-Kennfrequenzen (BPFI, BPFO, BSF, FTF je Lagertyp). Diese Merkmale extrahiert entweder die Sensorsoftware selbst oder eine Prozessanalyse-Plattform.
Schicht 3: Anomalieerkennung und Degradationsmodell. Machine-Learning-Modelle lernen aus der Baseline, wie „normale” Betriebszustände für jede Komponente aussehen, und quantifizieren Abweichungen. Anspruchsvollere Modelle berechnen zusätzlich die Remaining Useful Life (RUL) — eine Schätzung, wie viel Restlaufzeit die Komponente noch hat. Diese Schätzung hat eine Unsicherheit, die transparent kommuniziert werden muss.
Schicht 4: Alarm und Handlungsempfehlung. Das System erzeugt keine Diagnose, sondern eine Wahrscheinlichkeitsaussage: „Lager P-114 zeigt Merkmale eines frühen Pitching-Schadens — Konfidenz 83 %, empfohlene Prüfung innerhalb 14 Tage.” Die Entscheidung trifft der Instandhaltungsleiter, nicht das System.
Das Modell braucht für zuverlässige Ergebnisse typischerweise 6–9 Monate Basisdaten — im Idealfall inkl. einiger Anomalie-Events, aus denen es Fehlermuster lernen kann. Wer mit einer perfekt gewarteten Anlage startet, hat im ersten Jahr oft zu wenig Fehlerdaten fürs Training.
Wo die Sensoren tatsächlich hingehören
Das ist der Schritt, bei dem die meisten Pilotprojekte unterschätzen, wie viel Detailwissen nötig ist. Die falsche Sensorposition liefert Daten, die nichts über den tatsächlichen Maschinenzustand aussagen.
Kreiselpumpen. Vibrationssensoren gehören ans Lagergehäuse — nicht ans Pumpengehäuse, nicht an die Rohrleitung. Idealposition: triaxial auf der Antriebsseite (DE) am Motorlager und auf der Nicht-Antriebsseite (NDE) am Pumpenlager. Die Montage erfolgt mit Gewindestift (M5 oder M6) für reproduzierbare Kopplung — Magnethalter sind für Dauermessung nicht geeignet, weil der Kopplungsfaktor variiert. Messhöhe für Lagerschwingungen: 1–10 kHz; für Unwucht und Ausrichtungsfehler: unter 100 Hz.
Schraubenkompressoren. Antriebsseitig und abtriebsseitig je ein Sensor. Besonderheit: Schraubenkompressoren erzeugen eine charakteristische Zahnfrequenz (Schraubenfrequenz = Drehzahl × Zähnezahl), die im Normalbetrieb als Referenz dient. Verändert sich das Seitenband-Muster um diese Frequenz, deutet das auf Schraubenverschleiß hin — nicht auf Lagerschaden. Das unterscheidet den Kompressor von der einfacheren Pumpendiagnostik.
Rührwerke und Reaktoren. Hier dominieren Prozessparameter gegenüber Vibration: Rührmotor-Stromaufnahme, Rührwerksdrehzahl, Temperaturprofil im Reaktor, pH-Gradient bei Reaktionschargen. Vibrationsmessung am Wellendurchführungslager ist sinnvoll, aber das dominierende Ausfallmuster bei Rührwerken ist Lagerverschleiß durch Korrosion oder Fremdkörpereintrag — den erkennt man früher über Strom-Monitoring als über Vibration.
Wärmetauscher. Klassische Vibrationssensoren bringen hier wenig. Wärmetauscher-Degradation zeigt sich über Prozessparameter: sinkendes Temperaturdifferential bei gleichem Durchfluss, steigender Druckverlust, veränderte Wärmedurchgangskoeffizienten. Das ist Condition Monitoring auf Prozessdatenbasis — kein Schwingungsproblem, sondern ein Fouling-Problem, das Prozessanalytik-Tools wie Seeq besser adressieren als Vibrationssensorik.
Messintervall. Für Lagerschäden ist eine Abtastrate von mindestens 10 kHz nötig, um hochfrequente Lagerkennfrequenzen zu erfassen. Drahtlose IIoT-Sensoren übertragen in der Regel komprimierte Merkmale, nicht Rohdaten — die Merkmalextraktion findet auf dem Sensor statt, was die Übertragungslast reduziert, aber auch die Diagnosemöglichkeiten einschränkt.
ATEX-Zonen und drahtlose Sensoren
In Chemieanlagen ist der Bereich, in dem Sensoren installiert werden sollen, häufig als explosionsgefährdeter Bereich eingestuft. Das definiert die Anforderungen an die Sensorhardware grundlegend.
Zoneneinstufung (ATEX-Richtlinie 2014/34/EU):
- Zone 0 / Zone 20: Explosionsfähige Atmosphäre ständig vorhanden (Innenbereiche von Behältern, Reaktoren). Hier ist der Einsatz von Sensoren im normalen Betrieb nicht sinnvoll.
- Zone 1 / Zone 21: Explosionsfähige Atmosphäre gelegentlich auftretend (z. B. Umgebung von Flanschen, Ventilen, Tankanschlüssen). Hier werden die meisten Pumpen und Kompressoren in der Chemie betrieben.
- Zone 2 / Zone 22: Explosionsfähige Atmosphäre unwahrscheinlich (Randbereiche, gut belüftete Bereiche).
Was das für Sensoren bedeutet: Ein handelsüblicher Industrie-Vibrationssensor darf in Zone 1 nicht eingesetzt werden. Erforderlich sind Geräte mit ATEX- und IECEx-Zertifizierung nach der jeweils gültigen Ex-Schutzkategorie (ii 2G Ex ia oder Ex d, je nach Zündschutzart). Ein ATEX-zertifizierter drahtloser Vibrationssensor (z. B. Asystom Zone 1, IECEx-zertifiziert) kostet pro Einheit ca. 1.500–1.800 USD inklusive erstem Servicejahr und Netzwerkzugang — deutlich mehr als ein nicht-zertifizierter Sensor im Bereich 200–400 USD.
Praktische Konsequenz: Für eine typische chemische Anlage mit 30 zu überwachenden Pumpen und Kompressoren in Zone 1 ist allein der Sensor-Investitionsbedarf im Bereich 45.000–54.000 USD zu kalkulieren. Das ist ein wesentlicher Anteil am Gesamtprojektbudget und muss vor dem Piloten bewertet werden.
LoRaWAN und kabelgebundene Lösungen. Drahtlose Sensoren sind in Zone 1 technisch möglich (LoRaWAN-Ex-Transponder), aber das Funk-Genehmigungsverfahren für ATEX-Umgebungen ist komplex und standortabhängig. Alternativ: kabelgebundene Anbindung über eigensichere Barrieren an das bestehende Feldbus-Netz (HART, Profibus PA). Das ist zuverlässiger, aber aufwendiger in der Installation, besonders bei Nachrüstung in laufender Produktion.
Zuständigkeit: Die ATEX-Zoneneinstufung ist Teil des Explosionsschutzdokuments (Ex-Schutzdokument nach BetrSichV §6), das der Betreiber zu führen hat. Jede Sensor-Installation in einer Ex-Zone muss durch eine befähigte Person geprüft werden. Das ist kein optionaler Schritt.
Was das System erkennt — und was nicht
Das ist der Abschnitt, den Vendoren in Präsentationen gerne überspringen. Wer Predictive Maintenance einführt, sollte vorher wissen, was das System auch nach vollständiger Implementierung nicht zuverlässig erkennt.
Zuverlässig erkannt (87–92 % Erkennungsrate bei ausreichender Trainingshistorie):
- Wälzlagerschäden (Pitting, Abplatzung) an Kreiselpumpen und Verdichtern
- Unwucht und Ausrichtungsfehler (Schwingungs-Amplitude bei Grundfrequenz und Harmonischen)
- Kavitation (charakteristische Breitband-Rauscherhöhung im Frequenzspektrum)
- Motorlager-Degradation (Strom-Oberwellen bei Wicklungsschäden)
Erkannt, aber mit höherer Unsicherheit:
- Frühes Gleitlagerverschleiß (weniger charakteristisches Spektralmuster als Wälzlager)
- Korrosion an der Förderwelle (Massenverlust verändert das Schwingungsverhalten erst spät)
- Thermische Überlastung (wenn Temperatursensor zu weit entfernt montiert)
Nicht zuverlässig erkennbar via Vibration allein:
- Wellenabdichtungs- und Gleitring-Dichtungsausfälle — das ist der wichtigste Blindspot. Gleitring-Dichtungen versagen durch Abrieb, Trockenläufer oder Mediumunverträglichkeit. Die Vibrationssignatur bleibt bis kurz vor dem Ausfall oft unauffällig. Zur Dichtungsüberwachung braucht man ergänzende Maßnahmen: Leckage-Detektoren am Dichtungsraum, Temperaturüberwachung der Dichtfläche, oder — falls eingebaut — Sperrdruck-Monitoring. Eine alleinige Vibrationslösung erkennt Dichtungsversagen zu spät.
- Werkstoffermüdung an druckführenden Teilen (Gehäusesrisse, Schaufelerosion durch abrasive Medien)
- Verstopfungen im Fördermedium-Pfad — diese zeigen sich eher über Druckdifferenz und Durchfluss als über Vibration
- Interne Korrosion durch reaktive Medien — hier ist Prozesschemie-Monitoring nötiger als Schwingungsanalyse
Diese Lücken sind real und bekannt. Der Schluss daraus ist nicht, PdM zu lassen — sondern den Scope klar zu definieren und keine All-inclusive-Schutzversprechen von Vendoren zu akzeptieren.
Konkrete Werkzeuge — was wann passt
Es gibt keine Einheitslösung für PdM in der Chemie. Die Wahl hängt davon ab, welche IT-/OT-Infrastruktur schon vorhanden ist und wie groß die Anlage ist.
Tractian — für den eigenständigen Einstieg ohne bestehende OT-Infrastruktur Eigene ATEX-zertifizierte Sensoren (Smart Trac Ultra für Zone 1), Cloud-Plattform mit vorgefertigten Modellen für Pumpen, Kompressoren und Motoren, integriertes CMMS für Wartungsaufträge. Keine eigene OT-Infrastruktur nötig. Onboarding in Wochen, nicht Monaten. Nachteil: US-Datenhosting, kein Deutsch, Pricing nicht transparent. Realistischer Einstieg für Betriebe mit 20–100 zu überwachenden Maschinen.
AVEVA PI System + Seeq — für Betriebe mit bestehendem Historian Wenn AVEVA PI (oder ein anderer Historian wie OSIsoft, Honeywell PHD) bereits läuft und Sensor-Zeitreihendaten sammelt, ist die fehlende Schicht oft die Analyseebene. Seeq verbindet sich direkt mit allen gängigen Historikern und ermöglicht Prozessingenieuren ohne Programmierkenntnisse, Parameterkorrelationen und Anomaliemuster zu identifizieren. Für Wärmetauscher-Fouling-Monitoring, Reaktor-Prozesskorridor-Überwachung und RCA (Root Cause Analysis) ist diese Kombination besonders geeignet. Seeq kostet ca. 1.000–1.200 USD/Nutzer/Jahr; PI System ist sechsstellig im Jahr.
AWS Lookout for Equipment — für AWS-affine Teams mit vorhandenen Sensordaten Vollständig verwalteter AWS-Dienst, der Zeitreihendaten aus S3 verarbeitet und ohne ML-Wissen Anomaliemodelle trainiert. Pay-as-you-go: 0,15 USD/Stunde Inferenz je Modell, kein Minimum. EU-Region Frankfurt verfügbar (DSGVO-konform). Kein UI enthalten — Alarme müssen in Grafana oder QuickSight eingebettet werden. Sinnvoll, wenn AWS-Infrastruktur schon besteht und ein eigenes Data-Engineering-Team die Implementierung trägt.
IBM Maximo Application Suite — für Enterprise-Betriebe mit bestehendem EAM Wenn IBM Maximo bereits als Enterprise Asset Management System läuft, bietet die Maximo Application Suite ein integriertes PdM-Modul, das Sensordaten direkt in die bestehende Wartungsplanung integriert. Keine Doppelpflege von Wartungsaufträgen. Aufwand und Kosten sind erheblich (6–18 Monate Implementierungszeit, sechsstellige Lizenzkosten), aber die Integration in bestehende Workflows ist besser als bei allen anderen Tools.
Honeywell Forge — für große Konzernstandorte mit Multi-Site-Anforderungen Wenn ein Konzernstandort unter mehreren Produktionsstätten konsolidiert werden soll, bietet Honeywell Forge eine Plattform, die Industrial-PdM, Gebäudemanagement und OT-Cybersecurity kombiniert. Für Spezialchemiewerke mit unter 500 Mitarbeitenden ist Forge typischerweise überdimensioniert und zu teuer.
Zusammenfassung: Wann welcher Ansatz
- Kein Historian, 20–100 Maschinen, schneller Start → Tractian
- Historian vorhanden, Prozessanalyse-Fokus → AVEVA PI + Seeq
- AWS-Infrastruktur, Data-Engineering-Team vorhanden → AWS Lookout for Equipment
- IBM Maximo EAM läuft bereits → Maximo Application Suite
- Konzernstandort, Multi-Site → Honeywell Forge
Datenschutz und Datenhaltung
Produktionsdaten — Maschinentelemetrie, Prozessparameter, Chargendaten — sind in der Chemie fast nie direkt personenbezogen. DSGVO ist trotzdem relevant, wenn Schichtpläne, Mitarbeiterdaten oder Produktionsaufzeichnungen mit KI-Systemen verknüpft werden.
Der wesentliche Datenschutzpunkt bei PdM-Systemen ist ein anderer: Betriebsgeheimnisse. Prozessparameter, Reaktionsbedingungen und Anlagenauslastungsdaten sind hochsensibles Firmenwissen. Wer diese Daten an eine Cloud-Plattform eines US-Anbieters überträgt, sollte die Vertragsgrundlage sorgfältig prüfen:
- US-Anbieter (Tractian, AWS, Honeywell Forge): Datenverarbeitung in EU-Rechenzentren nur wenn explizit vertraglich geregelt. AWS bietet EU-Region Frankfurt an; Tractian noch nicht. Für ITAR- oder EAR-regulierte Produkte oder geheimhaltungsbedürftige Rezepturen ist US-Cloud-Transfer zusätzlich zu prüfen.
- AVEVA PI und Seeq bieten EU-Hosting-Optionen; On-Premises-Deployment ist möglich und oft die sichere Wahl für bestehende PI-Historiker-Installationen.
- IBM Maximo: Hybrid-Deployment (on-premises oder IBM Cloud EU) möglich; für KRITIS-Betriebe in der Chemie relevant.
Praktischer Hinweis: Maschinendaten ohne Personenbezug brauchen keinen AVV nach Art. 28 DSGVO — aber ein Dienstleistungsvertrag mit Geheimhaltungsklausel (NDA) sollte mit jedem Cloud-Anbieter, der Produktionsdaten verarbeitet, abgeschlossen werden. Das ist nicht DSGVO-Pflicht, aber kaufmännisch sinnvoll.
Was es kostet — realistisch gerechnet
Sensornachrüstung (Zone 1, 30 Maschinen)
- ATEX-zertifizierte Vibrationssensoren: 1.500–1.800 USD pro Einheit × 30 = 45.000–54.000 USD
- Montageaufwand (intern oder extern, mit ATEX-Freigabe): 200–400 EUR/Einheit = 6.000–12.000 EUR
- Netzwerkinfrastruktur (LoRaWAN-Gateway oder Kabelführung): 5.000–20.000 EUR je nach Standort
Plattform und Implementierung (1. Jahr)
- Tractian (30 Maschinen): ca. 30.000–60.000 EUR/Jahr (Schätzung, Pricing auf Anfrage)
- AWS Lookout for Equipment: ~3.000–8.000 EUR/Jahr Infrastrukturkosten, plus interner Implementierungsaufwand
- Seeq Prozessanalytik: ca. 10.000–20.000 USD/Jahr (10 Nutzer) — sinnvoll als Ergänzung zu bestehendem PI
- IBM Maximo PdM-Modul: 3.000–8.000 USD/Monat für SaaS-Deployment (ohne Implementierungsaufwand)
Gesamtinvestition erstes Jahr für einen realistischen Piloten mit 30 Maschinen: 80.000–150.000 EUR inklusive Sensoren, Montage, Plattform und interner Implementierungszeit. Das ist der Einstiegspunkt, nicht der Ausreißer.
Was du dagegenrechnen kannst Ein mittelständisches Chemiewerk mit 2 ungeplanten Stopps pro Jahr bei je 40.000 EUR Stillstandskosten verliert 80.000 EUR jährlich an direkten Ausfallkosten — und das ohne Folgekosten (Qualitätsprobleme, Kundenliefertermine, Überarbeit). Wer die Stopprate um 50 % senkt, spart 40.000 EUR pro Jahr. Das reicht nicht zur Amortisation in Jahr 1. In Jahr 3 sieht die Rechnung anders aus.
Bei Anlagen mit höheren Stillstandskosten (Hochdruckreaktoren, kontinuierliche Chemieprozesse) ändert sich die Kalkulation radikal: Ein verhinderter Stopp à 200.000 EUR amortisiert den gesamten Pilot im ersten Jahr.
Wie du den ROI tatsächlich misst Nicht über Modell-Schätzungen, sondern über echte Protokollvergleiche: Anzahl und Dauer ungeplanter Stopps in den 12 Monaten vor PdM-Einführung vs. den 12 Monaten danach. Techniker-Einsatzzeiten für Notfallreparaturen vs. geplante Wartungseinsätze. Ersatzteilverbrauch nach Priorität (Notfallbestellung auf Expressfracht vs. geplantem Einkauf). Diese drei Kennzahlen reichen für einen überzeugenden ROI-Nachweis — keine komplexere Methodik nötig.
Typische Einstiegsfehler
1. Sensoren installieren, bevor der Wartungs-Workflow definiert ist. Das häufigste Scheitermuster: Die Sensoren sind montiert, die Plattform meldet einen Alarm — und niemand hat definiert, wer dann was tut. Wer ist für die Alarmbearbeitung zuständig? In welchem Zeitfenster? Was ist der Eskalationspfad, wenn der erste Verdacht sich als False Positive herausstellt? Ohne diesen Workflow sind PdM-Alarme innerhalb von Wochen ignorierter Hintergrundlärm. Die Prozessdefinition muss vor dem ersten Sensor-Alert stehen, nicht danach.
2. Mit dem falschen Asset-Typ beginnen. Nicht jede Pumpe und jeder Kompressor ist für den Piloten gleich geeignet. Ein guter Piloten-Kandidat hat: hohe Stillstandskosten (Anreiz), bekannte und wiederkehrende Ausfallmuster (Trainingsgrundlage), ausreichende Betriebsstunden (Datenvolumen), und kein laufendes größeres Umbau- oder Modernisierungsprojekt (Instabilität der Baseline). Wer mit „der wichtigsten Anlage” beginnt, wählt oft eine, die zu komplex, zu einzigartig und zu selten ausfällt für sinnvolles ML-Training.
3. Alarmgrenzen zu eng setzen. Wer in den ersten Wochen jeden Alert sofort zur Inspektion weiterleitet, erhält schnell frustrierte Instandhaltungstechniker — weil viele frühe Alerts False Positives sind (Maschinenzustand variiert mit Produktionslast, Temperatur, Saison). Die Kalibrierungsphase von 4–8 Wochen ist keine Schwäche des Systems, sondern unvermeidbar. Wer sie überspringt oder zu kurz ansetzt, zerstört die Akzeptanz im Team, bevor der echte Wert sichtbar wird.
4. Das Modell läuft, aber niemand pflegt es. Sobald eine Anlage umgerüstet, eine Pumpe getauscht oder der Betriebspunkt dauerhaft verändert wird, stimmt die bisherige Baseline nicht mehr. Das System wird entweder dauernd alarmen oder echte Anomalien übersehen — je nachdem, ob die neue Betriebscharakteristik günstiger oder schlechter ist als die gelernte Baseline. Jede signifikante Anlagenänderung erfordert ein Modell-Update. Das ist keine einmalige Implementierungsaufgabe, sondern laufende Betriebsverantwortung. Wer kein internes Eigentum für die Modellpflege definiert, hat ein System, das nach 18 Monaten nicht mehr vertrauenswürdig ist.
Was mit der Einführung wirklich passiert — und was nicht
Die Einführung von Predictive Maintenance ist in der Praxis mehr ein Instandhaltungs-Kulturprojekt als ein IT-Projekt.
Der erste Konflikt tritt nach etwa 6 Wochen auf. Das System meldet eine Anomalie an Pumpe P-117. Der zuständige Instandhaltungstechniker kennt die Pumpe seit acht Jahren und sagt: „Die läuft prima, das ist ein Sensor-Ausreißer.” Er hat vielleicht sogar recht. Der Algorithmus hat in diesem frühen Stadium eine False-Positive-Rate von 15–30 %. Was jetzt entscheidet, ob das Projekt überlebt, ist nicht die Technik, sondern die Kommunikation: Wurde vorab erklärt, dass Kalibrierung Zeit braucht? Gibt es einen Prozess, wie ein Techniker einen Alarm als False Positive markieren kann — und wie dieses Feedback zurück in das Modell fließt?
Erfahrungsgemäß gibt es zwei gegensätzliche Reaktionsmuster: Die Überzeugten, die nach dem ersten verhinderten Ausfall zu den lautesten Befürwortern werden. Und die Skeptiker, die erst dann überzeugt werden, wenn ein Kollege den Nutzen an einem konkreten Fall zeigt — nicht durch Präsentation, sondern durch gelebte Praxis. Beide Gruppen brauchen das System unterschiedlich: Die Überzeugten wollen mehr Alerts, mehr Daten, mehr Transparenz. Die Skeptiker wollen weniger False Positives und eine einfachere Oberfläche.
Was konkret hilft:
- Vor dem ersten Alert-Routing einen Workshop mit dem Instandhaltungsteam: Was bedeutet ein Alert? Was passiert danach? Wer entscheidet?
- Feedback-Schleife einrichten: Jeder Alert bekommt einen Status (bestätigt / False Positive / unklar) — dieses Feedback verbessert das Modell und gibt dem Team das Gefühl, das System zu kontrollieren statt von ihm kontrolliert zu werden
- Frühe Erfolge sichtbar machen: Der erste verhinderte Ausfall verdient einen internen Bericht mit konkreten Zahlen — das ist das wirksamste Argument für die Skeptiker-Gruppe
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| ATEX-Klassifizierung und Sensor-Auswahl | Woche 1–4 | Zonen-Review, Sensor-Typ und Montagekonzept festlegen, ATEX-Freigabe planen | Zonen-Einstufung unvollständig — Nachrüstung benötigt Ex-Schutz-Zertifikat |
| Sensor-Installation und Vernetzung | Woche 4–10 | Montage während Wartungsfenster, Netzwerkanbindung (LoRaWAN oder kabelgebunden), erste Datenpunkte prüfen | Kabeltrassierung in Zone 1 aufwendiger als geplant — Verzögerung durch Freigabeprozesse |
| Baseline-Erfassung | Woche 10–26 | Plattform sammelt Betriebsdaten ohne Auswertung; Maschinenzustände dokumentieren | Anlage fährt ungewöhnliche Betriebspunkte (Jahreswartung, Produktwechsel) — Baseline verfälscht |
| Modelltraining und Schwellenwert-Kalibrierung | Woche 22–30 | ML-Modelle trainieren, erste Alerts bewerten, False-Positive-Rate anpassen | Zu wenig historische Fehlerereignisse für zuverlässiges Training — Überwachung startet nur mit Anomalieerkennung |
| Pilotbetrieb mit ausgewähltem Team | Woche 28–38 | 5–10 Instandhaltungstechniker arbeiten mit dem System, Feedback-Loop aufbauen | Alert-Müdigkeit bei zu hoher False-Positive-Rate — Kalibrierung zu spät nachgebessert |
| Rollout und Workflow-Integration | Ab Woche 36 | Anbindung an CMMS/SAP PM, Routinen für Modellpflege einrichten, Schulung abgeschlossen | Workflow-Integration scheitert an IT-Schnittstellen — PdM läuft als Silo-System |
Häufige Einwände — und was dahintersteckt
„Wir haben schon Alarme im Leitstand. Das reicht.” Threshold-Alarme im Leitstand melden, wenn ein Wert eine definierte Grenze überschreitet. Das ist reaktiv — der Schaden ist zu dem Zeitpunkt meist schon eingetreten oder kurz davor. Predictive Maintenance erkennt Muster unterhalb der Alarmgrenze: die Schwingungscharakteristik, die sich langsam verändert, der Strom, der über Wochen um 3 % steigt. Das ist der strukturelle Unterschied: Leitstand-Alarme schlagen an, wenn es zu spät ist; PdM schlägt an, wenn es noch Zeit für geplante Wartung gibt.
„Unsere Anlage ist zu individuell, das funktioniert nicht mit Standardmodellen.” Zum Teil berechtigt. Generische Anomaliemodelle sind bei sehr spezifischen Prozessbedingungen (abrasive Medien, extreme Temperaturen, unregelmäßiger Betrieb) weniger zuverlässig als werksspezifisch trainierte Modelle. Aber: Der Einstieg muss nicht mit dem schwierigsten Asset beginnen. Die 30 % der Maschinen, die am häufigsten ausfallen und deren Ausfallmuster klassisch sind (Pumpen-Lager, Kompressor-Lager), funktionieren mit Standardmodellen gut. Die exotischen Reaktoren und Spezialaggregate kommen in Phase 2 — wenn das Team bereits Vertrauen und Erfahrung mit dem System hat.
„Aber McKinsey sagt, PdM funktioniert in der Chemie gar nicht.” McKinsey hat in einem vielzitierten Artikel argumentiert, PdM sei für die chemische Industrie „the wrong solution to the right problem” — weil Chemieanlagen zu wenige katastrophale Ausfälle pro Jahr haben, aus denen ML-Modelle lernen können. Das ist ein ernst zu nehmender Einwand. Die praktische Antwort: Dieser Einwand trifft große, gut gewartete kontinuierliche Prozessanlagen, die tatsächlich sehr selten ausfallen. Für Batch-Betriebe und Spezialchemiewerke mit häufiger wechselnden Betriebszuständen und einem älteren Anlagenpark ist die Datengrundlage typischerweise besser. Und: Der McKinsey-Artikel empfiehlt als Alternative nicht „gar nichts”, sondern digitales Reliability-Management — bessere RCA-Prozesse, optimierte präventive Wartungsintervalle auf Datenbasis. Das ist kein Widerspruch zu PdM, sondern eine sinnvolle Ergänzung.
Woran du merkst, dass das zu dir passt
Gute Voraussetzungen:
- Du betreibst eine Anlage mit mindestens 20 rotierenden Maschinen (Pumpen, Kompressoren, Rührwerke), deren Ausfall den gesamten Produktionsprozess stoppt
- Ihr hattet in den letzten 3 Jahren mindestens 2–3 ungeplante Stillstände, die mehr als einen Arbeitstag Produktionsausfall verursacht haben
- Ihr habt bereits einen Historian oder SCADA, der Prozessdaten aufzeichnet — die Datenbasis ist vorhanden, die Auswertungsschicht fehlt
- Euer Instandhaltungsteam hat Zeit und Interesse, mit einem Feedback-System zu arbeiten — kein reines „Set and forget”-Projekt
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Unter 50 Mitarbeitenden oder unter 15 kritischen Maschinenassets. Sensor- und Plattform-Investment übersteigt bei kleinen Anlagenparks den ROI auf absehbare Zeit. Eine bessere Alternative ist hier: strukturiertes Condition Monitoring durch Techniker mit mobilen Messgeräten (Route-based Monitoring) — ohne dauerhafte Sensorinstallation, mit viel geringerem Invest.
-
Kein bestehender Historian oder SCADA und keine IT-/OT-Kompetenz im Haus. Wer keine Prozessdaten aufzeichnet und niemanden hat, der eine Cloud-Plattform einrichten und betreuen kann, startet nicht mit ML — er startet mit Datenverfügbarkeit. Der richtige erste Schritt ist dann die Einführung eines einfachen Condition-Monitoring-Systems, nicht ein PdM-Pilot.
-
Keine Person verfügbar, die langfristig für Modellpflege und Alert-Triage zuständig ist. Predictive Maintenance ist kein Produkt, das man kauft und dann läuft. Modelle degradieren, wenn sich Betriebsbedingungen ändern. Wer keine namentlich benannte Person hat, die mindestens 2–4 Stunden pro Woche für Alert-Review, Modell-Feedback und Schwellenwert-Anpassung aufwendet, hat nach 18 Monaten ein System, das niemand mehr traut.
Das kannst du heute noch tun
Kein Sensor nötig für den ersten Schritt. Exportiere aus eurem Historian oder Leitstand die letzten 6 Monate Vibrations- oder Stromwerte der 3 Pumpen, die am häufigsten Probleme bereitet haben. Lade sie in Python (pandas + matplotlib — kostenlos) oder in Seeq, falls ihr das bereits lizenziert habt. Lege die Zeitreihen übereinander und markiere, wann die letzten ungeplanten Stopps waren.
Was du dabei fast immer siehst: Es gab ein Signal. Manchmal 2 Wochen vorher, manchmal 4. Es war da. Nur niemand hat danach geschaut.
Das ist die überzeugendste Demonstration für euer Team — nicht aus einem Vendor-Pitch, sondern aus euren eigenen Daten.
Für den nächsten Schritt — wenn ihr einen konkreten Sensor-Piloten bewerten wollt — hier ein Prompt, der euch bei der Anforderungsanalyse hilft:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- McKinsey & Company: „Predictive maintenance: the wrong solution to the right problem in chemicals” — Originalanalyse der McKinsey Operations Practice; veröffentlicht unter mckinsey.com/capabilities/operations (abgerufen Mai 2026). Kernaussage: Chemieanlagen haben typischerweise zu wenige katastrophale Fehlerereignisse für zuverlässiges ML-Training; besserer Hebel ist digitales Reliability-Management.
- Solvay IIoT-Ausbau: Inspenet.com, „Solvay drives predictive maintenance with IIoT sensors”, 2024. 5.000+ Sensoren in 25 Werken über 11 Länder; Ausbau auf 9.000 Einheiten bis 2027. URL: inspenet.com/en/news/solvay-drives-predictive-maintenance-following-its-alliance-with-imi/
- ATEX Zone 1-Sensor-Preise: Asystom LoRaWAN Zone 1 Sensor (Senzary LLC): 1.770 USD/Einheit inkl. 1 Jahr Service und Netzwerkzugang; abgerufen Mai 2026. URL: senzary.com/product/asystom-lorawan-atex-zone1-vibration-ultrasound-industrial-sensor-one-year-solution-included/
- Pumpen-Ausfallstatistik: Lagerschäden verursachen 40–50 % der Kreiselpumpenausfälle; Dichtungsausfälle 20–25 %. Quellen: oxmaint.com/blog/post/blog-post-pump-maintenance-predictive-monitoring-guide; ResearchGate, „Smart Predictive Maintenance for Centrifugal Pumps”, 2023.
- Erkennungsraten: Kavitation und Lagerverschleiß: 87–92 % Erkennungsrate in Produktionsumgebungen bei ausreichender Trainingshistorie. Quelle: Branchenberichte Tractian/Oxmaint, 2023/2024.
- Schmalenbach Journal, 2024: Springer Nature, „Unlocking the Potential of Predictive Maintenance for Intelligent Manufacturing: a Case Study On Potentials, Barriers, and Critical Success Factors” — Identifizierte Hauptbarrieren: digitale Reife, Datenqualität, Technologieintegration, Wartungsorganisationsreife.
- ATEX-Richtlinie: Richtlinie 2014/34/EU des Europäischen Parlaments und des Rates; Betriebssicherheitsverordnung (BetrSichV) §6 — Explosionsschutzdokument.
- Kosten- und ROI-Annahmen: Erfahrungswerte aus industriellen PdM-Projekten in der Prozessindustrie; kalibriert mit mybusinessfuture.com und symestic.com Berichten (2024–2025).
Willst du abschätzen, welche eurer Anlagen die höchste PdM-Hebelwirkung hätten — und ob euer aktuelles Sensor- und Datenumfeld schon ausreicht? Meld dich für ein kurzes Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Batch-Protokolle automatisch auswerten und freigeben
KI prüft Batch-Protokolle auf Vollständigkeit, Grenzwertüberschreitungen und Abweichungen — und erstellt einen strukturierten Freigabebericht statt manueller Durchsicht.
Mehr erfahrenSicherheitsdatenblätter automatisch erstellen und aktualisieren
KI erstellt REACH/GHS-konforme Sicherheitsdatenblätter aus Rezeptur- und Substanzdaten — und hält sie automatisch bei Gesetzesänderungen aktuell.
Mehr erfahrenNeue Moleküle und Formulierungen mit generativer KI entwickeln
Generative KI-Modelle schlagen auf Basis von Zielstoffprofilen neue Molekülstrukturen und Formulierungsansätze vor — und beschleunigen das Screening von Kandidaten im frühen F&E-Stadium.
Mehr erfahren