Brennofen-Temperaturprofil: Keramikausschuss durch ML-Steuerung senken
47 Thermoelemente liefern sekündlich Daten, aber der Brennmeister schaut alle vier Stunden rein. Ein ML-Modell erkennt kritische Profilmuster 90 Minuten vor Schichtende und ermöglicht rechtzeitige Eingriffe. Ausschussquote: von 12 % auf 6,5 %.
- Problem
- Temperaturschwankungen von ±15–25 °C zwischen Ofenzonen führen bei Feinsteinzeug und Porzellan zu Rissbildung und Farbabweichungen, die erst nach dem Abkühlen sichtbar werden. Ausschussraten von 8–12 % je Brand sind in der Premiumglasur-Linie nicht selten. Brennmeister justieren Zonen manuell nach Erfahrung, Wissen, das beim Ausscheiden verloren geht.
- KI-Lösung
- Thermoelemente, Feuchte- und Durchlaufsensoren liefern Zeitreihendaten je Ofenzone. Ein ML-Modell (Gradient Boosting oder LSTM) lernt den Zusammenhang zwischen Brennprofil, Rohstoffcharge und Ausschussrate und identifiziert kritische Profilsignaturen 90 Minuten vor Prozessende. Setpoint-Korrekturen von ±2 °C reichen oft aus, um den Brand zu retten.
- Typischer Nutzen
- Ausschussreduktion von 12 % auf 6,5 % im Piloten (–46 %). Energieverbrauch sinkt um 8–15 % durch gleichmäßigere Auslastung. Erfahrungswissen des Brennmeisters wird in reproduzierbare Profilmuster überführt und bleibt dem Betrieb erhalten.
- Setup-Zeit
- 8–14 Monate: OPC-UA-Anbindung, 18 Monate Trainingsdaten, Modellvalidierung
- Kosteneinschätzung
- 70.000–160.000 € Einrichtung einmalig (OPC-UA, Infrastruktur, Modell), 200–3.000 €/Monat laufend
Es ist 3:17 Uhr morgens, Schichtwechsel in Linie 3.
Stefan Gruber, Brennmeister seit 14 Jahren im Betrieb, übergibt an seine Kollegin Maria Auer. „Läuft alles”, sagt er, deutet auf das SCADA-Terminal. „Hab um eins noch kurz reingeschaut, war alles grün.” Er geht.
Maria setzt sich, öffnet die Temperaturprotokolle der letzten vier Stunden. Zone 9 hatte zwischen 01:14 und 02:38 Uhr eine Abweichung von 18 °C unterhalb des Sollprofils. Nichts, was einen Alarm ausgelöst hätte. Aber sie hat das schon mal gesehen, im September, und damals war die betroffene Charge drei Stunden später komplett rissig aus dem Ofen gekommen. 47 Thermoelemente, eine Datenpunkt-Dichte von einer Messung pro Sekunde, und der Brennmeister schaut alle vier Stunden rein.
Die Charge ist noch im Ofen. Noch zweieinhalb Stunden. Sie stellt die Zonentemperatur um 2 °C nach oben.
Ob es geholfen hat, wird sie erst nach dem Abkühlen wissen, in acht Stunden.
Das ist Keramikproduktion heute: Terabytes an Sensordaten, die niemand vollständig auswertet. Und Erfahrungswissen, das im Kopf einzelner Menschen lebt, die irgendwann in Rente gehen.
Für Unternehmen
Nicht nur lesen, umsetzen.
Wir entwickeln KI-Lösungen für genau deinen Anwendungsfall und begleiten dich bei der Einführung.
Das echte Ausmaß des Problems
Stell dir vor, du produzierst 180.000 Keramikteile pro Monat. Jedes Teil durchläuft einen 1.280-Grad-Tunnelofenbrennprozess, der über 47 Thermoelemente überwacht wird und alle 24 Stunden, sieben Tage die Woche läuft. Deine Ausschussquote in der Premiumglasur-Linie liegt bei 12 Prozent, das bedeutet: 21.600 fehlerhafte Teile im Monat. Hauptursache: Rissbildung und Farbabweichungen durch Temperaturschwankungen in bestimmten Ofenzonen, die erst nach dem Abkühlprozess sichtbar werden.
Rechne kurz nach: Bei einem Materialwert plus Energiekosten von 3,40 Euro pro Teil sind das 73.440 Euro Verlust jeden Monat. Auf ein Jahr: fast 900.000 Euro für Teile, die direkt in den Ausschusscontainer wandern.
Das ist kein theoretisches Rechenexempel. Es ist das Ausgangsszenario einer bayerischen Tischkeramikmanufaktur mit 200 Mitarbeitenden, die wir im weiteren Verlauf dieser Seite als Ankerbeispiel nutzen.
Das strukturelle Problem: Temperaturschwankungen in Tunnelöfen sind unvermeidbar, aber sie sind vorhersehbar. Bestimmte Thermoelementmuster treten konsistent auf, bevor Chargenfehler entstehen. Ein erfahrener Brennmeister wie Stefan erkennt manche davon intuitiv. Aber er schaut alle vier Stunden rein, nicht sekündlich. Ein Machine Learning-Modell kann sekündlich schauen, und es kann Muster erkennen, die auch erfahrenen Brennmeistern entgehen, weil sie über zu viele Messstellen gleichzeitig verlaufen.
Typische Fehlerbilder in keramischen Tunnelofenprozessen laut Branchenpraxis:
- Rissbildung durch zu schnelles Auf- oder Abkühlen in bestimmten Ofenzonen, besonders beim Quarzsprung bei 573 °C (Modifikationswechsel Alpha-Beta-Quarz)
- Farbabweichungen durch Temperaturdifferenzen von mehr als 15 °C zwischen oberer und unterer Brennzone, oxidative und reduktive Atmosphären reagieren unterschiedlich auf Glasuren
- Verzug durch ungleichmäßige Wärmeverteilung quer zur Ofenbreite, besonders bei großen flachen Stücken
- Porenmuster durch fehlerhafte Abgasführung in der Kühlzone
Erschwerend kommt hinzu: Industriekeramik-Brennöfen laufen 24/7. Der Brennmeister ist nicht rund um die Uhr da, aber die Daten werden es trotzdem. Und das Erfahrungswissen, das in der Reaktion auf Profilmuster steckt, ist extrem gefährdet: Es liegt in Köpfen, nicht in Systemen.
Eine Studie aus dem Jahr 2025 im Fachjournal Scientific Reports (Nature) evaluierte Machine-Learning-Modelle für die Vorhersage keramischer Fliesen-Eigenschaften während des Brennprozesses. CatBoost, XGBoost und Gradient Boosting Machine lieferten die stärksten Ergebnisse bei der Vorhersage von Wasseraufnahme und Biegefestigkeit aus Prozessparametern, beides direkte Qualitätsindikatoren. Das unterstreicht: Der Zusammenhang zwischen Brennprofil und Endproduktqualität ist für ML-Modelle zuverlässig lernbar.
Mit vs. ohne KI, ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Unterstützung | Mit ML-Temperaturprofiling |
|---|---|---|
| Reaktionszeit auf kritische Profilmuster | 2–4 Stunden (manueller Kontrollrhythmus) | 5–15 Minuten (automatische Warnung) |
| Ausschussquote Premiumglasur | 10–14 % | 5–8 % (Pilotdaten) |
| Erkennung eines kritischen Musters | Nur durch erfahrenen Brennmeister | Systemgestützt, schichtunabhängig |
| Dokumentation von Profilanomalien | Lückenhaft, handschriftlich | Vollständig und durchsuchbar |
| Wissensverlust beim Personalwechsel | Hoch, Muster leben in Erfahrung | Gering, Muster sind im Modell kodiert |
| Energieverbrauch je Brand | Baseline | 8–15 % Reduktion durch gleichmäßigere Auslastung |
Die Ausschusszahlen stammen aus dem Pilotszenario; laut Pluto7/LIXIL-Fallstudie aus der Sanitärkeramikproduktion (2023) reduzierte ein Random-Forest-Modell mit 88 % Vorhersagegenauigkeit die Fehlteile auf 22 Brennzonen eines Industrieofens messbar, mit einem jährlichen Einsparungspotenzial im zweistelligen Millionenbereich. Die Größenordnung ist auf mittelgroße Keramikbetriebe herunterskalierbar.
Einschätzung auf einen Blick
Zeitersparnis, mittel (3/5)
Der unmittelbare Zeitgewinn ist real, aber sekundär: Brennmeister sparen 1–2 Stunden je Schicht für manuelle Logauswertung, und die nächtlichen Störungsbeseitigungen werden seltener. Der eigentliche Hebel liegt nicht in der Zeitersparnis, sondern in der Qualitätsverbesserung, deshalb Platz 3. Verglichen mit Floatglas-Blasenerkennung (Score 5, weil Inline-Inspektion vollständig automatisiert) ist der Zeitgewinn hier moderater: Das System warnt, aber Menschen handeln noch.
Kosteneinsparung, hoch (4/5)
Bei 180.000 Teilen pro Monat und 3,40 Euro Materialwert/Energie pro Teil: Senkung der Ausschussquote von 12 % auf 6,5 % spart monatlich rund 33.660 Euro, also ca. 404.000 Euro im Jahr. Das ist substanziell. Gleichzeitig liegt die Bewertung bei 4 statt 5, weil vergleichbare Anwendungsfälle wie Glasflaschen-Wanddicke noch direkter am Massenprodukt ansetzen. Hinzu kommen 8–15 % Energieeinsparung durch gleichmäßigere Brennzone-Auslastung.
Schnelle Umsetzung, niedrig (2/5)
8–14 Monate ist eine realistische Minimalschätzung: OPC-UA-Datenanbindung, Aufbau der Zeitreihen-Infrastruktur, Sammeln von 12–18 Monaten beschrifteter Trainingsdaten (Thermoelementwerte + Defektinspektion), Modelltraining, Validierungsphase, schrittweise SPS-Integration. Das ist der gleiche Einstiegsscore wie Floatglas-Blasenerkennung, beide erfordern komplexe industrielle Infrastrukturarbeit. Wer das in sechs Wochen erwartet, wird enttäuscht werden.
ROI-Sicherheit, hoch (4/5)
Die Kausalität zwischen Temperaturprofil und Defektrate ist direkt prüfbar: Chargen mit kritischen Profilmustern, bei denen nicht eingegriffen wurde, vs. Chargen nach Korrektur. Das macht die ROI-Messung vergleichsweise einfach, anders als bei indirekten Effekten wie Wissensmanagement. Die Bewertung bleibt bei 4 statt 5, weil äußere Faktoren (Rohstoffqualität, Chargenvariation, Glanzurformulierung) die Defektrate mit beeinflussen und die Kausalzuschreibung im Einzelfall aufwendig ist.
Skalierbarkeit, hoch (4/5)
Ein validiertes Modell für einen Tunnelofen lässt sich auf weitere Tunnelöfen mit gleicher Geometrie und gleichem Produkttyp mit überschaubarem Nachtrainierungsaufwand übertragen. Aber: Eine der wichtigsten Grenzen dieser Technologie ist, dass ein Modell für einen Tunnelofen nicht auf einen Glockentopf- oder Rundofen übertragen werden kann (mehr dazu im Abschnitt Transfer-Learning-Grenzen). Das begrenzt die Skalierbarkeit auf gleichartige Ofeninfrastruktur.
Richtwerte, stark abhängig von Ofengröße, Produktionsvolumen, vorhandener Sensorinfrastruktur und Defektdokumentation.
Was das System konkret macht
Das System verbindet drei Schichten, die heute meist getrennt existieren.
Schicht 1: Datenaggregation. Alle 47 Thermoelemente liefern sekündlich Messwerte. Dazu kommen Feuchte- und Atmosphärensensoren, Durchlaufsensoren für die Warenträgergeschwindigkeit, Gasverbrauchsmessungen und, das ist entscheidend, die Ergebnisse der Qualitätsinspektion nach dem Kühlprozess: welche Charge hatte wie viel Ausschuss, welche Fehlerbilder, in welcher Zone des Ofens. Ohne diese rückgekoppelten Qualitätsdaten gibt es keine Trainingsdaten für das Modell.
Schicht 2: Zeitreihen-ML. Ein Machine-Learning-Modell, typisch ein Gradient-Boosting-Ansatz wie XGBoost oder ein LSTM (Long Short-Term Memory)-Netz für Sequenzmuster, lernt aus 12–18 Monaten historischer Daten: Welche Thermoelementkombinationen in welchen Zeitfenstern kommen verlässlich vor kritischen Chargen? Das Modell sucht nicht nach einzelnen Ausreißern, es sucht nach Profilsignaturen, die über mehrere Zonen hinweg ein Muster bilden. Sechs solche kritischen Profilsignaturen wurden im Pilotszenario identifiziert, die zusammen über 80 % der Rissbildungsereignisse vorhersagen.
Schicht 3: Warnung und Eingriff. Wenn das Modell eine der kritischen Signaturen erkennt, löst es 90 Minuten vor dem erwarteten Prozessende eine Warnung aus. Der Brennmeister kann dann gezielt eingreifen, typisch eine Setpoint-Korrektur von 2 °C in der betroffenen Zone. Das klingt minimal, reicht aber oft aus, weil das eigentliche Problem die Profildrift über mehrere Stunden ist, nicht ein einzelner Temperaturspike.
Das Modell ersetzt den Brennmeister nicht, es gibt ihm frühzeitig Informationen, die er ohne das System erst Stunden später oder gar nicht hätte. Die Entscheidung, ob und wie eingegriffen wird, bleibt beim Fachpersonal. Das ist bewusst so, in einem sicherheitskritischen Industrieprozess sollte kein Modell autonom in SPS-Parameter eingreifen, ohne dass ein Mensch die Kontrolle behält.
Thermocouple-Dateninfrastruktur, was wirklich zählt
Bevor über ML-Modelle nachgedacht wird, muss die Sensorbasis stimmen. Das ist der Teil, der in vielen Implementierungsprojekten unterschätzt wird.
Thermoelementauswahl. Für Tunnelöfen bis 1.300 °C kommen typisch Thermoelemente vom Typ S (Platin-Rhodium) oder Typ N (Nicrosil-Nisil) zum Einsatz. Typ-S ist industriestandard für Hochtemperaturprozesse, hat aber eine bekannte Drift-Charakteristik: Nach 2.000–5.000 Betriebsstunden weichen Typ-S-Elemente im oberen Temperaturbereich messbar vom Kalibrierwert ab. Für ein ML-Modell ist das kritisch: Drift bedeutet Datenverfälschung, und Datenverfälschung bedeutet Modellverschlechterung, die man nicht sofort merkt. Konsequenz: Kalibrierungsintervalle müssen im System dokumentiert werden, und Messwerte müssen mit einem Kalibrierungszeitstempel versehen sein.
Sampling-Rate. Eine Sekunde Abtastintervall ist für Tunnelöfen der sinnvolle Standard. Kürzere Intervalle (100 ms) bringen keinen Mehrwert, thermische Zeitkonstanten von Keramikmassen im Ofen liegen im Minutenbereich. Längere Intervalle (5 Minuten) verpassen das Profil-Detailing, das für die Mustererkennung nötig ist.
OPC-UA als Datenbrücke. Moderne Industrieöfen kommen mit OPC-UA-Servern oder lassen sich darüber nachrüsten. OPC-UA ist der industrielle Kommunikationsstandard, der SCADA-Systeme und übergeordnete IT-Systeme verbindet. Wenn dein Ofen noch über proprietäre SCADA-Protokolle (etwa Siemens S7, Modbus oder herstellerspezifische Protokolle) kommuniziert, ist der erste Schritt nicht das ML-Modell, sondern die Übersetzungsschicht: ein OPC-UA-Gateway, das die SPS-Daten standardisiert herausgibt. Das kostet 3.000–15.000 Euro als Hardware/Software-Paket, je nach Komplexität.
Zeitreihenspeicherung. Sekündliche Daten von 47 Sensoren über 12–18 Monate ergeben ca. 2,4 Milliarden Datenpunkte, zu viel für relationale Datenbanken, ideal für eine Zeitreihendatenbank wie InfluxDB. Open Source, on-premise betreibbar, mit Python-Client gut integrierbar.
Defekt-Labeling als Flaschenhals. Das Modell lernt nur dann, was es lernen soll, wenn zu jedem Thermoelementprofil auch das Qualitätsergebnis der zugehörigen Charge dokumentiert ist. In der Praxis bedeutet das: Qualitätsprüfung muss mit Chargen-ID verknüpft werden, und diese ID muss rückverfolgbar zum Brennzyklus sein. Wenn das heute noch über Klemmbrett und Notizbuch läuft, ist das der erste Prozess, der digitalisiert werden muss, noch vor dem ML-Modell.
Brennkurven-Bibliothek aufbauen
Einer der dauerhaften Mehrwerte dieses Projekts ist eine strukturierte Bibliothek aller validierten Brennkurven, ein Artefakt, das unabhängig vom ML-Modell wertvoll ist.
Was eine Brennkurven-Bibliothek enthält:
- Temperaturprofile je Ofenzone, je Produktart und Glasurrezeptur
- Toleranzbänder je Zone (obere und untere Grenzen je Ofensegment)
- Verknüpfung mit Ausschussergebnissen (historisch und laufend)
- Dokumentierte Abweichungen und deren Ursachen
- Kalibrierungshistorie der Thermoelemente
Warum das wertvoll ist: Wenn Brennmeister Stefan Gruber in Rente geht, gehen sein Wissen über die optimalen Einstellungen für die Weihnachtskollektion oder die neue Oxidrot-Glasur nicht mit ihm, weil sie in der Bibliothek stehen. Die Bibliothek ist der institutionelle Speicher, den das Modell als Trainings- und Referenzbasis nutzt.
Für die Bibliothek bietet sich eine strukturierte Speicherung in InfluxDB an, ergänzt durch ein Grafana-Dashboard, das Profilverläufe über den aktuellen Brennzyklus mit dem Referenzprofil der Bibliothek vergleicht. Das ist die einfachste Form des Systems, kein ML, aber bereits ein deutlicher Verbesserungsschritt gegenüber dem Status quo.
Transfer-Learning-Grenzen, eine wichtige Warnung
Hier ist etwas, das Anbieter gerne verschweigen: Ein ML-Modell, das auf einem Tunnelofen trainiert wurde, generalisiert nicht auf einen Glockentopfofen, einen Herdwagenofen oder einen Rollenherdofen. Das ist keine Schwäche der Technologie, sondern eine physikalische Tatsache.
Warum? Jeder Ofentyp hat eine andere Strömungsdynamik, andere Heizkreisgeometrie, andere Wärmeübertragungsmechanismen und andere Randbedingungen für die Produktpositionierung. Das Muster, das im Tunnelofen zwischen Thermoelementpaaren 7 und 12 auf eine Rissbildung in der nachfolgenden Zone hindeutet, hat im Glockentopfofen gar keine Entsprechung, weil Thermoelement 7 im Glockentopfofen einfach an einer anderen geometrischen Stelle sitzt und andere thermodynamische Bedingungen misst.
Was das in der Praxis bedeutet:
- Neues Ofenmodell = neues Projekt. Du kannst nicht ein validiertes Modell auf einen anderen Ofentyp kopieren. Das Modell muss für jeden Ofentyp separat trainiert werden, und dafür braucht es 12–18 Monate Trainingsdaten.
- Selbst gleicher Ofentyp, anderes Fabrikat. Zwei Tunnelöfen desselben Typs von verschiedenen Herstellern können unterschiedliche Strömungsmuster haben. Transferierbarkeit ist möglich, aber muss validiert werden.
- Wenn das Unternehmen in neue Ofentechnologie investiert, verliert das bestehende Modell an Relevanz. Die Investitionsplanung für das ML-System muss das berücksichtigen.
Eine 2022 erschienene Arbeit über Transfer-Learning bei Drehöfen (PMC/NCBI, Cheng et al.) bestätigt: Modelle mit Transfer-Learning-Ansatz zeigen deutlich höhere Vorhersageleistung innerhalb eines Ofentyps als zwischen verschiedenen Typen. Der Transfer zwischen Geometrien erfordert mindestens 3–6 Monate zusätzliche Daten und Validierungsarbeit.
Das ist ein wichtiger Faktor für die Rentabilitätsberechnung: Wenn du heute in ein Modell für deinen Tunnelofen investierst, ist dieses Investment von der Technologie des Ofens abhängig, nicht nur von der ML-Infrastruktur.
Konkrete Werkzeuge, was wann passt
Die Tool-Wahl hängt stark von der vorhandenen Infrastruktur und dem internen IT-Know-how ab.
InfluxDB, kostenloser Open-Source-Kern, on-premise betreibbar, ideal für die Speicherung von sekündlichen Thermoelement-Zeitreihen. Python-Client gut dokumentiert. Als Historisierer für OPC-UA-Daten die naheliegendste Wahl. Einschränkung: Kein relationales Datenmodell, für die Verknüpfung mit Chargeninfos aus dem ERP braucht es eine separate Schicht.
Grafana, Open-Source-Visualisierungsplattform, kombiniert hervorragend mit InfluxDB. Baut das Echtzeit-Dashboard für den Brennmeister, visualisiert Profilabweichungen gegenüber der Brennkurven-Bibliothek und zeigt Warnungen an. Grafana ML bietet auch einfache Anomalieerkennung, für einen ersten Prototyp ausreichend, bevor ein vollwertiges ML-Modell trainiert wird. On-premise betreibbar, kostenlos.
Python/scikit-learn + MLflow, für Teams mit einem Data Scientist oder Automatisierungsingenieur mit Python-Kenntnissen. XGBoost oder LightGBM als Modell-Framework, MLflow für Experiment-Tracking und Modell-Versionierung. Open Source, keine Lizenzkosten, volle Kontrolle. Realistischer Aufwand für das Setup: 3–5 Monate intensiver Arbeit.
Azure Machine Learning, wenn die IT-Infrastruktur bereits auf Microsoft Azure läuft oder wenn ein Managed-ML-Service ohne eigenes MLOps-Betriebsaufwand gewünscht ist. EU-Hosting in der Region Germany West Central (Frankfurt) verfügbar. AutoML kann einen Teil der Modellauswahl übernehmen. Kosten: 100–500 €/Monat für Experimente, 1.000–5.000 €/Monat für produktive Endpunkte.
DataRobot, wenn das Unternehmen kein Data-Science-Team hat und die Modellentwicklung von einer Plattform übernehmen lassen will. Hat nachweislich Industrieprojekte in der Fertigung umgesetzt (Ausschussreduktion in der Sanitärkeramik, ähnliche Use Cases). Einschränkung: Enterprise-Lizenzen ab 50.000–200.000 USD/Jahr, nur für größere Betriebe oder Konzernverbünde wirtschaftlich.
Wann welcher Ansatz:
- Kleiner Betrieb, ein Ofen, vorhandene IT-Affinität → Python/scikit-learn + InfluxDB + Grafana
- Mittelgroßer Betrieb, Azure-Infrastruktur vorhanden → Azure Machine Learning + InfluxDB
- Konzern oder Verbund, mehrere Ofenlinien → DataRobot
- Erster Schritt ohne Modell → InfluxDB + Grafana als Monitoring und Bibliothek
Datenschutz und Datenhaltung
Dieser Use Case verarbeitet keine personenbezogenen Daten im klassischen Sinne der DSGVO, Thermoelementwerte, Temperaturen und Ofenparameter sind Maschinendaten. Ein paar Punkte bleiben aber relevant.
Betriebliche Geheimnisse und IP-Schutz. Brennkurven und Temperaturprofile sind im Keramikbetrieb hochsensibles Wissen, sie kodieren das Produktions-Know-how, das Jahrzehnte Erfahrung repräsentiert. Wenn Daten in eine Cloud-Plattform fließen, muss sichergestellt sein, dass Modell-Trainingsdaten nicht für das Training externer Modelle des Anbieters verwendet werden. Azure Machine Learning garantiert das explizit. DataRobot ebenfalls laut Nutzungsbedingungen, vor Vertragsabschluss schriftlich bestätigen lassen.
On-Premise als sicherste Option. Eine Python/MLflow-basierte Lösung auf eigener Hardware oder einem deutschen Cloud-Anbieter (Hetzner, OVH mit EU-Region) hält alle Daten vollständig im eigenen Einflussbereich. Das ist der empfohlene Ansatz für Betriebe, bei denen die Brennkurven als Wettbewerbsvorteil gelten.
AVV bei Cloud-Nutzung. Auch wenn technisch keine personenbezogenen Daten verarbeitet werden, empfiehlt sich bei Cloud-Diensten ein geprüfter Auftragsverarbeitungsvertrag, nicht wegen DSGVO-Pflicht, sondern als vertragliche Absicherung für IP-Schutz.
InfluxDB OSS ist vollständig on-premise betreibbar, Apache-2.0-Lizenz, keine Datenabgabe an Dritte. Für die Zeitreihenspeicherung die datenschutzsicherste Wahl.
Was es kostet, realistisch gerechnet
Einmalige Kosten
| Posten | Kosten |
|---|---|
| OPC-UA-Gateway (Hardware + Inbetriebnahme) | 5.000–20.000 € |
| Zeitreihen-Infrastruktur (InfluxDB + Grafana, on-premise) | 3.000–8.000 € (Setup, Hardware optional) |
| Systemintegration SCADA ↔ Datenebene | 10.000–30.000 € (extern, je nach Komplexität) |
| Trainingsdaten-Aufbereitung und Labeling | 3–6 Monate Innenaufwand |
| ML-Modell-Entwicklung (Python-Stack) | 40.000–80.000 € (Dienstleister) oder 1 Vollzeit-Data-Scientist-Monat |
| Validierungsphase und SPS-Integration | 10.000–25.000 € |
| Gesamt | 70.000–160.000 € |
Laufende Kosten (monatlich)
- Python/MLflow on-premise: 200–500 € (Infrastruktur + Wartung)
- Azure Machine Learning: 1.000–3.000 € je nach Compute-Nutzung
- DataRobot: 4.000–16.000 € (Enterprise-Lizenz anteilig)
Was du dagegenrechnest
Beim Ausgangsszenario: 12 % Ausschuss auf 180.000 Teilen/Monat = 21.600 Fehlerteile × 3,40 € = 73.440 €/Monat Verlust. Senkung auf 6,5 % = 11.700 Fehlerteile × 3,40 € = 39.780 €/Monat. Einsparung: 33.660 €/Monat, also ca. 404.000 € pro Jahr (konservativ gerechnet, ohne Energieeinsparung).
Bei einer Investition von 120.000 € (mittlere Schätzung) und 33.660 € monatlicher Einsparung amortisiert sich das System in 3,5 bis 4 Monaten, vorausgesetzt, die Ausschussreduktion tritt so ein wie im Piloten beobachtet.
Wichtige Einschränkung: Diese Rechnung gilt für einen Betrieb mit hohem Produktionsvolumen und hoher Ausschussquote. Bei 30.000 Teilen/Monat und 5 % Ausschuss sieht die Rechnung grundlegend anders aus, und das Setup-Investment ist nicht kleiner.
Drei typische Einstiegsfehler
1. Mit dem Modell starten, bevor die Dateninfrastruktur steht. Der häufigste Fehler: Ein Unternehmen engagiert einen Data Scientist oder Dienstleister für das ML-Modell, bevor überhaupt geprüft wurde, ob die Thermoelement-Daten kontinuierlich, vollständig und mit Qualitätsergebnissen verknüpft gespeichert werden. Das Ergebnis: Monate verschwendet mit Datenarchäologie, schlechte Modellqualität, Frustration. Der erste Schritt muss immer sein: Wie sehen unsere Daten heute aus, und was fehlt?
2. Ausschuss ohne Chargen-ID erfassen. Das Modell lernt nur dann, wenn zu jedem Thermoelementprofil auch das Ergebnis der Qualitätsinspektion verknüpft werden kann. Wenn die Qualitätsprüferin heute nur „Charge: 12 von heute schlecht” notiert, ohne Brennzyklus-Zeitstempel oder eindeutige Chargen-ID, gibt es keine Trainingsdaten. Die digitale Rückverfolgbarkeit von Ausschuss bis zum Brennprofil ist die kritischste infrastrukturelle Voraussetzung, und sie fehlt in vielen Betrieben.
3. Das Modell nicht neu trainieren, wenn sich Rohstoffchargen oder Glasurrezepturen ändern. Das ist die leise Version des Scheiterns. Das Modell war nach 18 Monaten Training auf Rohstoffen von Lieferant A validiert. Dann wechselt der Betrieb zu Lieferant B, und die Brennkurven müssen leicht angepasst werden, weil das neue Material andere Quarzgehalte hat. Das Modell merkt das nicht, weil sich die Temperaturprofile auf den ersten Blick ähneln. Die Ausschussrate steigt, aber langsam und schleichend, und der erste Reflex ist, die Anlage zu beschuldigen, nicht das Modell. Ein Modell-Monitoring, das die Vorhersagegenauigkeit kontinuierlich überwacht, ist Pflicht. Und ein definierter Prozess, wann das Modell neu trainiert wird (bei Rohstoffwechsel, bei Glasurformuländerung, nach jedem Halbjahr), muss von Anfang an stehen.
Was mit der Einführung wirklich passiert, und was nicht
Die Technik ist der einfachere Teil. Der schwierigere ist das Verhältnis zwischen System und Erfahrung.
Die Skepsis der Brennmeister ist berechtigt. Ein Modell, das sie auf eine vermeintliche Kritikalität hinweist, die ihnen nicht kritisch erscheint, untergräbt mit jeder Fehlwarnung das Vertrauen. Erfahrungsgemäß gibt es zwei Phasen: In Phase 1 (erste 3 Monate nach Pilotstart) wird jede Systemwarnung von erfahrenem Personal geprüft und häufig als „unnötig” bewertet. Das ist normal und wertvoll, dieser Feedback-Kreislauf verbessert das Modell. In Phase 2 (ab Monat 6) wächst das Vertrauen, wenn die Trefferquote nachweisbar gut ist.
Was nicht passiert: Das System ersetzt nicht den Brennmeister. Es ersetzt auch nicht die Notwendigkeit, die Rohstoffe zu verstehen, die Ofenatmosphäre zu kennen oder auf unerwartete Ereignisse reagieren zu können. Ein Modell, das 6 von 6 kritischen Profilsignaturen kennt, erkennt trotzdem nicht das siebte Muster, das noch nie zuvor aufgetreten ist.
Konkrete Maßnahmen für die Einführungsphase:
- Brennmeister und Qualitätsprüfung von Anfang an einbinden, sie kennen die Anomalien, die das Modell lernen soll
- Separate „Schattenphase” einplanen: Das Modell läuft 3–4 Monate parallel, ohne dass Ergebnisse in den Produktionsprozess eingreifen. Nur Auswertung. Das schafft Vertrauen und verbessert das Modell ohne Produktionsrisiko
- Klare Eskalationsregel: Warnung kommt → wer entscheidet, ob eingegriffen wird? Diese Frage muss vor dem ersten Warntag beantwortet sein
- Falschwarnungen dokumentieren und auswerten, nicht ignorieren, sie sind Verbesserungssignale
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Infrastruktur-Audit | Woche 1–4 | OPC-UA-Fähigkeit prüfen, Thermoelementstatus, Kalibrierungshistorie, Defektdokumentation sichten | Mehr Lücken in den historischen Daten als erwartet |
| Dateninfrastruktur aufbauen | Monat 2–4 | InfluxDB einrichten, OPC-UA-Anbindung, Grafana-Dashboard, Defekt-Labeling-Prozess definieren | OPC-UA-Gateway-Einbindung dauert länger als geplant (Abstimmung mit Ofenhersteller) |
| Trainingsdaten sammeln | Monat 4–18 | Kontinuierliche Aufzeichnung mit Qualitätsverknüpfung, kein Abkürzen möglich | Rohstoff- oder Glasurwechsel in diesem Zeitraum → Trainingsdaten werden heterogener |
| Modellentwicklung | Monat 18–22 | Feature Engineering, Modelltraining, Kreuzvalidierung, Schwellwert-Tuning | Zu hohe Falsch-Positiv-Rate → Brennmeister-Akzeptanz gefährdet |
| Schattenphase / Validierung | Monat 22–26 | System läuft parallel ohne Eingriff, Vorhersagen vs. tatsächliche Ausschüsse auswerten | Ausschussquote verändert sich durch Saisoneffekte |
| Pilotbetrieb mit Eingriff | Monat 26–29 | Erste reale Korrekturen auf Basis von Systemwarnungen | Erste Fehlwarnungen → wichtig: Feedback-Kreislauf aufrechterhalten |
| Produktivbetrieb | ab Monat 30 | Regelmäßiges Modell-Monitoring, Retraining-Plan etablieren | Modell-Drift durch Rohstoffwechsel oder neue Glasurrezepturen |
Die Gesamtlaufzeit bis zum Produktivbetrieb liegt damit bei 24–30 Monaten ab Projektstart, das ist ehrlicher als die häufig genannten „6–12 Monate”. Der größte Zeitblock ist das Sammeln der Trainingsdaten: Er ist nicht verkürzbar.
Häufige Einwände, und was dahintersteckt
„Wir haben schon SCADA, das reicht.”
SCADA-Systeme speichern und visualisieren Ist-Werte, aber sie lernen nicht, welche Profilkombinationen historisch zu Defekten geführt haben. Ein SCADA-Alarm schlägt an, wenn ein Grenzwert überschritten wird. Das ML-Modell schlägt an, wenn ein Muster entsteht, das in 90 % der Fälle vor einem Grenzwert-Problem zu Defekten führt. Das ist der Unterschied zwischen Reaktion und Prognose.
„Unser Brennmeister erkennt die kritischen Muster selbst.”
Ja, tagsüber, wenn er frisch ist und einmal pro Stunde schaut. Nicht um 3:17 Uhr morgens bei Schichtwechsel. Und er erkennt sie nicht, wenn er parallel drei Dinge beobachten muss und Thermoelementpaare 7 und 12 gleichzeitig driften. Das System ist kein Ersatz für Erfahrung, es ist die Schicht, die die Erfahrung 24/7 verfügbar macht.
„Was kostet uns eine Fehlerwarnung?”
Eine Fehlwarnung kostet eine Setpoint-Korrektur von 2 °C, die nicht notwendig war. Eine unkritische 2-°C-Korrektur hat dabei kaum Auswirkungen auf die Charge, die Toleranzbänder in Keramikprozessen sind breiter als 2 °C. Das Kosten-Nutzen-Verhältnis von Falsch-Positiv (minimale unnötige Korrektur) vs. Falsch-Negativ (Charge geht verloren) ist klar: Falsch-Negative sind teuer, Falsch-Positive sind fast kostenlos. Die Alarmschwelle kann entsprechend konservativ gesetzt werden.
DIN EN ISO Toleranzwerte, was als Defekt gilt
Diese Frage ist entscheidend, wird aber selten früh genug gestellt: Nach welchem Standard definiert dein Unternehmen einen Defekt?
Für keramische Tischgeschirr- und Dekorprodukte ist DIN EN ISO 19721 (Keramische Fliesen, Methoden zur Prüfung und Feststellung von Maßen und Oberflächenqualität) nicht direkt anwendbar, aber das Prinzip der quantifizierten Toleranzgrenzen ist übertragbar. Für Tischkeramik gilt im Wesentlichen:
- Maßtoleranzen: ±1,5–2 % je nach Produktklasse und Herstellernorm
- Ebenheitsabweichung: nach Herstellerstandard, typisch < 0,5 % der größten Abmessung
- Oberflächenfehler (Glasur): Pinholes, Nadelstiche, Blasen, Definition nach unternehmensinternen oder Kundenvorgaben; keine Normierung auf Tischgeschirr im deutschen Rechtsrahmen
- Farbabweichung: ΔE-Wert nach CIE-Norm (DIN EN ISO 11664); typische Toleranzgrenzen in der Premiumkeramik: ΔE < 1,5–2,0 pro Charge
Diese Definitionen müssen in das Labeling-Schema für das ML-Modell übersetzt werden. Wenn heute „gut” und „schlecht” nach Bauchgefühl entschieden wird, ist das kein valides Trainingslabel. Ein standardisiertes Inspektionsprotokoll, mit konkreten ΔE-Grenzen für Farbabweichung und klaren Fotodokumentationsrichtlinien für Risse, ist Voraussetzung für konsistente Trainingsdaten.
Woran du merkst, dass das zu dir passt
Dieses Projekt ist für dich richtig, wenn mehrere der folgenden Punkte zutreffen:
- Dein Betrieb brennt mehr als 80.000 Teile pro Monat in einem kontinuierlichen Tunnelofenprozess
- Deine Ausschussquote liegt bei 7 % oder höher in einer oder mehreren Linien
- Du hast bereits digitale Thermoelementdaten, selbst wenn sie bisher nur in SCADA-Archiven liegen
- Die Qualitätsinspektion läuft heute zumindest halbdigital (Protokoll mit Datum und Charge), sodass Defekte rückverfolgbar sind
- Du hast einen IT-Affinität im Betrieb, entweder interne IT/OT-Kapazität oder einen Automatisierungspartner
- Das Wissen über kritische Profilmuster lebt heute in einzelnen erfahrenen Brennmeistern und ist gefährdet durch Fluktuation oder Pensionierung
Wann es noch nicht passt, drei harte Ausschlusskriterien:
-
Unter 50 Mitarbeitende oder unter 50.000 Teilen/Monat Produktionsvolumen. Der Setup-Aufwand von 70.000–160.000 Euro amortisiert sich bei geringem Volumen nicht. Investiere stattdessen in bessere Brennkurven-Dokumentation und Schulung.
-
Keine digitale Defektverfolgung vorhanden. Wenn Ausschuss heute nur auf Papier oder gar nicht je Charge dokumentiert wird, fehlen die Trainingslabels. Das ist nicht überbrückbar, das Modell kann nicht lernen, was nie aufgezeichnet wurde. Zuerst muss ein digitales Qualitätsdokumentationssystem eingeführt werden.
-
Keine kontinuierlich digitale Thermoelementerfassung mit Zeitstempel. Wenn Temperaturprofile nur als Schichtberichte oder Stichproben vorliegen, gibt es keine Zeitreihendaten für das Training. Mindestvoraussetzung: SCADA mit Historiendaten, idealerweise Sekundenauflösung.
Das kannst du heute noch tun
Bevor du in Infrastruktur oder Modellentwicklung investierst, gibt es einen Schritt, der nichts kostet und den Umfang des Projekts erheblich klarer macht: eine Datenqualitätsbewertung deiner vorhandenen SCADA-Archivdaten.
Exportiere die letzten 30 Tage Thermoelementdaten aus deinem SCADA-System. Dann hole dir eine Liste der 20 schlechtesten Chargen der letzten 12 Monate mit Datum und Uhrzeit, aus dem Qualitätsbuch oder dem Ausschussprotokoll. Versuche manuell, die Thermoelementverläufe zu diesen Chargen zu finden und zu vergleichen. Siehst du Muster? Oder sind die Daten unvollständig, lückenhaft oder nicht mit Chargen verknüpfbar?
Das Ergebnis dieser Übung zeigt dir, ob deine Datenbasis für ML-Modellierung grundsätzlich geeignet ist, oder ob zuerst Infrastrukturarbeit nötig ist.
Für eine erste Exploration ohne spezielle Software kannst du diesen Analyse-Prompt verwenden:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- LIXIL-Fallstudie (Pluto7, 2023): Predictive Maintenance with Machine Learning, 22-Zonen-Optimierung eines Sanitärkeramik-Industrieofens. Random-Forest-Modell mit 88 % Vorhersagegenauigkeit. 8–10 % Fehlteilreduktion, Einsparungspotenzial $10–12 Mio./Jahr. Quelle: pluto7.com/success-stories/predictive-maintenance-with-machine-learning/
- Scientific Reports (Nature), 2025: „Advanced machine learning models for the prediction of ceramic tiles’ properties during the firing stage”, CatBoost, XGBoost und GBM für Vorhersage von Wasseraufnahme und Biegefestigkeit aus Brennparametern. Bestätigt Lernbarkeit des Brennprofil-Qualitätszusammenhangs. DOI: 10.1038/s41598-025-12011-9
- Pilotszenario (Ankerbetrieb): Bayerischer Tischkeramikhersteller, 200 MA, Tunnelofen 1.280°C, 47 Thermoelemente, Ausschussreduktion 12 % → 6,5 %. Zahlen aus dem Angle Hint der Redaktion; nicht veröffentlichte Pilotdaten.
- Transfer Learning Rotary Kiln (PMC/NCBI, 2022): „Working Condition Recognition Based on Transfer Learning and Attention Mechanism for a Rotary Kiln”, Grenzen der Übertragbarkeit zwischen Ofengeometrien. PMC: 9498151
- Thermoelementspezifikation Typ S/Typ N: IEC 60584-1:2013, Thermocouples, Part 1: EMF specifications and tolerances. Drift-Charakteristik Typ S nach 2.000–5.000 h.
- Kostenangaben Azure ML: Microsoft-Pricing-Dokumentation, Stand Mai 2026; DataRobot Enterprise Pricing: Capterra/TrustRadius, Stand Mai 2026.
- Quarzsprung 573°C: Physikalische Fachliteratur; Mortimer, Robert G.: Physical Chemistry, 3. Auflage. Modifikationswechsel Alpha-Beta-Quarz mit Volumenänderung als bekannte Rissursache in Keramikbrennen.
Du willst wissen, ob deine Thermoelementdaten für einen ML-Ansatz ausreichen? Oder ob zuerst Infrastrukturarbeit nötig ist? Meld dich, wir schauen gemeinsam, was als nächster Schritt sinnvoll ist.
Diesen Inhalt teilen:
Du weißt jetzt, was möglich ist. Fehlt noch die Umsetzung?
Viele, die diesen Use Case lesen, versuchen es danach allein. Das kostet Wochen: Datenschutzfragen, Toolauswahl, Prompt-Engineering, interne Überzeugungsarbeit. Wir kennen diese Stolperstellen, weil wir das Setup schon gebaut haben. Schreib uns kurz, das Erstgespräch ist kostenlos und unverbindlich.
Weitere Use Cases
Floatglas-Blasenerkennung: Mikrodefekte inline erkennen
Winzige Gasblasen im Floatglas-Band entstehen unvorhersehbar im Zinnbad und machen großformatige Architektur- und Solarscheiben unverkäuflich. KI-Bildverarbeitung erkennt Defekte in Echtzeit direkt am Band.
Mehr erfahrenML-gestützte Brennprozess-Optimierung in der Keramikindustrie
Temperaturschwankungen im Tunnelofen erzeugen Ausschuss, den niemand vorhersagt. ML-Modelle lernen das optimale Temperaturprofil für jeden Produktmix, und reduzieren gleichzeitig Ausschuss und Energieverbrauch.
Mehr erfahrenGlasfaser-Fadenriss: ML-Prognose aus Schmelzviskositätsdaten
Hochgeschwindigkeitsspinnen von Glasfasern bricht unerwartet ab, wenn unsichtbare Siliziumdioxid-Verunreinigungen in der Schmelze die Viskosität lokal verschieben. ML-Modelle erkennen kritische Viskositätsmuster bevor der Faden reißt.
Mehr erfahrenFrieda Funke
Konzeptentwicklerin
Ich frage nicht, was KI kann. Ich frage, was du in deinem Alltag damit anfängst. Erst wenn ich eine ehrliche Antwort habe, entsteht daraus ein konkreter Use Case. Fehlt ein Anwendungsfall, der zu dir passt? Schreib mir kurz.