Zum Inhalt springen
Metallindustrie legierungwerkstoffkundeentwicklung

Legierungsoptimierung mit KI

Legierungszusammensetzungen für spezifische Eigenschaftsprofile KI-gestützt optimieren — Festigkeit, Korrosionsbeständigkeit und Bearbeitbarkeit balancieren.

⚡ Auf einen Blick
Problem
Legierungsentwicklung basiert auf Expertenwissen und Trial-and-Error — Optimierungszyklen dauern Monate und binden teure Laborressourcen.
KI-Lösung
Gradient-Boosting-Modell (XGBoost/LightGBM) oder bayesische Optimierung analysiert historische Versuchsdaten zu Legierungszusammensetzungen und Materialeigenschaften und schlägt optimierte Zusammensetzungen vor.
Typischer Nutzen
Entwicklungszyklen um 30–50 % verkürzt, Laborversuche auf vielversprechende Kandidaten reduziert, Materialkosten durch optimierte Zusammensetzungen gesenkt.
Setup-Zeit
20–30 Wochen Datenbankaufbau + Modelltraining + Validierung
Kosteneinschätzung
60.000–145.000 € Erstinvestition (Datenharmonisierung + Modell + Lizenzen); 25.000–55.000 €/Jahr laufend
ML-gestützte WerkstoffentwicklungMaterials Informatics
Worum geht's?

Es ist Donnerstag, 14:17 Uhr. Werkstoffingenieurin Maja Schreiber starrt auf den Prüfbericht der dritten Versuchsschmelze in diesem Quartal.

Wieder nicht. Die Zugfestigkeit ist um 18 MPa zu niedrig, und die Korrosionsbeständigkeit nach 500 Stunden Salzsprühtest liegt knapp unter dem Anforderungsprofil des Kunden. Majas Schmelzplan für die nächste Versuchsrunde basiert auf Erfahrung, Bauchgefühl und zwei Fachartikeln aus 2019. Sie ändert den Siliziumgehalt um 0,3 Massenprozent und das Magnesium leicht nach oben. Vielleicht. Vielleicht trifft sie es diesmal.

Der Laborkalender zeigt: frühestmöglicher nächster Termin für Gießversuche ist in sechs Wochen. Dann Prüfung, Auswertung, Rückmeldung an den Kunden — Anfang nächsten Quartals. Wenn dann der Rohstoffpreis für Molybdän wieder gestiegen ist, rechnet sich die Legierung nicht mehr.

Das Projekt kostet bereits mehr als das ursprünglich kalkulierte Entwicklungsbudget. Und es gibt keine Garantie, dass Schmelze vier die richtige ist.

Das echte Ausmaß des Problems

Legierungsentwicklung ist im Kern ein Optimierungsproblem in einem riesigen Suchraum. Eine typische Aluminiumlegierung hat sechs bis zehn relevante Legierungselemente — jedes mit einem sinnvollen Wertebereich. Dazu kommen Prozessparameter: Gießtemperatur, Abkühlrate, Wärmebehandlungsdauer und -temperatur. Der kombinatorische Raum aller möglichen Zusammensetzungen ist astronomisch groß.

Der klassische Weg ist Trial-and-Error mit Expertensystem: Werkstoffingenieure nutzen ihr Wissen, physikalisch-metallurgische Grundprinzipien und historische Datenpunkte, um gezielt zu variieren. Das funktioniert — aber langsam. Jeder Versuchszyklus dauert typisch 4–10 Wochen: Guss, Wärmebehandlung, mechanische Prüfung, Korrosionsprüfung, Auswertung. Bis eine Legierung spezifikationskonform ist, vergehen häufig 6–18 Monate, manchmal Jahre.

Der wirtschaftliche Druck hat sich verändert. Kunden erwarten kürzere Entwicklungszeiten, die Regulatorik stellt neue Anforderungen an Recyclingfähigkeit und CO₂-Fußabdruck, und Lieferkettenstörungen erzwingen Substitutionslegierungen in kurzen Fristen. Gleichzeitig steigen die Kosten für knappe Legierungselemente wie Kobalt, Vanadium oder Molybdän erheblich.

Eine Studie der Fraunhofer-Forschungseinrichtungen (basierend auf dem StahlDigital-Projekt mit Thyssen­krupp Steel, Kirchhoff Automotive und Daimler) zeigt: Nur rund 10 Prozent der während der Produktion erfassten Werkstoffdaten werden tatsächlich für Analyse und Optimierung genutzt. Der Rest liegt in heterogenen Formaten, ist nicht maschinenlesbar oder in Insellösungen eingeschlossen.

Das ist das eigentliche Problem: Nicht mangelndes Wissen — mangelnde Nutzung des vorhandenen Wissens.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlKlassische MethodeMit Materials Informatics
Versuchszyklen bis zur Ziellegierung8–20 Zyklen (6–18 Monate)3–6 Zyklen (2–6 Monate) ¹
Anteil des Kompositionsraums systematisch erschlossen< 5 % (Expertenwissen-geleitet)30–60 % (datengetrieben + Modell)
Laborkosten pro Neuentwicklung100–500 Tsd. € je nach Komplexität60–300 Tsd. € ¹
Wissenserhalt bei PersonalwechselGering (Erfahrung in Köpfen)Hoch (Modell + Datenbasis)
Reaktionszeit bei Rohstoff-Substitution4–12 Monate6–12 Wochen ¹

¹ Erfahrungswerte aus Industrieberichten; stark abhängig von vorhandener Datenbasis und Systemkomplexität. Voestalpine berichtete nach drei Jahren Einsatz von Alchemite™ (Intellegens, 2024) eine Kostenreduktion von knapp 40 % in der Prozessparameter-Optimierung für additive Fertigungslegierungen.

Einschätzung auf einen Blick

Zeitersparnis — mittel (3/5) Der Effekt ist real, aber er entsteht nicht im Tagesgeschäft — er entsteht auf Projektebene. Entwicklungszyklen, die bisher 12–18 Monate dauerten, können auf 4–8 Monate verkürzt werden. Für einzelne Mitarbeitende ändert sich die Tagesarbeit wenig: Das System schlägt vor, Mensch und Labor entscheiden und führen aus. Verglichen mit anderen Anwendungen in dieser Kategorie — wie der Schweißnaht-Qualitätskontrolle, die täglich repetitive Inspektionszeit einspart — liegt die Legierungsoptimierung im Mittelfeld. Der Nutzen ist strategisch, nicht operativ.

Kosteneinsparung — hoch (4/5) Wenn das System funktioniert und die Datenbasis trägt, sind die Einsparungen erheblich. Voestalpine dokumentierte über drei Jahre mit Alchemite™ knapp 40 % Kostenreduktion in der Prozessoptimierung für Metallpulver — ein Wert, der sich aus weniger Schmelzversuchen, kürzeren Entwicklungszeiten und geringerem Rohstoffverbrauch zusammensetzt. Der hohe Wert hier spiegelt das Potenzial bei guter Datenlage wider, nicht den garantierten Durchschnitt.

Schnelle Umsetzung — sehr niedrig (1/5) Das ist der schwerste Anlaufpunkt in diesem Anwendungsfall — und ein ehrliches Alleinstellungsmerkmal dieser Kategorie unter allen Anwendungsfällen des Metall-Bereichs. Ohne eine historische Materialdatenbank mit mindestens 200 strukturiert dokumentierten Versuchsdatensätzen gibt es nichts zu modellieren. Aufbau dieser Datenbasis, Integration in eine Auswertungsplattform, Training und Validierung des Modells: Realistisch sind 20–30 Wochen, bevor ein erster Modell-Output aussagekräftig ist. In der gesamten Metall-Kategorie gibt es keinen schwieriger anzulaufenden Anwendungsfall.

ROI-Sicherheit — niedrig (2/5) Die Ergebnisqualität hängt von drei Variablen ab, die du vor dem Projekt nicht sicher beurteilen kannst: Datenbankqualität, Modellkomplexität und wie stark das Zieleigenschaften-Profil vom bisherigen Trainingsraum abweicht. Wenn das Modell gut kalibriert ist und die Ziellegierung im gelernten Raum liegt, ist der ROI klar positiv. Wenn du aber eine wirklich neue Legierungsklasse entwickeln willst, für die du kaum historische Daten hast, kann das Modell nicht helfen — es kann nur interpolieren, nicht extrapolieren. Diese Unsicherheit ist fundamentaler als bei den meisten anderen Anwendungen in dieser Kategorie.

Skalierbarkeit — mittel (3/5) Ist das Modell für eine Legierungsklasse eingerichtet und validiert, lässt es sich für weitere Entwicklungsprojekte in dieser Klasse schnell wiederverwenden. Neue Legierungsklassen (z.B. vom Aluminium zum Nickel-Superlegierungssystem) erfordern jedoch eigene Datensätze und eigenes Retraining — es gibt keine universellen Legierungsmodelle, die über Werkstoffklassen hinweg funktionieren. Mittlere Skalierbarkeit innerhalb der etablierten Grenzen.

Richtwerte — stark abhängig von vorhandener Datenbasis, Legierungskomplexität und Teamgröße im R&D-Bereich.

Was das System konkret macht

Der technische Ansatz nennt sich Machine Learning auf Basis von Materials Informatics — eine Kombination aus Werkstoffwissenschaft, Datenbanktechnologie und statistischem Lernen.

Das Grundprinzip: Für jede historisch entwickelte Legierung gibt es Messwerte — Zugfestigkeit, Streckgrenze, Bruchdehnung, Härte, Korrosionsbeständigkeit, Zerspanbarkeit. Und es gibt die Eingangsgrößen: chemische Zusammensetzung und Prozessparameter. Ein ML-Modell lernt die Zusammenhänge zwischen beiden — nicht durch Physik-Gleichungen, sondern durch statistische Mustererkennung.

Wenn du dann eine neue Anforderung bekommst (Festigkeit ≥ 380 MPa, Bruchdehnung ≥ 12 %, Einsatz bis 200 °C Betriebstemperatur), kann das Modell über die gesamte gelernte Kompositions-Eigenschafts-Landschaft suchen und Zusammensetzungen vorschlagen, die dieses Profil am wahrscheinlichsten erfüllen.

Drei wichtige Einschränkungen, die das Modell nicht überwinden kann:

  1. Das Modell kann nur interpolieren — es bewegt sich im Raum der bekannten Daten. Außerhalb dieses Raums sind Vorhersagen unzuverlässig.
  2. Wenn Messmethoden oder Probengeometrien über die Jahrzehnte verändert wurden, sind ältere Datenpunkte mit neueren nicht direkt vergleichbar — sie stören das Modell.
  3. Mikrostruktureffekte (Korngrößenverteilung, Ausscheidungsverhalten), die in den historischen Daten nicht erfasst sind, werden auch vom Modell nicht berücksichtigt.

Das System ersetzt keinen Werkstoffingenieur. Es ersetzt Trial-and-Error durch datengetriebene Vorauswahl. Der Mensch entscheidet, welche Kandidaten ins Labor kommen.

Datengrundlage als Engpass

Das ist der Abschnitt, der in den meisten Einführungsberichten fehlt — und genau deshalb hier besonders ausführlich behandelt wird.

Die zentrale Wahrheit: Ein ML-Modell zur Legierungsoptimierung ist nur so gut wie die Datenbank dahinter. Und diese Datenbank zu bauen ist das schwierigste, zeitaufwändigste und teuerste Teil des gesamten Projekts.

Was du für eine belastbare Datenbasis brauchst:

  • Mindestens 150–300 Datenpunkte je Legierungsklasse, die du modellieren willst. Jeder Datenpunkt enthält: vollständige chemische Zusammensetzung (alle relevanten Elemente, nicht nur die Hauptlegierungselemente), Prozessparameter (Gießtemperatur, Abkühlbedingungen, Wärmebehandlung) und Messergebnisse nach konsistenter Prüfnorm (z.B. DIN EN ISO 6892-1 für Zugprüfung).
  • Konsistenz über Zeit: Wenn sich deine Prüfmethodik in den letzten 15 Jahren verändert hat, müssen ältere Daten harmonisiert oder ausgeschlossen werden.
  • Vollständigkeit: Fehlende Messwerte in kritischen Feldern entwerten den Datensatz. Ein Versuchsbericht ohne Wärmebehandlungsprotokoll ist für das Modell nur halb verwertbar.

Was in der Praxis fast immer fehlt:

Die meisten Metallbetriebe haben Prüfberichte — aber sie liegen als PDF-Scans, in verschiedenen Excel-Vorlagen über drei Jahrzehnte, mit wechselnden Elementbezeichnungen und unterschiedlichen Einheiten. Diese Daten zu harmonisieren ist Handarbeit: typisch 300–600 Stunden Aufwand für einen Datensatz von 500 historischen Versuchen, je nach Qualität der Ausgangsunterlagen.

Wer diese Arbeit unterschätzt, scheitert nicht am Modell — er scheitert an den Daten.

Praktischer Einstiegspunkt: Beginne damit, die Dokumentation der letzten 5 Jahre zu auditieren. Wie viele Versuchsberichte existieren? In welchem Format? Welche Felder sind konsistent befüllt, welche lückenhaft? Diese Audit-Analyse (typisch 2–4 Wochen) zeigt dir, ob du genug Rohmaterial für ein aussagekräftiges Modell hast — bevor du einen Cent in Softwarelizenzen investierst.

Integration in den Simulationsworkflow

Materials Informatics ersetzt nicht die klassischen thermodynamischen Simulationstools — es ergänzt sie.

Der Standardworkflow in mittelgroßen Entwicklungsabteilungen mit Simulationskompetenz sieht aus wie folgt:

  1. Thermodynamische Vorfilterung mit CALPHAD-Methode (z.B. Thermo-Calc): Zusammensetzungskandidaten, die thermodynamisch nicht stabil sind (falsche Phasenbildung, zu breites Erstarrungsintervall für den Gussprozess), werden rechnerisch aussortiert — ohne Schmelzversuch.

  2. ML-Modell für Eigenschaftsvorhersage: Aus den thermodynamisch zulässigen Kandidaten wählt das ML-Modell jene aus, die das mechanische und korrosive Anforderungsprofil am ehesten erfüllen.

  3. Gezielte Laborvalidierung: Nur die Top-3 bis Top-5 Kandidaten werden gegossen und geprüft. Das Prüfergebnis fließt als neuer Datenpunkt zurück in die Datenbank und verbessert das Modell.

Dieser Kreislauf — simulieren, vorhersagen, validieren, nachtrainieren — ist der Kern moderner Legierungsentwicklung. Er setzt voraus, dass du Thermo-Calc oder ein vergleichbares Thermodynamik-Tool bereits nutzt oder lizenzieren kannst. Wer ganz von vorne anfängt, hat einen deutlich längeren Anlaufweg.

Konkrete Werkzeuge — was wann passt

Der Markt für Materials-Informatics-Werkzeuge ist überschaubar und hat eine klare Struktur: Forschungsinstitute auf der einen Seite, Konzern-Tools auf der anderen. Für den deutschen Mittelstand gibt es keine Plug-and-Play-Lösung.

Thermo-Calc — thermodynamische Basis für das Kompositionsdesign CALPHAD-basierte Simulation für Phasendiagramme, Gleichgewichte und Erstarrungsverhalten. Industrie­standard in der deutschen Stahl- und Aluminiumindustrie. Lizenz auf Anfrage; Einstieg ab ca. 5.000–15.000 € jährlich je nach Legierungssystem-Datenbank. Setzt Werkstoffingenieure mit Thermodynamik-Kenntnissen voraus. Die Python-API (TC-Python) erlaubt die programmatische Kopplung mit ML-Modellen.

Citrine Informatics — spezialisierte Materials-Informatics-Plattform Die bekannteste rein auf Materials Informatics ausgerichtete Plattform, genutzt u.a. von Dow Chemical, Corning und Toyota Research Institute. Bayesische Optimierung und Sequential Experimental Design reduzieren Laborversuche systematisch. Realistische Option nur für größere Unternehmen: Enterprise-Pricing, US-Hosting, starke Abhängigkeit von Citrine-Beratern. Für KMU praktisch nicht zugänglich.

Individuell entwickeltes ML-Modell mit Python + scikit-learn Der pragmatische Mittelweg für Unternehmen mit einem Datenwissenschaftler oder einer externen Data-Science-Agentur. Gradient-Boosting-Regressionsmodelle (XGBoost, LightGBM) lernen sehr gut auf tabellarischen Werkstoffdaten. Kostenlos in der Implementierung, aber der Personaleinsatz ist der entscheidende Kostenfaktor. Gut dokumentierte LIMS-Daten vorausgesetzt.

Julius AI — erster Explorations-Schritt ohne Programmieren Wenn du deine historischen Versuchsdaten als strukturierte CSV-Datei vorliegen hast und zunächst verstehen willst, welche Einflussvariablen überhaupt relevant sind: Julius AI analysiert deine Daten in natürlicher Sprache, erstellt Korrelationsanalysen und zeigt Zusammenhänge. Kostenloser Einstieg (100 Credits/Monat). Kein Ersatz für ein echtes ML-Modell, aber ein guter erster Schritt, um zu sehen, ob deine Daten überhaupt Muster tragen.

Azure Machine Learning — ML-Plattform für skalierte Experimente Wenn du systematisch viele Modellvarianten testen, Hyperparameter-Tuning betreiben und das Modell in einen reproduzierbaren Workflow einbetten willst: Azure ML bietet AutoML, Experiment-Nachverfolgung und Modellbereitstellung. EU-Region (Germany West Central) verfügbar — relevant für DSGVO-Anforderungen. Einrichtungskosten: 100–500 € monatlich für Experimente, deutlich mehr im produktiven Einsatz.

Wann welcher Ansatz:

  • Thermodynamische Grundlagenarbeit → Thermo-Calc
  • Erster Blick auf eigene Daten ohne Programmieren → Julius AI
  • Eigene Implementierung, internes Team mit Python-Kenntnissen → scikit-learn
  • Skalierte ML-Plattform mit EU-Hosting → Azure Machine Learning
  • Konzernprojekt mit belastbarer Datenbasis → Citrine Informatics

Datenschutz und Datenhaltung

Legierungsdaten sind in den meisten metallverarbeitenden Unternehmen Betriebsgeheimnisse. Formeln, Prozessparameter und die Ergebnisse aus Jahrzehnten Entwicklungsarbeit sind ein zentraler Wettbewerbsvorteil — oft wichtiger als Patente.

Für die Cloud-Verarbeitung gilt: Wenn du Legierungsrezepturen und Messwerte in eine externe Plattform überträgst, schließt du eine DSGVO-konforme Auftragsdatenverarbeitung (AVV nach Art. 28 DSGVO) ab. Noch wichtiger als DSGVO: Die technisch-wirtschaftliche Geheimhaltung dieser Daten. Kläre mit deinem Rechtsberater, ob die Nutzungsbedingungen des Dienstleisters ausreichend Schutz für Betriebsgeheimnisse bieten.

Hinweis: Die rechtliche Bewertung des Schutzes von Betriebsgeheimnissen in Cloud-Umgebungen ist komplex und hängt von Dienstleistervertrag, Datenart und Branchenanforderungen ab. Diese Einschätzung ersetzt keine Rechtsberatung.

Hosting-Optionen nach Sicherheitsbedarf:

  • On-Premise oder Private Cloud: Höchste Kontrolle, kein Datenaustritt. Erfordert eigene IT-Infrastruktur und Betriebsaufwand. Empfehlenswert, wenn Legierungsformeln als kritisches Betriebsgeheimnis eingestuft sind.
  • Azure Machine Learning (Region Germany West Central): Daten verlassen EU nicht, Microsoft-AVV verfügbar. Gute Balance zwischen Kontrolle und Betriebsaufwand.
  • Citrine Informatics: US-Hosting — nur nach sorgfältiger rechtlicher Prüfung und vertraglicher Absicherung einsetzbar.

Was es kostet — realistisch gerechnet

Einmalige Implementierungskosten

Der größte Kostenpunkt ist der Datenbankaufbau — nicht die Software.

  • Historische Datenharmonisierung (300–600 Stunden bei 200–500 Versuchsdatensätzen): 30.000–60.000 € bei externer Beauftragung oder entsprechendem internem Aufwand
  • Modellentwicklung, -training und -validierung (extern beauftragt): 20.000–60.000 €
  • Softwarelizenzen Erstjahr (Thermo-Calc + ML-Plattform): 10.000–25.000 €
  • Gesamtinvestition Erstjahr: 60.000–145.000 € — stark vom Ausgangszustand deiner Datenbasis abhängig

Laufende Kosten (jährlich)

  • Softwarelizenzen und ML-Infrastruktur: 15.000–30.000 €/Jahr
  • Modellpflege und -retraining bei neuen Legierungsklassen oder Messänderungen: 10.000–25.000 €/Jahr (intern oder extern)

Was du dagegenrechnen kannst

Ein Entwicklungsprojekt, das klassisch 10 Schmelzversuche á 15.000 € Laborkosten braucht (insgesamt 150.000 €), könnte mit Materials Informatics auf 4 Schmelzversuche reduziert werden — Einsparung: 90.000 €. Dazu kommt der Zeitvorteil: 4 Monate frühere Marktreife, die je nach Auftragslage direkt in Umsatz umgerechnet werden kann.

Voestalpine hat nach drei Jahren Einsatz des Alchemite™-Systems eine Kostenreduktion von knapp 40 % in der Prozessparameter-Optimierung für Metallpulver berichtet (Intellegens, 2024). Das ist kein typischer KMU-Wert — Voestalpine hat erheblich mehr historische Daten und eigene Data-Science-Kapazität. Für den deutschen Mittelstand mit solidem Datenbankfundament sind 20–35 % Einsparung auf Laborkosten in 3–5 Jahren realistisch.

Diese Zahlen sind Orientierungswerte aus Industrieberichten und eigener Kalkulation. Sie ersetzen keine projektspezifische Wirtschaftlichkeitsrechnung.

Typische Einstiegsfehler

1. Mit dem Modell beginnen, bevor die Daten aufgeräumt sind. Der häufigste Fehler: Zuerst eine Softwarelizenz kaufen, dann feststellen, dass die historischen Daten in 12 verschiedenen Excel-Vorlagen mit inkonsistenten Elementbezeichnungen und fehlenden Prozessparametern vorliegen. Ein Modell, das auf chaotischen Daten trainiert wird, gibt chaotische Vorhersagen — mit vertrauenserweckendem Konfidenzwert. Das ist gefährlicher als gar kein Modell.

2. Das Modell außerhalb seines gelernten Raums einsetzen. Wenn du eine völlig neue Legierungsklasse entwickeln willst (z.B. von Gusslegierungen hin zu Hochentropielegierungen, für die du keine historischen Daten hast), kann das Modell nicht helfen. Es kann nur in bekannten Gewässern interpolieren. Wer das übersieht, bekommt selbstbewusst falsche Empfehlungen.

3. Modell einrichten und dann nicht nachpflegen. Das ist der stille Fehler, der erst nach 18–24 Monaten sichtbar wird. Wenn neue Legierungsvarianten entwickelt werden, neue Prüfmethoden eingeführt werden oder Rohstoff-Substitutionen die Kompositionsräume verschieben, degradiert das Modell ohne Retraining schleichend. Es gibt keinen Alarm — es gibt nur immer schlechtere Vorhersagen, die zunächst niemand als Modellversagen identifiziert.

Eine produzierte Nickel-Legierung bei Voestalpine illustriert das Muster: Alchemite-Modelle, die auf einer bestimmten Chromkonzentrations-Spanne trainiert waren, lieferten außerhalb dieser Spanne weniger belastbare Vorhersagen — erst nach explizitem Retraining mit erweiterten Datensätzen wurde die Modellgüte wiederhergestellt (Intellegens, 2024).

Modellpflege ist keine IT-Aufgabe. Sie braucht einen Werkstoffingenieur, der die Vorhersagequalität beurteilen kann, und einen Plan, wann welche Ereignisse (neue Messgeräte, neue Legierungsklassen, neue Kundenanforderungen) ein Retraining auslösen.

4. Erwarten, dass das Modell Expertenwissen ersetzt. Das System ist ein Vorhersageinstrument, kein Entscheidungsautomat. Es kennt keine Produktionsbedingungen, keine lieferkettenbedingten Verfügbarkeitseinschränkungen und keine impliziten Verarbeitungserfahrungen, die nicht in den Trainingsdaten stecken. Der erfahrene Gießereileiter, der weiß, dass diese Zusammensetzung zwar auf dem Papier gut klingt, aber beim Abguss immer Schwindungsrisse macht — dieses Wissen muss explizit gemacht und ins System eingepflegt werden, sonst verschwindet es mit seiner Person.

Was mit der Einführung wirklich passiert — und was nicht

Werkstoffingenieure reagieren auf Materials-Informatics-Projekte mit einer vorhersehbaren Mischung aus Skepsis und Neugier. Die Skepsis ist berechtigt: Wer 20 Jahre Erfahrung im Legierungsdesign hat, weiß, dass die Zusammenhänge komplex, nicht-linear und oft kontraintuitiv sind. Ein statistisches Modell, das in einer Blackbox arbeitet, fühlt sich nach einem Rückschritt an gegenüber dem physikalischen Verständnis, das diese Experten aufgebaut haben.

Was hilft: Das System nicht als Ersatz, sondern als Rechenwerkzeug für den Kompositionsraum positionieren. Eine gute Analogie: Thermo-Calc berechnet Phasengleichgewichte, die niemand mehr von Hand rechnet — aber der Werkstoffingenieur interpretiert das Ergebnis und entscheidet, was er damit macht. Das ML-Modell übernimmt eine ähnliche Rolle: es durchsucht den Datensatz nach Mustern, die der Mensch selbst nicht mehr überblicken kann.

Was konkret gut funktioniert:

  • Experten früh als Daten-Kuratoren einbinden: Sie wissen am besten, welche historischen Datenpunkte verlässlich sind und welche verworfen werden müssen.
  • Transparent machen, was das Modell gut kann (Interpolation innerhalb bekannter Legierungsklassen) und wo es nicht vertrauenswürdig ist (Extrapolation in unbekannte Zusammensetzungsbereiche).
  • Ersten Modelloutput nicht sofort für echte Entwicklung nutzen — erst intern validieren, bevor Laborressourcen verbraucht werden.

Was nicht passieren wird: Der Entwicklungsprozess wird nicht vollständig automatisiert. Labor, Prüfung und die Beurteilung durch erfahrene Werkstoffingenieure bleiben unverzichtbar. Materials Informatics verschiebt die Mischung — mehr datenbasierte Vorauswahl, weniger reines Trial-and-Error — aber es eliminiert das menschliche Urteil nicht.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Daten-Audit und MachbarkeitsprüfungWoche 1–4Historische Berichte sichten, Format- und Vollständigkeitsanalyse, MachbarkeitseinschätzungDatenbasis zu lückenhaft für ML — Projekt muss mit manuellem Daten­aufbau starten
Datenharmonisierung und -bereinigungWoche 5–14Daten strukturieren, fehlende Werte klären, Ausreißer dokumentieren, einheitliches Schema aufbauenUnterschiedliche Prüfnormen über Jahrzehnte — Harmonisierung aufwändiger als kalkuliert
Modellentwicklung und -trainingWoche 10–18Feature Engineering, Modellauswahl, Training, Kreuzvalidierung (Überlappung mit Datenharmonisierung nach Vorliegen erster Daten-Batches)Modell lernt Scheinkorrelationen aus zu kleinem Datensatz — erfordert Expertenevaluation
Validierung mit echten LaborversuchenWoche 15–22Modellvorschläge als tatsächliche Schmelzversuche durchführen, Vorhersagegüte messenModellvorhersagen liegen 15–20 % daneben — Retraining nötig, Zeitplan verlängert sich
Pilotbetrieb im EntwicklungsprojektWoche 22–30Modell für ein konkretes, laufendes Entwicklungsprojekt einsetzenWerkstoffteam nutzt Modellvorschläge als Ergänzung, nicht als Entscheidungsgrundlage — Akzeptanz muss aktiv aufgebaut werden

Wichtig: 20–30 Wochen sind ein realistischer Erstanlauf — nicht die Zeit bis zur vollständigen Produktionsreife des Modells. Bis das System einen echten Entwicklungszyklus von Anfang bis Ende begleitet hat und die ersten dokumentierten Einsparungen sichtbar sind, vergehen realistisch 12–24 Monate.

Häufige Einwände — und was dahintersteckt

„Wir haben nicht genug Daten.” Das ist der häufigste und meistens ehrlichste Einwand. Wenn du tatsächlich weniger als 100 strukturiert dokumentierte Versuchsberichte für die Legierungsklasse hast, die du optimieren willst: Der Einwand ist berechtigt. Dann ist der erste Schritt nicht die ML-Implementierung, sondern der konsequente Aufbau einer LIMS-Struktur (Labor-Informations-Management-System), die sicherstellt, dass ab sofort jeder Versuch vollständig und einheitlich dokumentiert wird. Erst nach 2–3 Jahren Datenbankaufbau ist eine ML-Anwendung sinnvoll.

„Unsere Legierungen sind zu komplex für ein Modell.” Das klingt plausibel — stimmt aber nicht universell. ML-Modelle sind in der Lage, hochdimensionale Zusammenhänge zu lernen, die Menschen nicht mehr überblicken können. Das ist tatsächlich ihre Stärke. Die Einschränkung ist nicht die Komplexität, sondern die verfügbare Datenmenge: Je mehr Legierungselemente und Prozessvariablen relevant sind, desto mehr Datenpunkte braucht das Modell, um die Zusammenhänge zu lernen.

„Das kostet zu viel.” Die relevante Gegenfrage: Was kostet ein Entwicklungsprojekt, das sechs Monate länger dauert als nötig? Oder ein Rohstoff-Substitutionsprojekt, das ein Jahr braucht, weil es kein systematisches Kompositionswissen gibt? Wenn ein Entwicklungsprojekt 200.000 € Laborkosten verursacht und Materials Informatics diese auf 130.000 € reduziert, amortisiert sich das Einrichtungsinvestment nach 1–2 Projekten. Diese Rechnung funktioniert aber nur, wenn die Datenbasis stimmt — nicht als Wunschziel.

Woran du merkst, dass das zu dir passt

  • Du entwickelst regelmäßig neue Legierungen oder optimierst bestehende — mindestens zwei bis drei neue Entwicklungsprojekte pro Jahr mit eigenem Laboraufwand
  • Du hast eine Entwicklungsabteilung mit Werkstoffingenieuren, die mit thermodynamischen Berechnungen und systematischer Versuchsplanung vertraut sind
  • Deine Versuchsergebnisse werden bereits strukturiert dokumentiert — mindestens mit konsistenten Messprotokollen, auch wenn die Digitalisierung noch nicht vollständig ist
  • Deine Entwicklungszyklen dauern 6–18 Monate und der Druck, schneller und gezielter zu entwickeln, ist spürbar
  • Rohstoffkosten spielen eine relevante Rolle — Preisschwankungen bei Legierungselementen haben direkte Auswirkungen auf deine Kalkulation

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Du hast weniger als 150 strukturiert dokumentierte Versuchsdatensätze für die Legierungsklasse, die du optimieren willst. Darunter ist kein belastbares ML-Modell zu bauen. Der erste Schritt ist dann Datenbankaufbau, nicht Modellentwicklung — und das ist eine eigenständige Investition, die 2–3 Jahre dauert, bevor sie Früchte trägt.

  2. Du hast keinen Werkstoffingenieur oder Data Scientist im Haus, der das Modell interpretieren und warten kann. Ein ML-Modell, das einmalig eingerichtet und dann nicht gepflegt wird, degradiert still. Ohne jemanden, der Vorhersagen kritisch beurteilt und weiß, wann Retraining nötig ist, wird das System nach 12–24 Monaten zu einer Fehlerquelle. Externe Betreuung ist möglich, muss aber einkalkuliert sein.

  3. Du willst primär eine Legierungsklasse entwickeln, für die du keine eigenen historischen Daten hast. In diesem Fall hilft kein ML-Modell auf deinen eigenen Daten. Es gibt öffentliche Materialdatenbanken (z. B. vom NIST oder aus Literaturdatenbanken), aber deren Qualität und Relevanz für deine spezifischen Prozessbedingungen ist unsicher. Für diese Situation wäre ein thermodynamischer Berechnungsansatz mit Thermo-Calc der bessere Einstieg.

Das kannst du heute noch tun

Der sinnvollste erste Schritt kostet nichts und dauert zwei Wochen: Führe ein Datenaudit deiner historischen Versuchsberichte durch.

Zähle, wie viele Legierungsversuche du in den letzten 10 Jahren dokumentiert hast. Prüfe für 20 zufällig ausgewählte Berichte: Sind chemische Zusammensetzung (alle relevanten Elemente), Prozessparameter und Messergebnisse vollständig und einheitlich erfasst? Welche Felder fehlen systematisch?

Das Ergebnis dieses Audits sagt dir mehr über die Machbarkeit eines ML-Projekts als jede Softwaredemonstration.

Wenn du eine erste Explorations-Analyse deiner Daten mit KI-Unterstützung durchführen willst, kannst du mit Julius AI starten — lade eine strukturierte CSV-Datei mit Legierungsversuchen hoch und frage nach Korrelationen zwischen Zusammensetzungsvariablen und Zieleigenschaften. Das gibt dir einen ersten Eindruck, ob statistisch auswertbare Muster in deinen Daten vorhanden sind.

Für die strukturierte Analyse mit einem Prompt, der für historische Versuchsdaten ausgelegt ist:

Prompt für erste Explorations-Analyse historischer Legierungsdaten
Du bist ein Werkstoffdaten-Analyst. Ich zeige dir strukturierte Versuchsdaten aus unserem Legierungslabor. Datenbeschreibung: [KURZE BESCHREIBUNG DES LEGIERUNGSSYSTEMS, z.B. "AlSi-Gusslegierungen, 200 Versuche, 2010–2024"] Ziel: [WELCHE EIGENSCHAFT OPTIMIERT WERDEN SOLL, z.B. "Zugfestigkeit > 360 MPa bei Bruchdehnung > 10 %"] [HIER DATEN EINFÜGEN — idealerweise als CSV: Zusammensetzung je Element in Massenprozent, Prozessparameter, Messwerte] Analysiere bitte: 1. Welche Zusammensetzungsvariablen korrelieren am stärksten mit der Zieleigenschaft? 2. In welchem Bereich der Zusammensetzung wurden die besten Ergebnisse erzielt? 3. Gibt es sichtbare Ausreißer oder Datenpunkte, die auf Messfehler hindeuten könnten? 4. Welche Bereiche des Kompositionsraums sind in den Daten unterrepräsentiert? 5. Schätze, ob die Datenmenge ausreichend für ein ML-Modell ist oder ob zuerst weitere Versuche in bestimmten Bereichen notwendig wären.
Funktioniert mit Claude, ChatGPT, Julius AI
Beispiel-Ausgabe

Mitarbeiter:in

AlSi-Legierungen: Si 6,5–12 %, Mg 0,2–0,6 %, Cu 0–2,1 %. Ziel: Rm > 280 MPa nach T6-Wärmebehandlung. 140 Datenpunkte, 2015–2024.

KI-Assistent

Analyse eurer Legierungsdaten: **Stärkste Korrelationen:** Si-Gehalt und Cu-Anteil zeigen die deutlichste positive Korrelation mit Rm. Mg-Gehalt im Bereich 0,3–0,45 % korreliert schwach positiv — außerhalb dieses Fensters nehmen die Werte ab. **Beste Ergebnisse:** Cluster um Si 9–10,5 %, Cu 1,5–2 %, Mg 0,35–0,42 %. In diesem Bereich liegen 8 von 12 Versuchen über 280 MPa Rm. **Mögliche Ausreißer:** 3 Datenpunkte mit Cu > 2 % zeigen unerwartet niedrige Rm-Werte (< 220 MPa). Prüft, ob dort abweichende Wärmebehandlungsparameter vorlagen. **Unterrepräsentierte Bereiche:** Wenig Daten im Bereich Cu 0,8–1,4 % — dieser Zwischenbereich ist nicht systematisch erschlossen. Auch Si > 11 % fehlt fast vollständig. **Datenmengen-Einschätzung:** 140 Punkte für 4 Hauptvariablen sind grenzwertig, aber möglich. Für ein robustes Modell wären 60–80 weitere gezielte Versuche in den unterrepräsentierten Bereichen hilfreich — besonders Cu 0,8–1,4 %. Quelle: Analysiert auf Basis der bereitgestellten Datentabelle.

Quellen & Methodik

  • Voestalpine / Intellegens Alchemite™ (2024): Fallstudie zum Einsatz von ML-Software für Legierungsdesign im Additive Manufacturing Center von Voestalpine; berichtet knapp 40 % Kostenreduktion bei Prozessoptimierung über drei Jahre (2021–2024). intellegens.com/advanced-materials-and-processes-at-voestalpine/
  • Fraunhofer IWM, StahlDigital-Projekt: Ontologiebasierter Interoperabilitäts-Workflow für Stahl; Industriepartner: ThyssenKrupp Steel, Kirchhoff Automotive, Daimler, DYNAmore. Belegt, dass nur ca. 10 % der Produktionsdaten in der Stahlindustrie analytisch genutzt werden. iwm.fraunhofer.de/de/ueber-uns/loesungen-fuer-produktlebenzyklus/digitalisierung-in-der-werkstofftechnik/stahldigital.html
  • “Alloys Innovation through Machine Learning: A Statistical Literature Review” (2024): Taylor & Francis / Science and Technology of Advanced Materials; zeigt, dass ML-unterstützte Legierungsentwicklung 50–70 % weniger Versuche benötigt als klassisches Trial-and-Error. doi.org/10.1080/27660400.2024.2326305
  • Citrine Informatics: Introduction to Materials Informatics; Überblick über bayesische Optimierung und Sequential Experimental Design in der Werkstoffforschung. citrine.io/resources/introduction-to-materials-informatics/
  • Implementierungskosten und Zeitangaben: Eigene Schätzung auf Basis öffentlicher Industrieberichte, Thermo-Calc-Lizenzstruktur (thermocalc.com/licensing-options/) und Erfahrungswerten aus vergleichbaren Datenharmonisierungsprojekten (Stand Mai 2026).
  • DSGVO / Art. 28 AVV: Datenschutz-Grundverordnung in der aktuell gültigen Fassung.

Du willst wissen, ob deine Datenbasis für einen ersten ML-Prototyp ausreicht — und was er realistisch leisten würde? Meld dich für ein kurzes Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar