KI-Laborassistent für die Syntheseplanung
LLM-Assistent unterstützt Chemiker bei Retrosynthese-Planung, Reaktionsbedingungen und Literaturrecherche — Syntheserouten in Stunden statt Wochen.
Es ist Montag, 9:15 Uhr. Dr. Janina sitzt vor drei Bildschirmen: Reaxys ist offen, daneben eine Excel-Liste mit den verfügbaren Reagenzien im Labor, daneben ein PDF mit der Kundenanfrage — sie soll eine neue Verbindung synthetisieren, ein Mittelstück für ein potenzielles Medikament. Noch nie gemacht. Ähnlich mal in einer Dissertation gesehen, aber die Route war damals unrentabel.
Sie fängt an zu googeln. Dann Reaxys. Dann SciFinder. Drei mögliche Routen: Eine braucht Katalysatoren, die nächste Woche ankommen. Eine nutzt einen Ausgangsstoff, der im Lager steht — aber die Ausbeute lag in der Literatur unter 60 Prozent. Die dritte Route hat noch nie jemand probiert.
Um 17:45 Uhr hat sie zwei Optionen auf dem Tisch. Eine ganze Woche Recherche hätte mehr gebracht — und zwei Kolleginnen aufgehalten, denen sie dieselbe Frage gestellt hat. Donnerstag kommt die eine Antwort, Freitag die andere.
Jeden Tag das gleiche Bild. Der Recherchestau wird zum Planungsengpass.
Das echte Ausmaß des Problems
Synthetische Chemie lebt vom Wissen — welche Reaktion unter welchen Bedingungen funktioniert, welche Reagenzien verfügbar sind, welche Arbeitssicherheit greift, welche Route kostengünstig ist. Dieses Wissen liegt verstreut in einer Million Publikationen, Patenten und Firmendatenbanken. Ein einzelner Mensch kann das nicht vollständig im Kopf haben.
Deshalb beginnt jede Syntheseplanung mit einer Recherche. Reaxys (über 10 Millionen dokumentierte Reaktionen) oder SciFinder (chemische Publikationen seit 1907) werden manuell durchsucht. Laut einer Analyse von ChemAxon (2024) investieren Chemiefirmen im Schnitt fünf bis sieben Tage in die erste Literaturrecherche pro neuer Zielverbindung. Das sind 40 bis 56 Stunden Arbeit — und oft nicht von einer Person, sondern von mehreren, weil die Ergebnisse unklar sind und jemand sie einordnen muss.
Für ein Team mit fünf Chemikern und 20 neuen Syntheserouten pro Jahr ergibt das rund 1.000 bis 1.500 Arbeitsstunden pro Jahr in Recherche statt im Labor. Das verzögert den Markteintritt neuer Produkte um Wochen.
Die versteckten Kosten: Zwei Chemiker recherchieren parallel dieselbe Route, weil die erste Recherche nicht dokumentiert oder nicht auffindbar war. McKinsey (2023) schätzt, dass 20 bis 30 Prozent aller Laborrecherche reine Doppelarbeit ist.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI-Assistent | Mit KI-gestütztem Laborassistent |
|---|---|---|
| Zeit für Syntheserouten-Recherche | 5–7 Tage (40–56 Std.) | 4–8 Stunden |
| Anzahl evaluierter Routen | 2–3 Optionen | 5–12 Optionen |
| Duplizierte Recherche pro Quartal | 20–30 % | unter 5 % |
| Benötigte Datenbank-Zugriffe | 3–5 verschiedene Tools | 1 integrierte Plattform |
| Chemiker-Zeit in Literaturverwaltung | 8–12 Std./Woche | 1–2 Std./Woche |
Quellen: McKinsey Global Institute (2023); ChemAxon Benchmark-Analyse (2024). Erfahrungswerte aus Retrosynthese-Projekten in Universitätslaboren und Pharmaforschung.
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5)
Ein gut kalibrierter Assistent spart pro Zielverbindung drei bis fünf Tage — direkt messbar. Der Effekt ist stärker als bei der Wissensdatenbank, weil es nicht um reines Informationsfinden geht, sondern um strukturierte Routenplanung, bei der jede verlorene Stunde direkt verzögert. Nicht maximal, weil die Chemiker jede Route weiterhin validieren und im Zweifel im Labor testen müssen — das System spart Recherche, keine Versuchszeit.
Kosteneinsparung — niedrig (2/5)
Die Lizenzkosten für Reaxys (rund 8.000 bis 15.000 Euro pro Jahr) oder SciFinder (ähnlich) sind Fixkosten, die ohnehin anfallen. Dazu kommen die KI-Tool-Kosten (IBM RXN über die Cloud meist 100 bis 200 Euro monatlich, Redwood AI im Abo). Ein direkter Kostenvorteil entsteht nur, wenn eingesparte Recherchezeit als Einsparung gebucht wird — und das passiert selten, weil der frei gewordene Platz meist sofort mit neuen Routen gefüllt wird.
Schnelle Umsetzung — mittel (3/5)
Bis zum produktiven Einsatz: vier bis acht Wochen. Das umfasst die Anbindung der Datenbanken (Reaxys-API-Integration typischerweise zwei bis drei Wochen), die Konfiguration der chemiespezifischen Modelle (ein bis zwei Wochen) und eine Pilotphase mit zwei bis drei Chemikern, um die Parameter zu prüfen. Nicht so schnell wie Meeting-Protokolle (Tage), aber solide handhabbar.
ROI-Sicherheit — mittel (3/5)
Die Zeitersparnis ist klar messbar — Stunden pro Route fallen weg. Ob die vorgeschlagenen Routen am Ende auch synthetisierbar und wirtschaftlich sind, bleibt unsicher. Wenn das Modell eine zwölfstufige Route vorschlägt, die im Labor scheitert, war die Recherchestunde umsonst. Der ROI hängt deshalb an der Kompetenz der Chemiker, die die Vorschläge validieren.
Skalierbarkeit — hoch (4/5)
Ein Retrosynthese-System hat hohe Anfangskosten, skaliert dann aber gut: Zehn oder fünfzig Chemiker nutzen dieselbe Plattform, ohne dass die Kosten linear mitwachsen. Die einzige Grenze ist die Abfragefrequenz der Datenbank — greifen fünfzig Leute gleichzeitig auf Reaxys zu, braucht es ein größeres Servicepaket. Kein grundsätzliches Skalierungsproblem.
Richtwerte — stark abhängig von Datenbankzugriff, verfügbarem Budget für KI-Tools und Chemiker-Erfahrung.
Was ein Syntheseplanungs-Assistent konkret macht
Der technische Kern ist Retrosynthese-Vorhersage — ein spezialisiertes Modell, das gelernt hat, von einer Zielverbindung rückwärts zu denken: Aus welchen zwei Vorstufen könnte diese Verbindung entstehen? Und aus welchen Vorstufen diese? Iterativ, bis zu käuflichen Reagenzien.
Das ist nicht trivial. Eine Retrosynthese-Vorhersage muss berücksichtigen:
- Chemische Reaktionsmechanismen: Welche Transformationen sind theoretisch möglich?
- Praktische Machbarkeit: Unter welchen Bedingungen laufen sie wirklich ab?
- Verfügbarkeit: Sind die vorgeschlagenen Vorprodukte zu kaufen — oder müssen sie erst selbst synthetisiert werden?
- Sicherheit: Sind die Reaktionsbedingungen laborgerecht?
IBM RXN, das bekannteste frei zugängliche Modell, wurde auf einer Milliarde Reaktionen aus der Literatur trainiert. Redwood AI hat sein Modell mit einer Milliarde Molekülen trainiert und nennt eine Genauigkeit von rund 95 Prozent bei der Vorhersage von Syntheserouten. Das heißt nicht, dass 95 Prozent aller Routen im Labor funktionieren. Es heißt: 95 Prozent der Vorhersagen sind chemisch plausibel und literaturgestützt.
Was das praktisch heißt
Du gibst ein Ziel ein — etwa C₁₇H₁₉NO₃. Das System antwortet mit drei bis fünf alternativen Routen, jede mit benötigten Reagenzien, Bedingungen, Sicherheitshinweisen und Literaturquellen. Statt zwei oder drei Tage selbst zu recherchieren, siehst du in zehn Minuten die besten verfügbaren Optionen.
Der entscheidende Vorteil: Die Optionen sind belegt. Jede Route zeigt, aus welchem Paper oder Patent sie stammt. Das unterscheidet den Assistenten von reiner Spekulation.
Konkrete Werkzeuge — was wann passt
IBM RXN for Chemistry — Kostenlos, webbasiert, keine Installation. IBM hat sein Retrosynthese-Modell auf Millionen Reaktionen aus Science of Synthesis und Synfacts trainiert. Solides Einsteigermodell, direkt online testbar — für akademische Labore oder erste Pilotprojekte ideal. Grenze: Keine Anbindung an firmeneigene Daten; die Vorhersagen stützen sich nur auf publizierte Literatur. Rund 15 Minuten zum Ausprobieren.
Redwood AI — Kommerzielle Plattform mit Unternehmensfunktionen. Trainiert auf einer Milliarde Molekülen und spezifischen pharmazeutischen Synthesen. Bietet API-Integration, Anbindung an die eigene Reagenzien-Datenbank und Batch-Verarbeitung. Passt für Firmen ab zehn Chemikern, für die Syntheseplanung ein strategischer Prozess ist. Kosten: typisch 5.000 bis 20.000 Euro pro Jahr nach Nutzungsvolumen. Einführung mit festem Ansprechteam.
Reaxys Predictive Retrosynthesis — Direkt in Reaxys integrierbar, wenn ihr bereits Reaxys-Kunde seid. Vorteil: keine zusätzliche Lizenz, im Reaxys-Abo enthalten. Nachteil: Weniger stark als IBM RXN bei größeren, komplexen Molekülen; primär auf Literaturverknüpfung optimiert, nicht auf neue Routen.
Eigenes ML-Modell (für Spezialchemikalien) — Wenn ihr spezielle Stoffklassen habt (Fluorchemikalien, hochexplosive Ausgangsstoffe), lohnt sich ein firmeninternes Modell — auf euren Daten, euren bewährten Routen, euren Sicherheitsrichtlinien. Kosten: 30.000 bis 80.000 Euro für Training und Betrieb. Lohnt sich ab rund 100 neuen Zielverbindungen pro Jahr.
Zusammengefasst:
- Unter fünf Chemikern, akademisch oder in der Pilotphase → IBM RXN kostenlos ausprobieren
- Fünf bis fünfzehn Chemiker, mittelständische Forschung → Redwood AI oder Reaxys Predictive
- Ab fünfzehn Chemikern mit Spezialklassen → eigenes Modell in Kombination mit IBM RXN oder Redwood
Datenschutz und Datenhaltung
Syntheseplanung arbeitet mit potenziell sensiblen Daten: Zielverbindungen können Teil eines IP-Portfolios sein, Syntheserouten sind oft geschützt. Das heißt: Eingaben in einen Cloud-Assistenten können protokolliert, gespeichert oder für das Nachtrainieren des Modells verwendet werden.
IBM RXN protokolliert Abfragen — laut IBM-Dokumentation fließen sie in Modellverbesserungen ein, sofern kein Vertrag für vertrauliche Forschung vorliegt. Für akademische oder nicht-schützbare Forschung kein Problem. Sind eure Synthesen patentierbar, solltest du das vor der Nutzung mit der IBM-Rechtsabteilung klären.
Redwood AI bietet lokales Deployment und EU-Datenhosting — passt für sensible IP. Die Kosten liegen höher (Enterprise-Plan), aber die Daten bleiben unter eurer Kontrolle.
Ein selbst trainiertes Modell gibt euch die volle Kontrolle über die Datenhaltung — und die volle Verantwortung für Validierung und Wartung. Aus Sicht der DSGVO unkritisch, solange keine personenbezogenen Daten in die Trainingsdaten fließen (bei chemischen Synthesen meist nicht der Fall).
Was es kostet — realistisch gerechnet
Einmalige Einrichtungskosten:
- Datenbankanbindung (Reaxys-API, SciFinder-Integration): 5.000 bis 15.000 Euro extern oder drei bis vier Wochen IT-Zeit intern
- Tool-Auswahl und Konfiguration: 2.000 bis 5.000 Euro (Beratung) plus ein bis zwei Wochen Chemiker-Arbeit
- Chemiker-Schulung und erste Validierung: ein bis zwei Wochen
- Initial: 20.000 bis 40.000 Euro
Laufende Kosten (monatlich):
- Reaxys oder SciFinder: 800 bis 1.500 Euro (fällt meist ohnehin an)
- IBM RXN: kostenlos oder 100 bis 200 Euro Cloud-Kosten je nach Abfragefrequenz
- Redwood AI: 500 bis 2.000 Euro pro Monat je nach Umfang
- Gesamt monatlich: 1.300 bis 3.700 Euro
Wie du den Nutzen messbar machst:
Dokumentiere für jede neue Zielverbindung zwei Werte: Recherchezeit ohne Tool und Recherchezeit mit Tool. Ziel: zwei bis vier Tage weniger Recherche pro Synthese. Bei fünf neuen Synthesen im Monat sind das zehn bis zwanzig Tage.
Die direkte ROI-Rechnung: fünf Tage zu 50 Euro pro Stunde = 2.000 Euro Wert pro Route. Bei vier Routen monatlich sind das 8.000 Euro eingesparte Arbeitszeit bei rund 3.000 Euro Kosten — klar positiv. In der Praxis ist der Effekt aber indirekt — die eingesparte Zeit wird in mehr Routen investiert, nicht in Personalabbau.
Drei typische Einstiegsfehler
1. Das System ist eine Blackbox — niemand vertraut den Vorschlägen.
Chemiker sind Skeptiker mit gutem Grund. Schlägt ein System eine Route vor, deren Quelle unklar bleibt, wird die Route ignoriert. Was hilft: Nur Systeme einsetzen, die Quellenangaben liefern — und das Team schulen, diese Quellen zu bewerten. Ein Vorschlag aus einem Nature-Paper ist glaubwürdiger als einer aus einem Patentanspruch mit dünner Beleglage. Transparenz ist keine Kür, sondern Voraussetzung.
2. Halluzinierte Routen und fehlende Evaluationsdokumentation.
Auch trainierte Modelle erfinden Routen, die plausibel aussehen, im Labor aber nicht laufen oder sogar sicherheitskritisch sind. Gleichzeitig bewerten Chemiker täglich Vorschläge, verwerfen drei, planen die beste — und dokumentieren nichts. Ein Jahr später startet dieselbe Synthese von vorn. Was hilft: Jede Route wird von einer qualifizierten Person validiert, bevor ein Gramm Chemikalien bewegt wird. Und: Ein ELN-Eintrag oder Laborbuch-Vermerk hält fest, welche Routen das System geliefert hat, welche verworfen wurden und warum.
3. Die Datenbank wird nie gepflegt — alte Informationen bleiben im System.
Reaktionsbedingungen ändern sich, Sicherheitsrichtlinien werden strenger, neue Reagenzien kommen auf den Markt. Ein Retrosynthese-System, das nur alte publizierte Routen kennt, veraltet, wenn niemand neue Daten nachpflegt oder überholte Routen markiert. Was hilft: Klare Eigenverantwortung — wer nutzt das System, wer prüft die Qualität, wer aktualisiert die Datenquellen regelmäßig?
Was mit der Einführung wirklich passiert — und was nicht
Was passiert: Die Recherchezeit sinkt. Messbar, sofort sichtbar.
Was nicht passiert: Das System macht aus schwachen Chemikern starke. Wer Temperaturen nicht im Griff hat oder Sicherheit nicht bewerten kann, wird durch einen Assistenten nicht besser. Der Assistent schlägt Routen vor — validieren und ausführen muss sie weiterhin der Mensch.
Typische Widerstände:
Die Puristen. Manche Chemiker planen aus Prinzip selbst — aus Respekt vor dem Handwerk oder weil sie Assistenten nicht trauen. Diese Menschen musst du nicht überzeugen, sondern ihnen die Wahl lassen. Der Assistent ist optional, nicht verpflichtend.
Die skeptische Regulatorik. In regulierten Betrieben (Pharma, Feinchemie) fragt irgendwann jemand aus der Qualitätssicherung: Wie validiert ihr, dass dieses System sichere Routen vorschlägt? Die Antwort muss stehen: Jede Route wird von einem qualifizierten Chemiker geprüft. Das System ist Werkzeug, nicht Autorität. Diese Auskunft gehört vor die Einführung, nicht hinterher.
Was konkret hilft:
- Pilot mit zwei bis drei offenen, nicht geschützten Synthesen starten, um Erfahrung zu sammeln
- Eine Person als Retrosynthese-Verantwortliche benennen, die die Qualität validiert
- Dokumentationsvorlage erstellen: System genutzt? Welche Routen geprüft? Welche gewählt, warum?
- Regelmäßiger Austausch mit der IT zu Datenbank-Updates und Modell-Performance
Woran du merkst, dass das zu dir passt
- Ihr plant regelmäßig neue Synthesen — mindestens 10 bis 20 pro Jahr. Unter dieser Menge lohnt die Infrastruktur nicht.
- Syntheseplanung ist ein Zeitengpass — mehrere Tage Recherche pro neuer Zielverbindung sind normal.
- Eure Chemiker arbeiten bereits mit Datenbanken (Reaxys, SciFinder, PubChem). Das System ergänzt, es ersetzt nicht.
- Ihr wollt Routenoptionen schneller bewerten, nicht dass das System die Entscheidung fällt.
- Ihr könnt eine Person benennen, die die Qualitätskontrolle dauerhaft übernimmt.
Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:
-
Weniger als fünf neue Synthesen pro Jahr oder akademisches Labor ohne Zeitdruck. Der Einrichtungsaufwand rechtfertigt sich nicht. Probiert erst IBM RXN kostenlos, bevor ihr in Infrastruktur investiert.
-
Keine etablierte Datenbank-Infrastruktur — ihr nutzt weder Reaxys noch SciFinder. Dann ist die erste Investition das Datenbank-Abo, der KI-Assistent kommt später.
-
Euer Schwerpunkt liegt auf Syntheseoptimierung unter Betriebsbedingungen, nicht auf Routenplanung (etwa organische Synthesen unter Hochtemperatur oder Hochdruck, spezielle Katalysatoren). Dann bringt ein generisches Modell weniger — ihr braucht ein eigenes Training auf euren Daten.
Das kannst du heute noch tun
Öffne IBM RXN for Chemistry — kostenlos, keine Anmeldung nötig. Nimm eine eurer letzten Synthesen, die mehr als zwei Tage Recherche gekostet hat. Gib die Zielverbindung ein (SMILES-Notation oder Name). Schau dir drei Vorschläge an — wie viele davon hättest du selbst so gefunden?
Zehn Minuten Aufwand. Danach weißt du, ob das Konzept für euer Labor taugt.
Für die mittelfristige Planung: Sprecht mit dem Anbieter (IBM, Redwood AI, Reaxys) über einen kostenlosen Proof of Concept — die meisten bieten das an. Ziel: drei bis fünf echte Synthesen durchspielen und bewerten, ob die Ergebnisse tragen.
Der folgende Prompt hilft, erste Ergebnisse strukturiert zu bewerten:
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Syntheseplanung-Zeiteinsatz, 5–7 Tage: ChemAxon Benchmark-Analyse (2024); McKinsey Global Institute, „Accelerating innovation in the chemical industry” (2023)
- Duplizierte Recherche 20–30%: McKinsey Analyse (2023); InnovatorsLab Harvard-Studie (2022)
- IBM RXN Modellgenauigkeit (3x Verbesserung): IBM Research Blog, “Thieme trains IBM RXN for Chemistry with high-quality data” (2024)
- Redwood AI Synthese-Modellgenauigkeit (~95%): Redwood AI Firmendokumentation (2026)
- Retrosynthese-Prediction Surveys: Zhong et al., “Recent advances in deep learning for retrosynthesis”, WIREs Computational Molecular Science (2024)
- CFR Part 11, DSGVO: FDA 21 CFR Part 11, Art. 28 DSGVO
- Tool-Verfügbarkeit und Pricing: IBM RXN, Redwood AI, Reaxys, SciFinder Webseiten (Stand April 2026)
Du willst herausfinden, welche deiner Synthesen mit KI-Assistenz am schnellsten vorankommen? Meld dich — wir klären das in einem kurzen Gespräch.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
Batch-Protokolle automatisch auswerten und freigeben
KI prüft Batch-Protokolle auf Vollständigkeit, Grenzwertüberschreitungen und Abweichungen — und erstellt einen strukturierten Freigabebericht statt manueller Durchsicht.
Mehr erfahrenSicherheitsdatenblätter automatisch erstellen und aktualisieren
KI erstellt REACH/GHS-konforme Sicherheitsdatenblätter aus Rezeptur- und Substanzdaten — und hält sie automatisch bei Gesetzesänderungen aktuell.
Mehr erfahrenNeue Moleküle und Formulierungen mit generativer KI entwickeln
Generative KI-Modelle schlagen auf Basis von Zielstoffprofilen neue Molekülstrukturen und Formulierungsansätze vor — und beschleunigen das Screening von Kandidaten im frühen F&E-Stadium.
Mehr erfahren