Citrine Informatics
Citrine Informatics, Inc.
KI-Plattform für Werkstoff- und Chemikalienentwicklung. Drei Module: Citrine DataManager (strukturierte Erfassung historischer Versuchsdaten), Citrine VirtualLab (bayesische Optimierung und generative KI für neue Formulierungen) und Citrine Catalyst (LLM-basierter Recherche-Assistent auf Fachliteratur). AWS-gehostet, ISO 27001-zertifiziert, Kunden u. a. Evonik, LyondellBasell, Arkema, Saint-Gobain und Eastman.
Kosten: Enterprise-Pricing, nur auf Anfrage. Keine veröffentlichten Listenpreise. Branchenüblich liegt der Einstieg bei mehreren hunderttausend US-Dollar pro Jahr, primär auf Konzerne und Forschungsverbünde zugeschnitten, nicht auf den klassischen Mittelstand.
Kategorien
Stärken
- Domänenspezifisch für Materialwissenschaften, versteht Kompositions-, Prozess- und Eigenschaftsbeziehungen
- Bayesische Optimierung und Sequential Design of Experiments, reduziert Laborversuche systematisch
- Drei abgestimmte Module: DataManager (Daten), VirtualLab (Optimierung), Catalyst (Literatur-LLM)
- Belastbare Referenzen aus der EU-Chemieindustrie (Evonik, Arkema, Saint-Gobain)
- ISO-27001-zertifiziert, AWS-gehostet, Enterprise-taugliches Sicherheitsniveau
- Langjährige Erfahrung mit Konzern-R&D-Datensätzen, keine Materials-Informatics-Neugründung
Einschränkungen
- Nur auf Anfrage erhältlich, keine Preistransparenz, kein Self-Service-Einstieg
- Standard-Hosting in den USA, eine dedizierte EU-Region ist nicht öffentlich dokumentiert
- Hoher Datenbedarf für sinnvolle Modelle (typisch mehrere hundert konsistente Versuche)
- Starke Abhängigkeit von Citrine-Beratern für Setup und Modellierung, keine Selbstbedienungsplattform
- Eingrenzter Markt: außerhalb von Werkstoff- und Chemieformulierung kaum einsetzbar
- Kein deutschsprachiges Interface, kein deutschsprachiger Support
Passt gut zu
Wann ja, wann nein
Wann ja
- Du arbeitest in einem Konzern oder Forschungsverbund mit strukturierten Versuchsdaten in vier- bis fünfstelliger Größenordnung
- Du willst Laborkapazität sparen, indem du gezielt die aussichtsreichsten Versuche zuerst fährst
- Du brauchst ein Tool, das Komposition, Prozess und Zieleigenschaft als zusammenhängende Größen modelliert
- Dein Budget für die digitale R&D-Plattform liegt im sechsstelligen Bereich pro Jahr
Wann nein
- Du arbeitest in einem KMU ohne sechsstelliges R&D-Software-Budget
- Deine Versuchsdaten liegen unstrukturiert oder lückenhaft vor (weniger als ~200 vergleichbare Datensätze)
- Deine Anwendung ist außerhalb von Werkstoff- und Chemikalienentwicklung (z. B. Maschinenbau, Software)
- Du brauchst eine DSGVO-saubere EU-Region mit dokumentiertem AVV ohne Sondervereinbarung
Kurzfazit
Citrine Informatics ist eine der wenigen ernstzunehmenden KI-Plattformen, die spezifisch für Materialwissenschaft und Chemikalienentwicklung gebaut wurde, keine generische ML-Suite mit aufgesetzten Chemie-Features. Stärken liegen in der Kombination aus Datenmanagement, bayesischer Optimierung für Sequential Design of Experiments und dem neuen LLM-basierten Recherche-Assistenten Catalyst. Die Plattform zielt klar auf Konzern-R&D, Eastman, Evonik, LyondellBasell, Arkema und Saint-Gobain stehen als Referenzen, und ist für den klassischen deutschen Mittelstand preislich und beratungsintensiv kaum erreichbar. Wer die Daten, das Budget und den Bedarf hat, bekommt ein ausgereiftes Werkzeug. Wer nicht, sollte bei generischeren Werkzeugen oder akademischen Open-Source-Lösungen bleiben.
Für wen ist Citrine Informatics?
Konzern-R&D in Spezialchemie und Werkstoffen: Der eigentliche Zielmarkt. Wer als R&D-Leitung in einem mittelgroßen bis großen Chemie- oder Werkstoffkonzern mehrere hundert oder tausend strukturierte Versuchsdatensätze pro Produktlinie hat, bekommt mit Citrine ein Werkzeug, das die nächste Formulierungsrunde gezielt eingrenzt, statt eine vollständige DoE-Matrix abzuarbeiten.
Formulierungs- und Rezepturentwicklung: Beschichtungen, Klebstoffe, Polymere, Personal-Care-Produkte, Batterieelektrolyte. Überall, wo viele Inhaltsstoffe und Prozessparameter in komplexer Wechselwirkung stehen, ist Citrine in seinem Element. Die Plattform modelliert Komposition, Prozess und Zieleigenschaft als verknüpften Raum.
Legierungs- und Werkstoffdesign: Hochleistungsstähle, Aluminiumlegierungen, Hartmetalle. Wer neue Werkstoffe für Luftfahrt, Automotive oder Energietechnik entwickelt, kann mit Citrine den Suchraum systematisch eingrenzen, relevante Verbindung von Versuchsdaten, Simulationsergebnissen (CALPHAD, DFT) und Literaturwerten.
Industrielle Forschungsverbünde: Konsortien oder Joint-Ventures mit gemeinsamer Datenbasis profitieren vom DataManager-Modul: einheitliche Erfassung, klare Berechtigungssteuerung, gemeinsames Modelltraining ohne Datenleckage zwischen Partnern.
Weniger geeignet für: KMU ohne sechsstelliges R&D-Software-Budget, R&D-Teams mit lückenhaften oder unstrukturierten Versuchsdaten, Anwendungen außerhalb von Werkstoff- und Chemiedesign (Maschinenbau-CAD, Bauwesen, Softwareentwicklung), und Organisationen, die eine vollständige DSGVO-saubere EU-Region mit Standard-AVV ohne individuelle Sondervereinbarung verlangen.
Preise im Detail
| Modell | Preis | Was du bekommst |
|---|---|---|
| Citrine Platform (DataManager + VirtualLab + Catalyst) | Auf Anfrage | Vollständige Plattform inklusive Implementierung, Schulung, Professional Services und Modellbetreuung |
| Pilotphase | Auf Anfrage (typisch 3–6 Monate) | Begrenzter Use-Case, Datenaufnahme, erste Modelle, definierte Erfolgsmetriken |
| Professional Services | Auf Anfrage (Tagessätze) | Beratung, Daten-Onboarding, individuelle Modellentwicklung, Workshop-Pakete |
Einordnung: Citrine veröffentlicht keine Listenpreise. Branchenüblich liegt der Einstieg bei mittleren bis hohen sechsstelligen US-Dollar-Beträgen pro Jahr, abhängig von Modulumfang, Datenvolumen und Beratungsanteil. Wer eine Pilotphase verhandelt, kommt mit deutlich weniger Anfangsinvest hinein, aber das Modell ist auf langfristige Konzernkunden ausgelegt, keine günstige Einstiegsstufe für KMU. Für den deutschen Mittelstand ist Citrine in den meisten Fällen schlicht zu groß dimensioniert. Wer prüfen will, ob das Investment trägt, sollte vorab eine Kosten-Nutzen-Rechnung über erwartete eingesparte Laborversuche aufstellen, bei realistischen Annahmen amortisiert sich Citrine im Konzern-R&D häufig binnen ein bis zwei Jahren, im KMU-Setting dagegen praktisch nie.
Stärken im Detail
Domänenspezifisches Modellverständnis. Im Unterschied zu generischen ML-Plattformen versteht Citrine Materials-Konzepte nativ: Stöchiometrie, Phasendiagramme, Prozessparameter (Temperatur, Druck, Zeit), Materialdescriptoren. Du musst nicht erst tausend Feature-Spalten manuell konstruieren, die Plattform bringt Vorwissen über chemische und physikalische Zusammenhänge mit. Das ist der entscheidende Unterschied zu „wir bauen das selbst in Python mit scikit-learn”.
Bayesische Optimierung und Sequential Design of Experiments. Statt eine vollständige DoE-Matrix von 64, 128 oder 256 Versuchen abzuarbeiten, schlägt Citrine sequenziell die jeweils informativsten nächsten Versuche vor, basierend auf Unsicherheits- und Erwartungswert-Modellen. In dokumentierten Konzernfällen reduziert das die Anzahl benötigter Laborversuche um 50–80 %. Wer Laborkapazität als Engpass hat (was in der Industrieforschung fast immer der Fall ist), bekommt hier den realen Hebel.
Drei abgestimmte Module statt Werkzeugkasten. DataManager bringt Versuchsdaten aus Excel, Lab Notebooks und Datenbanken in eine konsistente Struktur. VirtualLab führt die Optimierung und „virtuelle Experimente” aus. Catalyst, das jüngste Modul, ist ein LLM-basierter Recherche-Assistent, der natürlichsprachliche Fragen zu Materialien beantwortet und Quellen aus Fachjournalen und Preprints liefert. Die drei Module greifen sauber ineinander: was DataManager kuratiert, modelliert VirtualLab, und was Catalyst aus der Literatur ergänzt, fließt zurück in den Versuchsplan.
Belastbare Referenzen aus der EU-Chemieindustrie. Evonik (Deutschland), LyondellBasell (Niederlande/USA), Arkema und Saint-Gobain (Frankreich) sowie Eastman sind nicht zufällige Marketing-Logos, sondern langjährige Citrine-Kunden, teils mit publizierten Case Studies. Für die Bewertung als Plattform-Anbieter ist diese Kundenbasis ein Plus: keine Frühphasen-Skepsis, etablierte Integrationsmuster, dokumentierte ROI-Geschichten.
Enterprise-Sicherheitsniveau. ISO 27001-zertifiziert, AWS-gehostet, dedizierte Sicherheits- und Compliance-Dokumentation. Für Konzerne mit Compliance-Anforderungen ist das die Grundlage, überhaupt in eine Evaluierung zu gehen, viele kleinere Materials-Informatics-Startups scheitern an diesem Punkt schon im Procurement.
Tiefe Beratungs- und Implementierungserfahrung. Citrine bietet Professional Services als integralen Bestandteil, keine bloße Software-Lizenz, sondern eine Kombination aus Plattform und Beratungseinheit. Für Organisationen, die intern keine Materials-Informatics-Erfahrung haben, ist das essenziell. Für Organisationen, die diese Erfahrung haben, kann es als zusätzliche Kostenkomponente störend wirken.
Schwächen ehrlich betrachtet
Keine Preistransparenz. Citrine veröffentlicht keine Listenpreise und bietet keinen Self-Service-Einstieg. Jede Evaluierung beginnt mit Scoping-Call, Discovery-Workshop und Angebot, was für Konzerne normal ist, für interessierte KMU aber eine echte Hürde darstellt. Ein einfacher „Probier es aus mit deinem Datensatz für 5.000 USD pro Monat” wird hier nicht angeboten.
Standard-Hosting in den USA, keine dokumentierte EU-Region. Citrine läuft auf AWS, eine dedizierte EU-Region für Produktionsdaten ist öffentlich nicht dokumentiert. Für europäische Konzerne mit DSGVO-Anforderungen (auch wenn R&D-Daten meist keine personenbezogenen Daten enthalten, aber sehr wohl Geschäftsgeheimnisse) bleibt das ein Punkt, der individuell mit Citrine vereinbart werden muss. Wer eine vorab garantierte EU-Region-Aussage braucht, sollte das im Procurement explizit klären.
Hoher Datenbedarf. Bayesische Modelle brauchen kein riesiges Datenset, aber sehr wohl ein konsistentes. Wer nur 50 historische Versuche mit drei verschiedenen Messmethodiken hat, wird mit Citrine wenig anfangen können. Faustregel aus Konzern-Implementierungen: mindestens 200 vergleichbare Versuche pro Modellraum, besser 500–1.000. Wer diesen Sockel nicht hat, muss erst monatelang in Datenharmonisierung investieren, was Citrine zwar mitliefert, aber nicht ersetzen kann.
Abhängigkeit von Citrine-Beratern. Anders als ein klassisches SaaS-Werkzeug ist Citrine ohne Begleitung durch Citrine-eigene Berater oder Data Scientists kaum produktiv zu betreiben. Für viele Konzerne ist das ein Feature (man bekommt sofort Expertise dazu), für andere ein Bug (Wissen bleibt extern, interne Mitarbeitende lernen die Plattform nicht selbst tief genug). Wer interne Materials-Informatics-Kompetenz aufbauen will, sollte das vertraglich absichern (Wissensübergabe, Train-the-Trainer).
Enger Anwendungsbereich. Citrine ist exzellent in Werkstoff- und Chemikaliendesign, und außerhalb davon kaum einsetzbar. Für Maschinenbau, Bauwesen, Elektronik oder Software-Entwicklung ist die Plattform falsch dimensioniert. Wer eine generische ML-Plattform für gemischte R&D-Themen sucht, ist mit Databricks, AWS SageMaker oder einer fachübergreifenden MLOps-Lösung besser bedient.
Kein deutschsprachiges Interface. Die Plattform ist vollständig englisch, der Support läuft englischsprachig. Für deutsche R&D-Abteilungen meist kein Showstopper (englische Fachsprache ist Standard), aber für die Datenbeschriftung und Workflow-Integration in deutsche LIMS-Systeme ein zusätzlicher Aufwand.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Eine generische Coding- und ML-Workbench für eigene Modelle willst | Cursor oder Claude für die Modellentwicklung |
| Recherche in Fachliteratur ohne Plattform-Lock-in brauchst | Elicit oder Perplexity (Academic-Focus) |
| Wissenschaftliche Paper systematisch durchgehen willst | NotebookLM für eigene Sammlung |
Erwähnenswert ohne eigene Tool-Seite: Materials Project / Pymatgen (akademisches Open-Source-Ökosystem, Berkeley Lab), Phaseshift Technologies (Konkurrenz im Materials-Informatics-Markt), Uncountable (vergleichbare Plattform mit Fokus auf Formulierungsindustrien), Aionics (Spezialisierung auf Batterie- und Elektrochemie) und Schrödinger (etablierter Spezialist für Computer-Aided Drug und Materials Design mit anderem Methodenfokus). Citrine bleibt im Materials-Informatics-Markt einer der profiliertesten Anbieter, wer eine Plattform-Entscheidung trifft, sollte mindestens Uncountable und Citrine vergleichend evaluieren, ergänzend Phaseshift für leichteren Mittelstandszugang.
So steigst du ein
Schritt 1: Internes Scoping vor dem Vertriebsgespräch. Bevor du Citrine anfragst, kläre intern: Welche Produktlinie soll Pilotbereich werden? Wie viele konsistente historische Versuche liegen vor (gleiche Messmethodik, gleiche Zieleigenschaft)? Welche konkrete Geschäftsfrage soll Citrine beantworten, „neue Formulierung mit Eigenschaft X bei Kosten Y” oder „Stabilitätsoptimierung im bestehenden Sortiment”? Ohne diese drei Antworten wird die Discovery-Phase teurer als nötig.
Schritt 2: Demo und Pilot vereinbaren. Citrine startet typisch mit einem Scoping-Call, gefolgt von einer 3–6-monatigen Pilotphase mit definiertem Use-Case und Erfolgsmetrik. Verhandle hart auf messbare Outcomes: Wie viele Laborversuche wurden eingespart? Welche Vorhersagegüte (R²) auf Hold-out-Datensätzen? Welche dokumentierten neuen Formulierungen sind im Pilotzeitraum entstanden? Ohne harte Outcomes lässt sich nach Pilotende kaum eine Anschlussinvestition rechtfertigen.
Schritt 3: Wissenstransfer mitverhandeln. Citrine arbeitet stark beratungsgetrieben, das ist Stärke und Risiko zugleich. Vereinbare vertraglich, dass interne Mitarbeitende parallel zu Citrine-Beratern an der Plattform geschult werden (Train-the-Trainer-Modell), und dass Modelle, Workflows und Daten in einer Form übergeben werden, die euch im Falle eines Anbieterwechsels nicht vollständig hilflos zurücklässt. Materials-Informatics-Plattformen schaffen schnell Lock-in über Datenstrukturen und Modellarchitektur, bewusst gegensteuern.
Ein konkretes Beispiel
Eine Spezialchemie-Tochter eines DAX-Konzerns mit Sitz in Marl entwickelt Klebstoffe für die Automobilindustrie. Aufgabenstellung: Neue Formulierung mit reduziertem CO₂-Fußabdruck (Biobasis ≥ 40 %) bei gleicher Scherfestigkeit und Temperaturstabilität. Klassischer DoE-Ansatz: 96 Laborversuche mit drei Inhaltsstoff-Klassen und vier Prozessparametern, circa 6 Monate Laborzeit, ungefähr 180.000 EUR Materialkosten. Mit Citrine: 1.400 historische Versuche aus dem DataManager werden modelliert, VirtualLab schlägt sequenziell 18 neue Formulierungen vor (in drei Iterationsrunden mit Laborfeedback). Ergebnis nach 10 Wochen: drei Kandidatenformulierungen mit ≥ 42 % Biobasis und vergleichbarer Scherfestigkeit, geschätzte Laborkosteneinsparung 120.000 EUR, Time-to-Market um 4 Monate verkürzt. Citrine-Kosten für den Pilotzeitraum (Plattform + Professional Services): rund 250.000 USD. Amortisation nach dem zweiten erfolgreich abgeschlossenen Use-Case, die Konzern-R&D verlängert auf eine mehrjährige Plattform-Lizenz, eingerahmt durch ein internes Materials-Informatics-Team von drei Data Scientists, die das Wissen perspektivisch übernehmen.
DSGVO & Datenschutz
- Datenhosting: AWS, Standard-Region in den USA. Eine dedizierte EU-Region ist öffentlich nicht dokumentiert und müsste individuell mit Citrine vereinbart werden. Anbieter ist Citrine Informatics, Inc., Redwood City (USA).
- Datennutzung: Citrine-Kundendaten werden in der Regel mandantengetrennt verarbeitet und nicht für übergreifendes Modelltraining genutzt, exakte Regelungen sind Vertragsbestandteil und sollten im Procurement schriftlich geklärt werden.
- Sicherheitszertifizierung: ISO 27001 vorhanden. SOC-2-Berichte werden Enterprise-Kunden auf Anfrage zur Verfügung gestellt.
- Personenbezogene Daten: In klassischen R&D-Datensätzen (Komposition, Prozess, Messwert) typischerweise keine personenbezogenen Daten, Nutzeraccounts und Audit-Logs enthalten sie sehr wohl. Hier gelten Standard-Enterprise-AVV.
- Auftragsverarbeitung (AVV): Für Enterprise-Kunden verfügbar, Inhalte und Standardvertragsklauseln werden individuell verhandelt.
- Empfehlung für Unternehmen: Für europäische Konzerne sinnvoll, R&D-Datenstrategie und Hosting-Region vor Vertragsabschluss explizit zu klären. Geschäftsgeheimnisse (Formulierungen, Versuchsergebnisse) sind selten DSGVO-Thema, aber sehr wohl Compliance- und Wettbewerbsthema, saubere Datenklassifizierung und Berechtigungssteuerung sind Pflicht.
Gut kombiniert mit
- NotebookLM, Während Citrine Catalyst die Literatur auf Plattform-Ebene anbindet, ist NotebookLM eine flexible Ergänzung für eigene Sammlungen interner technischer Berichte, Promotionsschriften und Konferenzproceedings, die nicht in der Citrine-Quellbasis enthalten sind.
- Claude, Für die Aufbereitung der Citrine-Ergebnisse zu Management-Reports, Patent-Erstentwürfen oder internen Wissenstransferdokumenten. Claude verarbeitet auch lange technische Texte zuverlässig und übersetzt zwischen R&D-Fachsprache und Geschäftskontext.
- Cursor, Für eigene Datenpipelines, die Versuchsdaten aus Lab-Notebooks oder LIMS-Systemen in das Citrine-Datenmodell überführen. Cursor mit Claude oder GPT als Backend beschleunigt die ETL-Skripte deutlich.
Unser Testurteil
Citrine Informatics verdient 3 von 5 Sternen. Inhaltlich ist die Plattform exzellent, domänenspezifisches Materials-Modellverständnis, ausgereifte bayesische Optimierung, mit Catalyst ein klar erkennbarer Schritt in Richtung LLM-Integration und eine beeindruckende Referenzliste aus der EU-Chemieindustrie. Die zwei verlorenen Sterne kosten Citrine drei Punkte: fehlende Preistransparenz und der hohe Mindesteinstieg machen die Plattform für den deutschen Mittelstand praktisch unerreichbar, die fehlende dokumentierte EU-Region zwingt europäische Kunden zu individuellen Sondervereinbarungen, und die starke Abhängigkeit von Citrine-Beratern macht den ROI eng an die Qualität der Implementierungspartnerschaft gekoppelt. Für Konzern-R&D mit den passenden Voraussetzungen (Daten, Budget, langfristige Strategie) ist Citrine trotzdem eine der ersten Adressen, für alle anderen ist es das falsche Werkzeug, kein „kleines Citrine” verfügbar.
Was wir bemerkt haben
- 2024, Citrine hat mit Catalyst ein eigenes LLM-basiertes Modul eingeführt, das natürlichsprachliche Recherche auf Fachjournalen und Preprints ermöglicht. Damit folgt Citrine dem branchenweiten Trend, klassische ML-Plattformen um generative KI-Komponenten zu ergänzen, relevant, weil R&D-Teams so erstmals ohne Python-Kenntnisse Wert aus der Plattform ziehen können.
- 2025, Die Plattform wird klarer als Drei-Modul-Architektur (DataManager, VirtualLab, Catalyst) positioniert. Das ersetzt die ältere monolithische Darstellung und macht modulare Einstiege (z. B. zunächst nur DataManager + Catalyst, später VirtualLab) sichtbar, ein Zugeständnis an Kunden, die nicht direkt in die volle Plattform investieren wollen.
- Mai 2026, Citrine veröffentlicht weiterhin keine Listenpreise und kommuniziert keinen Self-Service-Einstieg. Das ist marktüblich für Materials-Informatics-Plattformen, schließt aber den deutschen Mittelstand de facto aus. Wer eine günstigere Einstiegsstufe sucht, sollte alternative Anbieter wie Uncountable oder Phaseshift vergleichend evaluieren.
- Mai 2026, Eine dedizierte EU-Region für Citrine-Kundendaten ist öffentlich nicht dokumentiert. Für europäische Konzerne, die Hosting in Frankfurt oder Irland brauchen, bleibt das ein Verhandlungspunkt im Vertrag, und ein Punkt, der in der Procurement-Phase aktiv eingefordert werden muss.
Diesen Inhalt teilen:
Empfohlen in 1 Use Cases
Metallindustrie
Empfohlen für diese Branchen
Redaktionell bewertet · Preise und Funktionen können sich ändern.
Stimmt etwas nicht?
Preise geändert, Feature veraltet oder etwas fehlt? Wir freuen uns über Hinweise und Ergänzungen.
Nicht sicher, ob Citrine Informatics zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.