Zum Inhalt springen
Beauty & Wellness parfuemerieduftentwicklungolfaktorik

Duftstoff-Olfaktorik-Mapping: ML findet Duftkombinationen aus molekularen Deskriptoren

Parfümeure verbringen Monate mit Trial-and-Error, um ein emotionales Duftbriefing in eine Formel zu übersetzen. ML-Olfaktorik-Modelle kartieren molekulare Ähnlichkeiten und reduzieren den Suchraum drastisch.

⚡ Auf einen Blick
Problem
Ein Duftbriefing lautet: 'frisch, holzig, leicht orientalisch, nicht zu schwer'. Parfümeure müssen aus über 3.000 verfügbaren Duftstoffen eine Auswahl treffen, kombinieren und iterieren — jeder Testansatz kostet Zeit und Rohstoffbudget. Ein Duft dauert 6–18 Monate von Brief bis Marktreife.
KI-Lösung
ML-Modell mappt Duftstoffmoleküle auf sensorische Eigenschaften (basierend auf Datensätzen wie dem Pyrfume-Archiv oder proprietären Parfümeur-Datenbanken). Gegeben ein semantisches Brief, liefert das Modell Kandidatenmoleküle und Kombinationsvorschläge, die der Parfümeur gezielt testen kann.
Typischer Nutzen
Anzahl der Testansätze um 40–60% reduzierbar. Entwicklungszeit von durchschnittlich 12 auf 7–8 Monate verkürzt in frühen Piloten.
Setup-Zeit
Proprietäre Modelle nur für Großlabors; Forschungstools für KMU kaum praxisreif
Kosteneinschätzung
Rohstoffkosten je Testansatz 500–5.000 €; Einsparung stark qualitätsabhängig
ML-Olfaktorik-Modell (z.B. Osmo, Symrise Philyra, Firmenich/Givaudan interne Tools, oder Forschungskooperationen)
Worum geht's?

Es ist Donnerstag, 14:17 Uhr.

Laura Baumann, Parfümeurin bei einem mittelständischen Hamburger Dufthaus, öffnet die dreizehnte Riechstreifen-Box dieser Woche. Das Briefing für den neuen Körperpflege-Duft eines Handelskunden liegt seit sechs Wochen auf ihrem Schreibtisch: “frisch, leicht holzig, mediterran, nicht zu intensiv, funktioniert auf der Haut noch nach vier Stunden.” Fünf Ansätze im Labor, drei davon abgelehnt — zu grün, zu blumig, zu dünn. Die Kostenkalkulation sagt: Noch zwei Iterationen sind drin, bevor das Projekt in die Verlustzone rutscht.

Auf ihrem Laptop laufen gerade 500.000 virtuelle Moleküle durch ein KI-Modell — ein Service, den das Dufthaus probeweise über einen Forschungspartner nutzt. Das System hat drei Kandidaten als strukturell und olfaktorisch nahe an “frisch-holzig-mediterran” markiert: Bergamottan-Derivate, ein synthetisches Cedral-Analogon, eine unbekannte Verbindung aus dem Osmo-Katalog. Morgen kommen die Rohstoffe. Laura tippt die Bestellnummer.

Das rettet keine Duftentwicklung. Aber es verschiebt die Quoten: statt blind zu testen, testet sie gezielt.

Das ist kein Zufall. Seit 2023 ist klar, dass Machine Learning die Geruchswahrnehmung aus der Molekülstruktur vorhersagen kann — präziser als ein einzelner menschlicher Panelist.

Das echte Ausmaß des Problems

Die Parfümindustrie ist eine der letzten Branchen, die noch weitgehend auf intuitiver Expertise aufgebaut ist. Ein erfahrener Parfümeur kennt von Berufs wegen 3.000 bis 5.000 einzelne Duftstoffmoleküle und deren sensorische Wirkung im Gedächtnis — und trotzdem ist jede neue Formulierung ein Navigieren im Dunkeln.

Das Problem fängt im Briefing an. Ein Auftraggeber beschreibt einen Duft mit Wörtern wie “frisch”, “warm”, “vertrauenswürdig”, “nordisch” — und keine dieser Beschreibungen hat eine direkte chemische Entsprechung. Die Aufgabe des Parfümeurs ist es, emotionale Assoziationen in Molprozente zu übersetzen. Das ist handwerkliche Kunst, keine lineare Funktion.

Was folgt, ist ein iterativer Prozess mit echten Kosten:

  • Rohstoffkosten je Testansatz: 500 bis 5.000 Euro, abhängig von Formulierungskomplexität und eingesetzten Naturstoffen
  • Laborzeitaufwand: 2–4 Wochen pro Iterationsschleife, inklusive sensorischer Evaluierung durch das interne Panel
  • Entwicklungszeit gesamt: 6 bis 18 Monate von Brief bis freigegebenem Duft — laut Branchenberichten liegt der Durchschnitt bei etwa 12 Monaten
  • Suchraum: Über 3.000 handelsübliche Duftstoffe, dazu tausende synthetischer Neusynthesen pro Jahr

Das Suchraumproblem verschärft sich weiter: Natürliche Einschränkungen durch IFRA-Regulierung, Allergen-Beschränkungen und Rohstoffpreise legen einen immer engeren Korridor fest, innerhalb dessen neue Formeln funktionieren müssen. Gleichzeitig wächst der Druck auf Duft-Innovation: Marken launchen bis zu 30.000 neue Duftstoffprodukte pro Jahr weltweit.

Das ist keine akademische Herausforderung. Das ist ein betriebswirtschaftliches Problem — und seit 2023 gibt es erstmals einen wissenschaftlich validierten Ansatz, es systematisch anzugehen.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit ML-Olfaktorik-Unterstützung
Zu testende Kandidaten pro Briefing15–40 Rohstoffkombinationen3–8 gezielt ausgewählte Kandidaten
Iterationsschleifen bis zur Freigabe5–102–4
Entwicklungszeit (Briefing bis Freigabe)9–18 Monate6–10 Monate (Pilotberichte)
Rohstoffkosten Entwicklungsphase8.000–50.000 €3.000–20.000 € (geschätzt)
Zugänglichkeit für KMUvollständigsehr eingeschränkt (Großlabors oder Forschungskooperationen)

Die Zahlen in der rechten Spalte stammen aus frühen Pilotberichten der Großdufthäuser und aus dem Symrise-IBM-Research-Projekt “Philyra” (2019–2023) — keine kontrollierten Studien, sondern Betriebserfahrungen. Für kleine und mittlere Duftateliers gelten diese Zahlen noch nicht: Die Tools sind heute noch kein “Off-the-shelf-Produkt”, das man einfach abonniert.

Einschätzung auf einen Blick

Zeitersparnis — hoch (4/5) Der größte Hebel: Wer den Suchraum von 3.000+ Rohstoffen auf eine vorqualifizierte Kandidatenliste von 5–15 Verbindungen einschränkt, spart pro Briefing mehrere Iterationsschleifen. Symrise berichtete aus dem Philyra-Projekt, dass die Entwicklungszeit für bestimmte Briefingtypen um mehrere Monate verkürzt werden konnte. Zeitersparnis ist damit der stärkste Hebel — höher als bei vielen anderen Beauty-KI-Anwendungsfällen, weil hier Wochen und Monate, nicht nur Stunden auf dem Spiel stehen. Der Score liegt bei 4 statt 5, weil der menschliche Parfümeur die Kandidaten noch immer evaluieren und entscheiden muss — das KI-System beschleunigt die Suche, aber nicht das abschließende kreative Urteil.

Kosteneinsparung — mittel (3/5) Rohstoffkosten je Testansatz liegen zwischen 500 und 5.000 Euro. Wer drei statt zehn Iterationsschleifen braucht, spart real. Der Score bleibt bei 3, weil der Technologiezugang selbst erhebliche Kosten verursacht — eigene Modellentwicklung oder externe Dienste wie Osmo befinden sich im Enterprise-Segment. Die Kosteneinsparung ist vorhanden, aber nicht so eindeutig isolierbar wie bei physikalischen Prozessen.

Schnelle Umsetzung — sehr niedrig (1/5) Das ist das ehrlichste Signal in diesem Radar: Dieser Anwendungsfall ist kein 6-Wochen-Projekt. Proprietäre Modelle der Big-5-Dufthäuser (Symrise, Givaudan, IFF, Firmenich, Takasago) sind nicht zugänglich. Osmo bietet Enterprise-Zugang über seinen Generation-Service, aber nicht als Self-Service-API. Forschungstools auf Basis offener Daten (Pyrfume-Archiv, Google-Studie) erfordern Bioinformatik-Expertise und Entwicklerressourcen. Für KMU bedeutet das: Dieser Use Case startet nicht morgen. Er startet nach einer Forschungskooperation oder einem mehrjährigen Aufbau.

ROI-Sicherheit — niedrig (2/5) Dieser Score ist bewusst niedrig — und das aus gutem Grund. Duftqualität ist letztlich subjektiv. Was das Modell als “frisch-holzig” vorhersagt, muss der Auftraggeber noch abnehmen — und Auftraggeber sind Menschen mit individuellen Geruchswahrnehmungen, kulturellen Prägungen und kurzfristigen Trend-Einflüssen. Die Einsparung in der Entwicklungsphase ist real, aber der Erfolg des fertigen Dufts am Markt lässt sich nicht vorhersagen. Dieser Anwendungsfall hat also einen messbaren Prozessnutzen (weniger Iterationen), aber keinen gesicherten Outcome-Nutzen (bessere Düfte). Das unterscheidet sich fundamental von Anwendungsfällen wie Emulsionsstabilität-Prognose, wo ein stabiles Produkt eine messbare binäre Anforderung erfüllt oder nicht.

Skalierbarkeit — mittel (3/5) Einmal aufgebaut, skaliert das Modell gut: Jeder neue Briefing-Typ kann gegen dieselbe Molekülbibliothek gescreent werden. Der limitierende Faktor ist Datenpflege und Modell-Retraining — neue Rohstoffe müssen in den Index, sensorische Feedbackdaten aus abgeschlossenen Projekten müssen das Modell verfeinern. Das ist eine Daueraufgabe, nicht ein einmaliges Setup. Daher 3 statt 4.

Richtwerte — stark abhängig vom verfügbaren Duftportfolio, der Datenlage aus abgeschlossenen Projekten und dem gewählten Technologiepfad (proprietäres System vs. Forschungskooperation).

Was das Modell konkret macht — die Technologie dahinter

Das Kernproblem heißt “inverses Olfaktions-Problem”: Gegeben eine Beschreibung (“frisch, grün, leicht aldehydisch”), welche Moleküle erzeugen diese Wahrnehmung? Das ist die Umkehrfunktion der klassischen Frage, und sie ist deutlich schwieriger.

Moleküle als Graphen

Moderne Olfaktions-KI repräsentiert Duftstoffmoleküle nicht als Zahlenkolonnen, sondern als Graphen: Atome sind Knoten, chemische Bindungen sind Kanten. Ein sogenanntes Graph Neural Network (Deep Learning-Architektur) lernt aus diesem Graphen latente Repräsentationen — mathematische Vektoren, die die “Bedeutung” eines Moleküls im Geruchswahrnehmungsraum kodieren.

Das Ergebnis ist eine “Principal Odor Map” (POM): ein hochdimensionaler Raum, in dem ähnlich riechende Moleküle nah beieinander liegen — auch wenn ihre chemischen Strukturen auf den ersten Blick unterschiedlich aussehen. Dieses Konzept wurde im August 2023 in der Fachzeitschrift Science publiziert. Das Modell von Osmo und Forschungspartnern (Monell Chemical Senses Center, University of Reading) wurde auf ~5.000 annotierten Molekülen trainiert und kartierte anschließend 500.000 potenzielle Duftstoffkandidaten. Bei Vorhersagen zu neuen, nie gerochen Molekülen war das Modell näher an der mittleren menschlichen Panelist-Beurteilung als jeder einzelne Mensch — in 53 Prozent der Fälle.

Was das System in der Praxis leistet

Das System übernimmt drei Aufgaben:

  1. Geruchsvorhersage für unbekannte Moleküle — aus der Struktur allein, bevor die Substanz überhaupt synthetisiert ist
  2. Ähnlichkeitssuche — “Zeige alle Moleküle, die olfaktorisch nah an Iso E Super liegen, aber kein Moschus-Allergen enthalten”
  3. Kandidatenranking — aus tausenden Kandidaten die Top-10 für ein gegebenes Briefing sortieren

Was es nicht leistet: Es kann keine kreativen Entscheidungen treffen. Das Modell sagt, welche Moleküle zu einem Briefing passen — nicht, wie eine Formel in 12 Monaten beim Endkunden ankommt.

Welche Moleküldeskriptoren das Modell wirklich vorhersagt

Das ist die Stelle, wo viele Diskussionen zu unkonkret werden. Was genau “lernt” das Modell?

Geruchsattribute (Odor Descriptors)

Die Vorhersage-Outputs sind Geruchsbeschreibungen aus einem standardisierten Vokabular: floral, citrus, musky, earthy, woody, green, aldehydic, animalic, camphoraceous, minty — typischerweise 50–138 Attribute je nach Datensatz. Das Modell gibt für jedes Attribut eine Wahrscheinlichkeit aus: “Dieses Molekül riecht zu 78 Prozent ‘floral’, zu 42 Prozent ‘citrus’, zu 12 Prozent ‘green’.”

Geruchsintensität

Einige Modelle sagen auch Intensität vorher — wie stark riecht dieses Molekül überhaupt? Das ist relevant für die Formulierungspraxis: Ein sehr intensiver Rohstoff bei 0,1 Prozent schlägt eine schwache Verbindung bei 5 Prozent.

Odor Threshold

Die Geruchsschwelle — wie wenig von einem Molekül reicht, damit Menschen es riechen — lässt sich teilweise aus der Struktur ableiten. Das ist hilfreich für die Dosierungsplanung.

Was nicht vorhergesagt wird

  • Wie sich zwei Moleküle im Blend gegenseitig beeinflussen (Synergien, Masking-Effekte)
  • Die emotionale oder kulturelle Assoziation des Geruchs
  • Die Performance auf der Haut (Substantivität, Projektionsstärke, Sillage)
  • Individuelle genetische Variation — manche Menschen riechen bestimmte Verbindungen schlicht nicht

Diese Lücken sind keine Bugs des Modells. Sie sind das inhärente Limit der heutigen Wissenschaft.

Warum KI keine Nase ist: Die Grenzen der Vorhersage

Dieser Abschnitt ist wichtig — nicht um die Technologie schlechtzureden, sondern weil Über-Erwartungen das sind, was Projekte scheitern lässt.

Das Enantiomer-Problem

Enantiomere sind Moleküle, die sich wie Bild und Spiegelbild verhalten — strukturell fast identisch, aber olfaktorisch fundamental verschieden. Carvon (R)-Form riecht nach Krauseminze; (S)-Carvon nach Kümmel. Ein Modell, das nur die zweidimensionale Strukturformel liest, kann diesen Unterschied nicht erfassen. Die heutigen besten Modelle berücksichtigen dreidimensionale Molekülkonformation — aber das ist rechenaufwendig und noch nicht Standard.

Genetische Varianz im Geruchssystem

Menschen besitzen etwa 400 verschiedene Geruchsrezeptor-Gene — und die individuelle Ausprägung variiert genetisch erheblich. Für manche Menschen ist Androstenon (in Schweißgeruch) intensiv und unangenehm; für andere geruchlos. Für einige Menschen riecht Cilantro nach Seife (Aldehyd-Polymorphismus). Das Modell schätzt die “mittlere menschliche Wahrnehmung” — kein Auftraggeber ist die mittlere Wahrnehmung.

Das Blend-Problem

Duftstoffformulierungen bestehen typischerweise aus 20–60 einzelnen Komponenten. Wie sie sich gegenseitig beeinflussen — gegenseitiges Maskieren, synergistische Effekte, Wahrnehmungsverschiebungen durch Konzentrations-Interaktionen — ist wissenschaftlich noch wenig verstanden. Ein 2024 in ACS Omega publiziertes Paper zu Deep Learning für Duftstoffblends kommt zu dem Schluss: Blend-Vorhersage ist erheblich schwieriger als Einzelmolekül-Vorhersage.

Kontext und Kulturprägung

Der Geruch, der in Deutschland als “frisch” gilt, kann in Japan als “sauber” und in Frankreich als “Waschmittel” wahrgenommen werden. Kulturelle Geruchsassoziationen fehlen in heutigen Modellen fast vollständig — sie sind in strukturellen Deskriptoren schlicht nicht kodierbar.

Das Fazit: Das Modell ist ein leistungsstarkes Filter-Werkzeug, kein Entscheidungssystem. Es schränkt den Suchraum ein — und das allein ist schon wertvoll.

Konkrete Werkzeuge — was wann passt

Der Markt für Olfaktions-KI ist in zwei Welten geteilt: die proprietären Systeme der Großdufthäuser, die nicht zugänglich sind, und ein wachsendes Feld an Technologieanbietern und Forschungstools.

Osmo (Generation-Service) — Die kommerziell zugänglichste Implementierung des POM-Modells aus der Science-Publikation. Osmo betreibt seit März 2025 “Generation” als AI-powered Fragrance House: Marken übergeben ein Briefing, Osmo liefert Formulierungsvorschläge innerhalb von 24–48 Stunden. Enterprise-Pricing auf Anfrage; kein öffentliches API. Keine deutschen Sprachanforderungen, US-Datenhaltung. Geeignet für Beautymarken, die schnell zu einem Erstkonzept kommen wollen, ohne eigene Laborinfrastruktur aufzubauen.

Symrise Philyra (nicht öffentlich zugänglich) — Das bekannteste Beispiel eines integrierten industriellen Olfaktions-KI-Systems, entwickelt in Kooperation mit IBM Research. Philyra hat Zugriff auf 3,5 Millionen historische Duftformeln und über 2.000 Rohstoffe mit 20 sensorischen Dimensionen. Erster kommerzieller Duft: Egeo für Boticario (Brasilien, 2019). Nicht lizenzierbar — proprietäres Inhouse-Tool von Symrise.

ChemCopilot (indirekt relevant) — Für Formulierungsteams, die neben der Olfaktorie auch REACH-Compliance und Rohstoff-Substitution automatisieren wollen, kann ChemCopilot als PLM-Schicht sinnvoll sein. Das Tool ist kein Olfaktions-Predictor, aber es kann Rohstoffkandidaten regulatorisch vorqualifizieren, bevor sie ins Duftlabor gehen. Ab ca. 1.000 Euro/Monat; Enterprise-Pricing, keine öffentliche Listpreise.

Forschungsweg über Pyrfume (Open Source, Entwickler-Skills erforderlich) — Das Pyrfume-Archiv (in Scientific Data 2024 publiziert) ist die umfassendste offene Datenquelle für olfaktorische Wahrnehmungsdaten. Über 40 Datensätze, lizenziert für Forschung und kommerzielle Nutzung. Wer Bioinformatik-Know-how im Team hat, kann darauf eigene Vorhersagemodelle trainieren — auf Basis öffentlich verfügbarer GNN-Architekturen aus der Literatur. Das ist kein Produkt, das man kauft, sondern ein Weg, den man selbst gehen muss. Kosten: Rechenzeit (Cloud-GPU), Entwicklergehalt, Datenbeschriftung. Zeitaufwand bis zum Proof of Concept: 3–6 Monate.

Wann welcher Ansatz

  • Schnell zu Erstkonzepten, ohne eigene Infrastruktur: Osmo Generation-Service
  • Eigene Formulierungsdatenbank + Compliance-Workflow: ChemCopilot
  • Forschungsprojekt oder Hochschulkooperation: Pyrfume-Archiv + Open-Source-GNN
  • Vollintegriertes Inhouse-System: Nur realistisch für Großdufthäuser mit eigenem ML-Team

Datenschutz und Datenhaltung

Die DSGVO-Relevanz bei Olfaktions-Projekten ist ungewöhnlich — es geht weniger um Personendaten als um Geschäftsgeheimnisse.

Duftformeln sind das wertvollste IP eines Dufthauses. Wenn du eine Formel oder ein detailliertes Briefing an einen externen KI-Dienst überträgst, gibst du potenziell strategische Geschäftsinformationen heraus. Die relevanten Fragen:

  • Wird mein Briefing/meine Formel für Modell-Training verwendet? Für Osmo: schriftliche Klärung im Enterprise-Vertrag zwingend erforderlich. Generation-Projekte sollten explizit Klauseln enthalten, die Kundenformulierungen vom Trainings-Datensatz ausschließen.
  • Wo werden Daten gespeichert? Osmo ist US-basiert; kein EU-Hosting. Für DSGVO-Konformität braucht man Standardvertragsklauseln (SCC) und einen AVV — beides ist verhandelbar, muss aber aktiv eingefordert werden.
  • Geheimhaltungsvertrag vor Datenweitergabe: Vor jedem Briefing-Upload an externe Dienste sollte ein NDA oder gleichwertiger Schutz vertraglich fixiert sein.

Für Forschungskooperationen mit Hochschulen (z.B. Pyrfume-basierte Projekte): Hier entstehen keine Datenschutzprobleme im DSGVO-Sinne, da keine Personendaten verarbeitet werden — das Risiko ist rein IP-bezogen.

Was es kostet — realistisch gerechnet

Weg 1: Osmo Generation-Service (schnellster Einstieg)

  • Einmalige Briefing-Gebühr: nicht öffentlich — Enterprise-Preise auf Anfrage
  • Schätzung aus Marktgesprächen: Projektbasiertes Engagement ab mehreren Tausend Euro pro Briefing-Zyklus
  • Keine eigene Infrastruktur; keine laufenden Lizenzkosten außerhalb der Projektgebühren

Weg 2: ChemCopilot als ergänzende Compliance-Schicht

  • Ab ca. 1.000 Euro/Monat; volle Enterprise-Setups im fünfstelligen Jahresbereich
  • Kein Olfaktions-Predictor, aber regulatorische Vorqualifikation von Kandidaten sinnvoll integrierbar

Weg 3: Eigenes Forschungsprojekt (höchster Aufwand, maximale Kontrolle)

  • Entwickler-/Bioinformatiker-Ressourcen: 3–12 Monate Personenmonate
  • Cloud-GPU-Kosten für Modelltraining: 2.000–15.000 Euro einmalig, je nach Datensatzgröße
  • Datenbeschriftung (sensorische Evaluierungen): 500–2.000 Euro pro 100 Moleküle mit professionellem Panel
  • Gesamtinvestition Proof of Concept: 50.000–200.000 Euro

Was du dagegen rechnen kannst

Eine verhinderte Fehlentwicklung rettet erheblich mehr: Ein Duft, der nach 12 Monaten Entwicklungszeit nicht freigegeben wird, kostet 30.000–100.000 Euro an Direkt- und Opportunitätskosten. Drei bis fünf verhinderte Fehlentwicklungen pro Jahr amortisieren auch ein sechsstelliges Investitionsprojekt.

Ehrliche Einschätzung: Der ROI ist für Großdufthäuser mit 50+ Projekten pro Jahr klar positiv. Für ein Atelier mit 5–10 Projekten jährlich ist der Weg über einen Service wie Osmo kosteneffizienter als eigene Infrastruktur.

Drei typische Einstiegsfehler

1. Das Modell als Rezepturgenerator missverstehen

Der häufigste Fehler: Das Dufthaus erwartet, dass die KI eine fertige Formel liefert. Das tut sie nicht. Sie liefert eine Kandidatenliste — eine Auswahl von Rohstoffen, die olfaktorisch zur Briefing-Beschreibung passen könnten. Was daraus eine Formel macht, ist Parfümeur-Arbeit: Dosierung, Ausbalancierung, Performance-Tests auf dem Träger, kreative Entscheidungen. Wer das System als Ersatz für Parfümeur-Expertise kauft, wird enttäuscht. Wer es als Filter-Werkzeug einsetzt, das die besten Kandidaten nach vorne bringt, bekommt genau das.

2. Mit unstrukturierter Briefing-Sprache arbeiten

Ein Briefing wie “riecht nach Sommer” ist für ein Modell nicht verwertbar. Die Modelle arbeiten mit definierten olfaktorischen Attributen — FEMA GRA Flavor Categories, IFRA-Descriptor-Sets oder proprietäre Taxonomien. Wer kein standardisiertes Vokabular einführt, erhält Kandidaten, die irgendwie passen, aber keine gezielte Selektion ermöglichen. Lösung: Briefings systematisch in ein olfaktorisches Attribut-Profil übersetzen, bevor sie ins Modell gehen. Das ist eine einmalige Trainingsaufgabe für das Parfümeur-Team.

3. Das Modell einmalig implementieren und nie aktualisieren

Ein Olfaktions-Modell braucht Feedback aus abgeschlossenen Projekten, um besser zu werden. Wenn sensorische Evaluierungsdaten nicht systematisch zurückgespielt werden — welche Kandidaten haben in der Praxis funktioniert, welche nicht —, stagniert die Vorhersagequalität. Das ist die teuerste Form des Stillstands: Du bezahlst für ein System, das nicht lernt. Wer ein eigenes Modell aufbaut, muss von Anfang an ein Feedback-Loop-Konzept planen: Wer pflegt die Rückmeldungen? In welchem Format? In welchem Rhythmus wird neu trainiert?

4. Auf eine externe Paneldatenbank verlassen, ohne eigene Daten einzuspeisen

Die öffentlichen Datensätze (Pyrfume, Leffingwell & Associates) sind wertvoll — aber sie spiegeln keine unternehmenseigenen Präferenzen wider. Ein Parfümeur bei einem bestimmten Dufthaus hat eine spezifische Formulierungs-DNA, eine Rohstoffpalette, Kunden mit bestimmten Präferenzen. Ein Modell, das nur auf generischen Paneldaten trainiert ist, wird diese Spezifik nicht kennen. Das beste Modell entsteht aus einer Kombination aus öffentlichen Benchmarks und eigenem historischem Datenschatz.

Was mit der Einführung wirklich passiert — und was nicht

Die wichtigste Person, mit der du über dieses Projekt sprechen musst, ist die Parfümeurin selbst.

In fast jeder Branche, in der KI-Unterstützung eingeführt wird, gibt es einen stillen Widerstand: “Das System versteht nicht, was wir hier tun.” Bei Olfaktions-KI ist dieser Widerstand besonders berechtigt — und gleichzeitig der Schlüssel zum Erfolg.

Ein Parfümeur, der das Modell als Bedrohung seiner Expertise wahrnimmt, wird keine präzisen Briefing-Attribute eingeben, keine sorgfältigen Feedbackdaten zurückspielen und am Ende das System umgehen. Das Ergebnis: ein teures Tool, das niemand nutzt.

Was funktioniert: Den Parfümeur in die Datenbeschriftungs-Phase einbinden. Wer mitentschieden hat, welche Geruchsattribute im Modell verwendet werden, verteidigt danach die Attribut-Klassifikation. Das ist keine Management-Taktik — das ist richtiges Wissen anzapfen. Die Expertinnen und Experten im Labor wissen, welche Attribute für das Unternehmensportfolio relevant sind. Dieses Wissen gehört ins Modell.

Zweiter Punkt: Das System niemals als “KI entscheidet die Formel” kommunizieren — nicht intern, nicht beim Kunden. Die korrekte Kommunikation ist: “Wir nutzen KI-gestütztes Screening, um gezielter zu testen.” Das ist auch präziser: Das Modell reduziert die Kandidatenliste, der Parfümeur entscheidet.

Dritter Punkt: Piloten sorgfältig dokumentieren. Wenn das Modell in drei von fünf Pilotprojekten die finalen Kandidaten in den Top-5 platziert hatte, ist das ein Argument. Wenn es das nicht tat, muss man verstehen warum — nicht das System pauschal ablehnen.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Technologie-Evaluation2–4 WochenOsmo-Kontakt aufnehmen oder Forschungspartner identifizieren; Anforderungen definierenKein passendes Angebot im Markt — proprietäre Systeme unzugänglich
Datenbasis-Audit4–8 WochenEigene historische Daten sichten: Welche Projekte haben strukturierte sensorische Evaluierungen?Daten liegen unstrukturiert vor — Aufwand für Digitalisierung unterschätzt
Proof of Concept8–16 WochenPilotprojekt mit echtem Briefing; Modell-Output gegen Parfümeur-Intuition evaluierenModell liefert Kandidaten, die Parfümeur bereits kennt — keine Neuentdeckung, kein Erkenntnisgewinn
Iterationsschleife3–6 MonateFeedback aus Pilotprojekten zurückspielen; Modell verfeinern; Briefing-Systematik anpassenParfümeur-Team gibt kein strukturiertes Feedback — Modell stagniert
Produktivbetriebab Monat 12Systematischer Einsatz bei allen geeigneten Briefings; regelmäßiges RetrainingTool wird nur für “passende” Briefings genutzt — Potenzial nicht ausgeschöpft

Dieser Zeitplan gilt für den Weg über einen externen Service wie Osmo. Ein eigenes Modell zu trainieren verdoppelt die meisten Phasen.

Häufige Einwände — und was dahintersteckt

“Das kann kein Modell besser als ein erfahrener Parfümeur.” Das ist fast richtig. Ein Modell kann den kreativen Sprung — die unerwartete Kombination, die ein Duft zu einem Kunstwerk macht — nicht vollziehen. Was es kann: 500.000 Kandidatenmoleküle in Sekunden sichten, wovon ein Parfümeur vielleicht 3.000 kennt. Das ist kein Kreativitäts-Wettbewerb, sondern eine Suchmaschine für einen Raum, der für den menschlichen Geist schlicht zu groß ist. Der beste Vergleich: Schach-Software kann nicht verstehen, warum eine Position schön ist — aber sie sieht alle Folgekonstellationen zuverlässiger als jeder Mensch. Das Modell ist kein Parfümeur-Ersatz, es ist ein Telescope für den Duftstoffraum.

“Wir haben keine Daten in der richtigen Form.” Das ist der häufigste wahre Einwand. Die meisten Dufthäuser haben historische Formeln — aber sensorische Evaluierungsdaten sind oft nicht strukturiert dokumentiert. Das ist eine lösbare Herausforderung: Der Einstieg über einen Service wie Osmo umgeht das Problem, weil man keine eigene Datenbasis braucht. Der Aufbau einer eigenen Dateninfrastruktur ist langfristige Investition, aber lohnend: Jedes neue Projekt fügt einen Datenpunkt hinzu, der das Modell verbessert.

“Das ist nur etwas für die großen Dufthäuser.” Heute: ja, weitgehend. In drei bis fünf Jahren: wahrscheinlich nicht mehr. Das Feld entwickelt sich schnell — Osmos $70M Series-B-Runde im Februar 2026 deutet auf erhebliche Kommerzialisierungsanstrengungen hin. Wer jetzt versteht, wie die Technologie funktioniert und was sie kann, ist in einer besseren Position, wenn der Zugang breiter wird.

Woran du merkst, dass das zu dir passt

Passende Situationen:

  • Du betreibst oder arbeitest für ein Dufthaus oder einen Inhaltsstofflieferanten mit mindestens 15–20 aktiven Duftentwicklungsprojekten pro Jahr
  • Du hast ein Team von mindestens einem ausgebildeten Parfümeur plus Labor-Support — die menschliche Expertise zur Evaluierung von Modell-Outputs ist vorhanden
  • Du arbeitest mit einem strukturierten sensorischen Panel oder hast Zugang zu einem — Panel-Daten sind die Trainingsbasis für valide Modelle
  • Mindestens 200–500 historische Formulierungen mit sensorischen Notizen liegen in digitaler Form vor — das ist die Datenmindestbasis für eigene Modellentwicklung
  • Dein größtes Bottleneck ist die Länge der Entwicklungszyklen, nicht der kreative Einstieg ins Projekt

Drei harte Ausschlusskriterien:

  1. Du bist eine Beautymarke ohne eigenes Labor. Marken, die Duftentwicklung vollständig an externe Dufthäuser delegieren, können Olfaktions-KI nicht eigenständig einsetzen — sie haben weder die Rohstoffpalette noch die Panel-Infrastruktur. Der richtige Weg ist dann, das eigene Dufthaus zu fragen, ob es KI-gestützte Entwicklung anbietet.

  2. Weniger als 10 Duftentwicklungsprojekte pro Jahr. Unterhalb dieser Schwelle sind die Iterationskosten so überschaubar, dass der Aufwand für Technologieimplementierung — inklusive Datenbasis, Trainingsinfrastruktur, Prozessanpassung — nie amortisiert wird. Der Fokus sollte auf Parfümeur-Expertisetiefe liegen, nicht auf algorithmischem Screening.

  3. Kein strukturiertes sensorisches Evaluierungssystem. Wenn Geruchsbewertungen heute als handschriftliche Notizen, informelle E-Mails oder in den Köpfen der Parfümeure leben, ist der erste Schritt nicht ein KI-Modell — sondern die Systematisierung dieser Daten. Ohne strukturiertes Feedback ist jedes Modell ein Schwarzes Loch: Es nimmt Input, gibt Output, aber niemand kann prüfen, ob es lernt.

Das kannst du heute noch tun

Beginne nicht mit dem Tool, sondern mit der Datenbasis. Der einfachste erste Schritt kostet nichts außer Zeit:

Wähle zehn abgeschlossene Duftentwicklungsprojekte der letzten drei Jahre. Für jedes Projekt: Was war das Briefing (in olfaktorischen Attributen)? Welche Kandidaten wurden getestet? Welche wurden abgelehnt und warum? Welcher Kandidat hat schließlich die Freigabe bekommen — und welche Attribute haben letztlich ausgeschlagen?

Wenn du diese zehn Projekte strukturiert dokumentieren kannst, hast du den Kern einer Trainingsdatenbasis — und du weißt, ob du die 200–500 Projekte hast, die für ein ernsthaftes Modell nötig sind.

Für den unmittelbaren Einstieg in die Technologie: Lade die Pyrfume-Bibliothek über GitHub herunter und schau, wie olfaktorische Daten strukturiert sind. Das ist kostenlos, open source und zeigt dir das Datenformat, das ML-Modelle in diesem Bereich verwenden.

Wenn du eine konkrete Projektidee hast und rasch testen willst, ob Osmos Generation-Service für euer Briefing-Format funktioniert, kontaktiere Osmo direkt — sie nehmen projekt-spezifische Anfragen an.

Prompt: Briefing in olfaktorisches Attributprofil übersetzen
Du bist ein Experte für Duftentwicklung und olfaktorische Analyse. Ich möchte ein Briefing für einen Duftstoff in standardisierte olfaktorische Attribute übersetzen. Briefing: [BRIEFING-TEXT EINFÜGEN] Aufgabe: 1. Übersetze das Briefing in eine Liste von olfaktorischen Primärattributen (z.B. citrus, floral, woody, musky, green, aldehydic, spicy, earthy). Priorisiere die Attribute (Hauptnoten, Herznoten, Basisnoten). 2. Nenne 3–5 bekannte Duftstoffklassen (z.B. Bergamotte-Derivate, Muskhölzer, Labdanum-Extrakte), die typischerweise diese Attribute erzeugen. 3. Nenne bekannte Referenzrohstoffe je Klasse (z.B. ISO E Super für Holznoten, Hedione für frische Jasmin-Noten). 4. Identifiziere potenzielle regulatorische Einschränkungen (IFRA-Kategorien, Allergene der IFRA-Listenstoffe), die bei diesen Rohstoffklassen zu prüfen wären. 5. Formuliere das Briefing als strukturierten Datensatz im Format: Primärattribute | Sekundärattribute | Intensitätsprofil (0–5 je Attribut) | Ausschluss-Attribute ("darf nicht nach X riechen"). [ZIELGRUPPE DES PRODUKTS EINFÜGEN: z.B. Körperpflegelinie für 25–35-jährige, gender-neutral] [TRÄGER: z.B. Körperlotion, Eau de Toilette, Raumduft] [INTENSITÄTSZIEL: z.B. leicht (10–15% Duftöl), mittel (15–25%), intensiv (>25%)]
Funktioniert mit ChatGPT, Claude, Gemini
Beispiel-Ausgabe

Mitarbeiter:in

Briefing: 'Frisch, mediterran, leicht salzig wie ein Sommermorgen am Meer, nicht zu süß, funktioniert auch bei Wärme noch gut'. Träger: Körperlotion. Zielgruppe: 30–45-jährige, gender-neutral.

KI-Assistent

Primärattribute: citrus (5/5), marine/aquatic (4/5), green-herbal (3/5) Sekundärattribute: woody-light (2/5), aldehydic-fresh (2/5), musk-clean (2/5) Ausschluss-Attribute: floral-heavy, sweet-vanilla, powder, animalic Empfohlene Rohstoffklassen: • Citrus-Topnoten: Bergamotte-EO, Zitrone-EO, Limette-EO (IFRA-konform bei ≤4% im Rinse-Off-Produkt) • Marine-Noten: Calone (1–2% max, sehr intensiv), Seaweed-Extrakte, dihydromyrcenol • Grün-Herbal: Galbanum-Harz, Violet Leaf Absolute, frische Basilikum-Fraktion • Weiße Moschus-Basis (Substantivität bei Wärme): Galaxolide, Habanolide — IFRA-Allergenstatus prüfen Intensitätsziel: leicht (10–15%), mediterran-frisch, langer Drydown mit hellem Holz/Musk Regulatorische Hinweise: Bergamotte enthält Furanocumarine → Bergapten-freie Variante für Rinse-Off prüfen; Calone: IFRA-Kategorie 4 Richtwert beachten Strukturierter Datensatz für Modell-Input: citrus=5, marine=4, green=3, woody=2, aldehydic=2, musk=2 | floral=0, sweet=0, powder=0

Quellen & Methodik

  • Osmo/Google Research: Principal Odor Map (POM): Mayhew, E.J. et al., „A Principal Odor Map Unifies Diverse Tasks in Human Olfactory Perception”, Science, Vol. 381, Nr. 6655, August 2023, S. 999–1006 (doi:10.1126/science.ade4401). GNN-Modell trainiert auf ~5.000 annotierten Molekülen; übertrifft individuelle Panelisten in 53% der Fälle.
  • Symrise + IBM Research Philyra: Symrise Pressemitteilung und C&EN-Bericht (2018/2019); Philyra-Seite auf symrise.com; Boticario Egeo-Launch (Juni 2019); Haven-Launch-Bericht (Q2 2022 — 11 Wochen von Trend-Erkennung bis Markteinführung).
  • Osmo Series B: Business Wire, „Osmo, Digital Scent Design Company, Announces $70M in Series B Funding”, 4. Februar 2026.
  • Osmo Generation: Cosmeticsdesign.com, „Osmo launches Generation, world’s first AI-powered fragrance house”, März 2025.
  • Pyrfume-Archiv: Gerkin, R.C. et al., „Pyrfume: A window to the world’s olfactory data”, Scientific Data, 11, 1163 (2024). Über 40 Datensätze, open source (doi:10.1038/s41597-024-04051-z).
  • Blend-Vorhersage: ACS Omega, „Deep Learning for Odor Prediction on Aroma-Chemical Blends” (2024) — Blend-Interaktionen deutlich schwieriger vorherzusagen als Einzelmoleküle.
  • Grenzen der Modelle: Sreenivasan, V. et al., „More than meets the AI: The possibilities and limits of machine learning in olfaction”, Frontiers in Neuroscience, 16:981294 (2022).
  • Entwicklungszeiten und Kosten: Branchenangaben aus Perfumer & Flavorist, Advanced Biotech und eigenem Recherche-Stand (Mai 2026). Alle Kostenzahlen sind Schätzwerte — individuelle Projekte variieren erheblich.

Du arbeitest an einem Duftentwicklungsprojekt und willst wissen, ob und wie KI-gestütztes Molekülscreening für euren spezifischen Anwendungsfall sinnvoll ist? Sprich uns an — wir helfen bei der Einschätzung.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar