Duftstoff-Olfaktorik-Mapping: ML findet Duftkombinationen aus molekularen Deskriptoren
Parfümeure verbringen Monate mit Trial-and-Error, um ein emotionales Duftbriefing in eine Formel zu übersetzen. ML-Olfaktorik-Modelle kartieren molekulare Ähnlichkeiten und reduzieren den Suchraum drastisch.
- Problem
- Ein Duftbriefing lautet: 'frisch, holzig, leicht orientalisch, nicht zu schwer'. Parfümeure müssen aus über 3.000 verfügbaren Duftstoffen eine Auswahl treffen, kombinieren und iterieren — jeder Testansatz kostet Zeit und Rohstoffbudget. Ein Duft dauert 6–18 Monate von Brief bis Marktreife.
- KI-Lösung
- ML-Modell mappt Duftstoffmoleküle auf sensorische Eigenschaften (basierend auf Datensätzen wie dem Pyrfume-Archiv oder proprietären Parfümeur-Datenbanken). Gegeben ein semantisches Brief, liefert das Modell Kandidatenmoleküle und Kombinationsvorschläge, die der Parfümeur gezielt testen kann.
- Typischer Nutzen
- Anzahl der Testansätze um 40–60% reduzierbar. Entwicklungszeit von durchschnittlich 12 auf 7–8 Monate verkürzt in frühen Piloten.
- Setup-Zeit
- Proprietäre Modelle nur für Großlabors; Forschungstools für KMU kaum praxisreif
- Kosteneinschätzung
- Rohstoffkosten je Testansatz 500–5.000 €; Einsparung stark qualitätsabhängig
Es ist Donnerstag, 14:17 Uhr.
Laura Baumann, Parfümeurin bei einem mittelständischen Hamburger Dufthaus, öffnet die dreizehnte Riechstreifen-Box dieser Woche. Das Briefing für den neuen Körperpflege-Duft eines Handelskunden liegt seit sechs Wochen auf ihrem Schreibtisch: “frisch, leicht holzig, mediterran, nicht zu intensiv, funktioniert auf der Haut noch nach vier Stunden.” Fünf Ansätze im Labor, drei davon abgelehnt — zu grün, zu blumig, zu dünn. Die Kostenkalkulation sagt: Noch zwei Iterationen sind drin, bevor das Projekt in die Verlustzone rutscht.
Auf ihrem Laptop laufen gerade 500.000 virtuelle Moleküle durch ein KI-Modell — ein Service, den das Dufthaus probeweise über einen Forschungspartner nutzt. Das System hat drei Kandidaten als strukturell und olfaktorisch nahe an “frisch-holzig-mediterran” markiert: Bergamottan-Derivate, ein synthetisches Cedral-Analogon, eine unbekannte Verbindung aus dem Osmo-Katalog. Morgen kommen die Rohstoffe. Laura tippt die Bestellnummer.
Das rettet keine Duftentwicklung. Aber es verschiebt die Quoten: statt blind zu testen, testet sie gezielt.
Das ist kein Zufall. Seit 2023 ist klar, dass Machine Learning die Geruchswahrnehmung aus der Molekülstruktur vorhersagen kann — präziser als ein einzelner menschlicher Panelist.
Das echte Ausmaß des Problems
Die Parfümindustrie ist eine der letzten Branchen, die noch weitgehend auf intuitiver Expertise aufgebaut ist. Ein erfahrener Parfümeur kennt von Berufs wegen 3.000 bis 5.000 einzelne Duftstoffmoleküle und deren sensorische Wirkung im Gedächtnis — und trotzdem ist jede neue Formulierung ein Navigieren im Dunkeln.
Das Problem fängt im Briefing an. Ein Auftraggeber beschreibt einen Duft mit Wörtern wie “frisch”, “warm”, “vertrauenswürdig”, “nordisch” — und keine dieser Beschreibungen hat eine direkte chemische Entsprechung. Die Aufgabe des Parfümeurs ist es, emotionale Assoziationen in Molprozente zu übersetzen. Das ist handwerkliche Kunst, keine lineare Funktion.
Was folgt, ist ein iterativer Prozess mit echten Kosten:
- Rohstoffkosten je Testansatz: 500 bis 5.000 Euro, abhängig von Formulierungskomplexität und eingesetzten Naturstoffen
- Laborzeitaufwand: 2–4 Wochen pro Iterationsschleife, inklusive sensorischer Evaluierung durch das interne Panel
- Entwicklungszeit gesamt: 6 bis 18 Monate von Brief bis freigegebenem Duft — laut Branchenberichten liegt der Durchschnitt bei etwa 12 Monaten
- Suchraum: Über 3.000 handelsübliche Duftstoffe, dazu tausende synthetischer Neusynthesen pro Jahr
Das Suchraumproblem verschärft sich weiter: Natürliche Einschränkungen durch IFRA-Regulierung, Allergen-Beschränkungen und Rohstoffpreise legen einen immer engeren Korridor fest, innerhalb dessen neue Formeln funktionieren müssen. Gleichzeitig wächst der Druck auf Duft-Innovation: Marken launchen bis zu 30.000 neue Duftstoffprodukte pro Jahr weltweit.
Das ist keine akademische Herausforderung. Das ist ein betriebswirtschaftliches Problem — und seit 2023 gibt es erstmals einen wissenschaftlich validierten Ansatz, es systematisch anzugehen.
Mit vs. ohne KI — ein ehrlicher Vergleich
| Kennzahl | Ohne KI | Mit ML-Olfaktorik-Unterstützung |
|---|---|---|
| Zu testende Kandidaten pro Briefing | 15–40 Rohstoffkombinationen | 3–8 gezielt ausgewählte Kandidaten |
| Iterationsschleifen bis zur Freigabe | 5–10 | 2–4 |
| Entwicklungszeit (Briefing bis Freigabe) | 9–18 Monate | 6–10 Monate (Pilotberichte) |
| Rohstoffkosten Entwicklungsphase | 8.000–50.000 € | 3.000–20.000 € (geschätzt) |
| Zugänglichkeit für KMU | vollständig | sehr eingeschränkt (Großlabors oder Forschungskooperationen) |
Die Zahlen in der rechten Spalte stammen aus frühen Pilotberichten der Großdufthäuser und aus dem Symrise-IBM-Research-Projekt “Philyra” (2019–2023) — keine kontrollierten Studien, sondern Betriebserfahrungen. Für kleine und mittlere Duftateliers gelten diese Zahlen noch nicht: Die Tools sind heute noch kein “Off-the-shelf-Produkt”, das man einfach abonniert.
Einschätzung auf einen Blick
Zeitersparnis — hoch (4/5) Der größte Hebel: Wer den Suchraum von 3.000+ Rohstoffen auf eine vorqualifizierte Kandidatenliste von 5–15 Verbindungen einschränkt, spart pro Briefing mehrere Iterationsschleifen. Symrise berichtete aus dem Philyra-Projekt, dass die Entwicklungszeit für bestimmte Briefingtypen um mehrere Monate verkürzt werden konnte. Zeitersparnis ist damit der stärkste Hebel — höher als bei vielen anderen Beauty-KI-Anwendungsfällen, weil hier Wochen und Monate, nicht nur Stunden auf dem Spiel stehen. Der Score liegt bei 4 statt 5, weil der menschliche Parfümeur die Kandidaten noch immer evaluieren und entscheiden muss — das KI-System beschleunigt die Suche, aber nicht das abschließende kreative Urteil.
Kosteneinsparung — mittel (3/5) Rohstoffkosten je Testansatz liegen zwischen 500 und 5.000 Euro. Wer drei statt zehn Iterationsschleifen braucht, spart real. Der Score bleibt bei 3, weil der Technologiezugang selbst erhebliche Kosten verursacht — eigene Modellentwicklung oder externe Dienste wie Osmo befinden sich im Enterprise-Segment. Die Kosteneinsparung ist vorhanden, aber nicht so eindeutig isolierbar wie bei physikalischen Prozessen.
Schnelle Umsetzung — sehr niedrig (1/5) Das ist das ehrlichste Signal in diesem Radar: Dieser Anwendungsfall ist kein 6-Wochen-Projekt. Proprietäre Modelle der Big-5-Dufthäuser (Symrise, Givaudan, IFF, Firmenich, Takasago) sind nicht zugänglich. Osmo bietet Enterprise-Zugang über seinen Generation-Service, aber nicht als Self-Service-API. Forschungstools auf Basis offener Daten (Pyrfume-Archiv, Google-Studie) erfordern Bioinformatik-Expertise und Entwicklerressourcen. Für KMU bedeutet das: Dieser Use Case startet nicht morgen. Er startet nach einer Forschungskooperation oder einem mehrjährigen Aufbau.
ROI-Sicherheit — niedrig (2/5) Dieser Score ist bewusst niedrig — und das aus gutem Grund. Duftqualität ist letztlich subjektiv. Was das Modell als “frisch-holzig” vorhersagt, muss der Auftraggeber noch abnehmen — und Auftraggeber sind Menschen mit individuellen Geruchswahrnehmungen, kulturellen Prägungen und kurzfristigen Trend-Einflüssen. Die Einsparung in der Entwicklungsphase ist real, aber der Erfolg des fertigen Dufts am Markt lässt sich nicht vorhersagen. Dieser Anwendungsfall hat also einen messbaren Prozessnutzen (weniger Iterationen), aber keinen gesicherten Outcome-Nutzen (bessere Düfte). Das unterscheidet sich fundamental von Anwendungsfällen wie Emulsionsstabilität-Prognose, wo ein stabiles Produkt eine messbare binäre Anforderung erfüllt oder nicht.
Skalierbarkeit — mittel (3/5) Einmal aufgebaut, skaliert das Modell gut: Jeder neue Briefing-Typ kann gegen dieselbe Molekülbibliothek gescreent werden. Der limitierende Faktor ist Datenpflege und Modell-Retraining — neue Rohstoffe müssen in den Index, sensorische Feedbackdaten aus abgeschlossenen Projekten müssen das Modell verfeinern. Das ist eine Daueraufgabe, nicht ein einmaliges Setup. Daher 3 statt 4.
Richtwerte — stark abhängig vom verfügbaren Duftportfolio, der Datenlage aus abgeschlossenen Projekten und dem gewählten Technologiepfad (proprietäres System vs. Forschungskooperation).
Was das Modell konkret macht — die Technologie dahinter
Das Kernproblem heißt “inverses Olfaktions-Problem”: Gegeben eine Beschreibung (“frisch, grün, leicht aldehydisch”), welche Moleküle erzeugen diese Wahrnehmung? Das ist die Umkehrfunktion der klassischen Frage, und sie ist deutlich schwieriger.
Moleküle als Graphen
Moderne Olfaktions-KI repräsentiert Duftstoffmoleküle nicht als Zahlenkolonnen, sondern als Graphen: Atome sind Knoten, chemische Bindungen sind Kanten. Ein sogenanntes Graph Neural Network (Deep Learning-Architektur) lernt aus diesem Graphen latente Repräsentationen — mathematische Vektoren, die die “Bedeutung” eines Moleküls im Geruchswahrnehmungsraum kodieren.
Das Ergebnis ist eine “Principal Odor Map” (POM): ein hochdimensionaler Raum, in dem ähnlich riechende Moleküle nah beieinander liegen — auch wenn ihre chemischen Strukturen auf den ersten Blick unterschiedlich aussehen. Dieses Konzept wurde im August 2023 in der Fachzeitschrift Science publiziert. Das Modell von Osmo und Forschungspartnern (Monell Chemical Senses Center, University of Reading) wurde auf ~5.000 annotierten Molekülen trainiert und kartierte anschließend 500.000 potenzielle Duftstoffkandidaten. Bei Vorhersagen zu neuen, nie gerochen Molekülen war das Modell näher an der mittleren menschlichen Panelist-Beurteilung als jeder einzelne Mensch — in 53 Prozent der Fälle.
Was das System in der Praxis leistet
Das System übernimmt drei Aufgaben:
- Geruchsvorhersage für unbekannte Moleküle — aus der Struktur allein, bevor die Substanz überhaupt synthetisiert ist
- Ähnlichkeitssuche — “Zeige alle Moleküle, die olfaktorisch nah an Iso E Super liegen, aber kein Moschus-Allergen enthalten”
- Kandidatenranking — aus tausenden Kandidaten die Top-10 für ein gegebenes Briefing sortieren
Was es nicht leistet: Es kann keine kreativen Entscheidungen treffen. Das Modell sagt, welche Moleküle zu einem Briefing passen — nicht, wie eine Formel in 12 Monaten beim Endkunden ankommt.
Welche Moleküldeskriptoren das Modell wirklich vorhersagt
Das ist die Stelle, wo viele Diskussionen zu unkonkret werden. Was genau “lernt” das Modell?
Geruchsattribute (Odor Descriptors)
Die Vorhersage-Outputs sind Geruchsbeschreibungen aus einem standardisierten Vokabular: floral, citrus, musky, earthy, woody, green, aldehydic, animalic, camphoraceous, minty — typischerweise 50–138 Attribute je nach Datensatz. Das Modell gibt für jedes Attribut eine Wahrscheinlichkeit aus: “Dieses Molekül riecht zu 78 Prozent ‘floral’, zu 42 Prozent ‘citrus’, zu 12 Prozent ‘green’.”
Geruchsintensität
Einige Modelle sagen auch Intensität vorher — wie stark riecht dieses Molekül überhaupt? Das ist relevant für die Formulierungspraxis: Ein sehr intensiver Rohstoff bei 0,1 Prozent schlägt eine schwache Verbindung bei 5 Prozent.
Odor Threshold
Die Geruchsschwelle — wie wenig von einem Molekül reicht, damit Menschen es riechen — lässt sich teilweise aus der Struktur ableiten. Das ist hilfreich für die Dosierungsplanung.
Was nicht vorhergesagt wird
- Wie sich zwei Moleküle im Blend gegenseitig beeinflussen (Synergien, Masking-Effekte)
- Die emotionale oder kulturelle Assoziation des Geruchs
- Die Performance auf der Haut (Substantivität, Projektionsstärke, Sillage)
- Individuelle genetische Variation — manche Menschen riechen bestimmte Verbindungen schlicht nicht
Diese Lücken sind keine Bugs des Modells. Sie sind das inhärente Limit der heutigen Wissenschaft.
Warum KI keine Nase ist: Die Grenzen der Vorhersage
Dieser Abschnitt ist wichtig — nicht um die Technologie schlechtzureden, sondern weil Über-Erwartungen das sind, was Projekte scheitern lässt.
Das Enantiomer-Problem
Enantiomere sind Moleküle, die sich wie Bild und Spiegelbild verhalten — strukturell fast identisch, aber olfaktorisch fundamental verschieden. Carvon (R)-Form riecht nach Krauseminze; (S)-Carvon nach Kümmel. Ein Modell, das nur die zweidimensionale Strukturformel liest, kann diesen Unterschied nicht erfassen. Die heutigen besten Modelle berücksichtigen dreidimensionale Molekülkonformation — aber das ist rechenaufwendig und noch nicht Standard.
Genetische Varianz im Geruchssystem
Menschen besitzen etwa 400 verschiedene Geruchsrezeptor-Gene — und die individuelle Ausprägung variiert genetisch erheblich. Für manche Menschen ist Androstenon (in Schweißgeruch) intensiv und unangenehm; für andere geruchlos. Für einige Menschen riecht Cilantro nach Seife (Aldehyd-Polymorphismus). Das Modell schätzt die “mittlere menschliche Wahrnehmung” — kein Auftraggeber ist die mittlere Wahrnehmung.
Das Blend-Problem
Duftstoffformulierungen bestehen typischerweise aus 20–60 einzelnen Komponenten. Wie sie sich gegenseitig beeinflussen — gegenseitiges Maskieren, synergistische Effekte, Wahrnehmungsverschiebungen durch Konzentrations-Interaktionen — ist wissenschaftlich noch wenig verstanden. Ein 2024 in ACS Omega publiziertes Paper zu Deep Learning für Duftstoffblends kommt zu dem Schluss: Blend-Vorhersage ist erheblich schwieriger als Einzelmolekül-Vorhersage.
Kontext und Kulturprägung
Der Geruch, der in Deutschland als “frisch” gilt, kann in Japan als “sauber” und in Frankreich als “Waschmittel” wahrgenommen werden. Kulturelle Geruchsassoziationen fehlen in heutigen Modellen fast vollständig — sie sind in strukturellen Deskriptoren schlicht nicht kodierbar.
Das Fazit: Das Modell ist ein leistungsstarkes Filter-Werkzeug, kein Entscheidungssystem. Es schränkt den Suchraum ein — und das allein ist schon wertvoll.
Konkrete Werkzeuge — was wann passt
Der Markt für Olfaktions-KI ist in zwei Welten geteilt: die proprietären Systeme der Großdufthäuser, die nicht zugänglich sind, und ein wachsendes Feld an Technologieanbietern und Forschungstools.
Osmo (Generation-Service) — Die kommerziell zugänglichste Implementierung des POM-Modells aus der Science-Publikation. Osmo betreibt seit März 2025 “Generation” als AI-powered Fragrance House: Marken übergeben ein Briefing, Osmo liefert Formulierungsvorschläge innerhalb von 24–48 Stunden. Enterprise-Pricing auf Anfrage; kein öffentliches API. Keine deutschen Sprachanforderungen, US-Datenhaltung. Geeignet für Beautymarken, die schnell zu einem Erstkonzept kommen wollen, ohne eigene Laborinfrastruktur aufzubauen.
Symrise Philyra (nicht öffentlich zugänglich) — Das bekannteste Beispiel eines integrierten industriellen Olfaktions-KI-Systems, entwickelt in Kooperation mit IBM Research. Philyra hat Zugriff auf 3,5 Millionen historische Duftformeln und über 2.000 Rohstoffe mit 20 sensorischen Dimensionen. Erster kommerzieller Duft: Egeo für Boticario (Brasilien, 2019). Nicht lizenzierbar — proprietäres Inhouse-Tool von Symrise.
ChemCopilot (indirekt relevant) — Für Formulierungsteams, die neben der Olfaktorie auch REACH-Compliance und Rohstoff-Substitution automatisieren wollen, kann ChemCopilot als PLM-Schicht sinnvoll sein. Das Tool ist kein Olfaktions-Predictor, aber es kann Rohstoffkandidaten regulatorisch vorqualifizieren, bevor sie ins Duftlabor gehen. Ab ca. 1.000 Euro/Monat; Enterprise-Pricing, keine öffentliche Listpreise.
Forschungsweg über Pyrfume (Open Source, Entwickler-Skills erforderlich) — Das Pyrfume-Archiv (in Scientific Data 2024 publiziert) ist die umfassendste offene Datenquelle für olfaktorische Wahrnehmungsdaten. Über 40 Datensätze, lizenziert für Forschung und kommerzielle Nutzung. Wer Bioinformatik-Know-how im Team hat, kann darauf eigene Vorhersagemodelle trainieren — auf Basis öffentlich verfügbarer GNN-Architekturen aus der Literatur. Das ist kein Produkt, das man kauft, sondern ein Weg, den man selbst gehen muss. Kosten: Rechenzeit (Cloud-GPU), Entwicklergehalt, Datenbeschriftung. Zeitaufwand bis zum Proof of Concept: 3–6 Monate.
Wann welcher Ansatz
- Schnell zu Erstkonzepten, ohne eigene Infrastruktur: Osmo Generation-Service
- Eigene Formulierungsdatenbank + Compliance-Workflow: ChemCopilot
- Forschungsprojekt oder Hochschulkooperation: Pyrfume-Archiv + Open-Source-GNN
- Vollintegriertes Inhouse-System: Nur realistisch für Großdufthäuser mit eigenem ML-Team
Datenschutz und Datenhaltung
Die DSGVO-Relevanz bei Olfaktions-Projekten ist ungewöhnlich — es geht weniger um Personendaten als um Geschäftsgeheimnisse.
Duftformeln sind das wertvollste IP eines Dufthauses. Wenn du eine Formel oder ein detailliertes Briefing an einen externen KI-Dienst überträgst, gibst du potenziell strategische Geschäftsinformationen heraus. Die relevanten Fragen:
- Wird mein Briefing/meine Formel für Modell-Training verwendet? Für Osmo: schriftliche Klärung im Enterprise-Vertrag zwingend erforderlich. Generation-Projekte sollten explizit Klauseln enthalten, die Kundenformulierungen vom Trainings-Datensatz ausschließen.
- Wo werden Daten gespeichert? Osmo ist US-basiert; kein EU-Hosting. Für DSGVO-Konformität braucht man Standardvertragsklauseln (SCC) und einen AVV — beides ist verhandelbar, muss aber aktiv eingefordert werden.
- Geheimhaltungsvertrag vor Datenweitergabe: Vor jedem Briefing-Upload an externe Dienste sollte ein NDA oder gleichwertiger Schutz vertraglich fixiert sein.
Für Forschungskooperationen mit Hochschulen (z.B. Pyrfume-basierte Projekte): Hier entstehen keine Datenschutzprobleme im DSGVO-Sinne, da keine Personendaten verarbeitet werden — das Risiko ist rein IP-bezogen.
Was es kostet — realistisch gerechnet
Weg 1: Osmo Generation-Service (schnellster Einstieg)
- Einmalige Briefing-Gebühr: nicht öffentlich — Enterprise-Preise auf Anfrage
- Schätzung aus Marktgesprächen: Projektbasiertes Engagement ab mehreren Tausend Euro pro Briefing-Zyklus
- Keine eigene Infrastruktur; keine laufenden Lizenzkosten außerhalb der Projektgebühren
Weg 2: ChemCopilot als ergänzende Compliance-Schicht
- Ab ca. 1.000 Euro/Monat; volle Enterprise-Setups im fünfstelligen Jahresbereich
- Kein Olfaktions-Predictor, aber regulatorische Vorqualifikation von Kandidaten sinnvoll integrierbar
Weg 3: Eigenes Forschungsprojekt (höchster Aufwand, maximale Kontrolle)
- Entwickler-/Bioinformatiker-Ressourcen: 3–12 Monate Personenmonate
- Cloud-GPU-Kosten für Modelltraining: 2.000–15.000 Euro einmalig, je nach Datensatzgröße
- Datenbeschriftung (sensorische Evaluierungen): 500–2.000 Euro pro 100 Moleküle mit professionellem Panel
- Gesamtinvestition Proof of Concept: 50.000–200.000 Euro
Was du dagegen rechnen kannst
Eine verhinderte Fehlentwicklung rettet erheblich mehr: Ein Duft, der nach 12 Monaten Entwicklungszeit nicht freigegeben wird, kostet 30.000–100.000 Euro an Direkt- und Opportunitätskosten. Drei bis fünf verhinderte Fehlentwicklungen pro Jahr amortisieren auch ein sechsstelliges Investitionsprojekt.
Ehrliche Einschätzung: Der ROI ist für Großdufthäuser mit 50+ Projekten pro Jahr klar positiv. Für ein Atelier mit 5–10 Projekten jährlich ist der Weg über einen Service wie Osmo kosteneffizienter als eigene Infrastruktur.
Drei typische Einstiegsfehler
1. Das Modell als Rezepturgenerator missverstehen
Der häufigste Fehler: Das Dufthaus erwartet, dass die KI eine fertige Formel liefert. Das tut sie nicht. Sie liefert eine Kandidatenliste — eine Auswahl von Rohstoffen, die olfaktorisch zur Briefing-Beschreibung passen könnten. Was daraus eine Formel macht, ist Parfümeur-Arbeit: Dosierung, Ausbalancierung, Performance-Tests auf dem Träger, kreative Entscheidungen. Wer das System als Ersatz für Parfümeur-Expertise kauft, wird enttäuscht. Wer es als Filter-Werkzeug einsetzt, das die besten Kandidaten nach vorne bringt, bekommt genau das.
2. Mit unstrukturierter Briefing-Sprache arbeiten
Ein Briefing wie “riecht nach Sommer” ist für ein Modell nicht verwertbar. Die Modelle arbeiten mit definierten olfaktorischen Attributen — FEMA GRA Flavor Categories, IFRA-Descriptor-Sets oder proprietäre Taxonomien. Wer kein standardisiertes Vokabular einführt, erhält Kandidaten, die irgendwie passen, aber keine gezielte Selektion ermöglichen. Lösung: Briefings systematisch in ein olfaktorisches Attribut-Profil übersetzen, bevor sie ins Modell gehen. Das ist eine einmalige Trainingsaufgabe für das Parfümeur-Team.
3. Das Modell einmalig implementieren und nie aktualisieren
Ein Olfaktions-Modell braucht Feedback aus abgeschlossenen Projekten, um besser zu werden. Wenn sensorische Evaluierungsdaten nicht systematisch zurückgespielt werden — welche Kandidaten haben in der Praxis funktioniert, welche nicht —, stagniert die Vorhersagequalität. Das ist die teuerste Form des Stillstands: Du bezahlst für ein System, das nicht lernt. Wer ein eigenes Modell aufbaut, muss von Anfang an ein Feedback-Loop-Konzept planen: Wer pflegt die Rückmeldungen? In welchem Format? In welchem Rhythmus wird neu trainiert?
4. Auf eine externe Paneldatenbank verlassen, ohne eigene Daten einzuspeisen
Die öffentlichen Datensätze (Pyrfume, Leffingwell & Associates) sind wertvoll — aber sie spiegeln keine unternehmenseigenen Präferenzen wider. Ein Parfümeur bei einem bestimmten Dufthaus hat eine spezifische Formulierungs-DNA, eine Rohstoffpalette, Kunden mit bestimmten Präferenzen. Ein Modell, das nur auf generischen Paneldaten trainiert ist, wird diese Spezifik nicht kennen. Das beste Modell entsteht aus einer Kombination aus öffentlichen Benchmarks und eigenem historischem Datenschatz.
Was mit der Einführung wirklich passiert — und was nicht
Die wichtigste Person, mit der du über dieses Projekt sprechen musst, ist die Parfümeurin selbst.
In fast jeder Branche, in der KI-Unterstützung eingeführt wird, gibt es einen stillen Widerstand: “Das System versteht nicht, was wir hier tun.” Bei Olfaktions-KI ist dieser Widerstand besonders berechtigt — und gleichzeitig der Schlüssel zum Erfolg.
Ein Parfümeur, der das Modell als Bedrohung seiner Expertise wahrnimmt, wird keine präzisen Briefing-Attribute eingeben, keine sorgfältigen Feedbackdaten zurückspielen und am Ende das System umgehen. Das Ergebnis: ein teures Tool, das niemand nutzt.
Was funktioniert: Den Parfümeur in die Datenbeschriftungs-Phase einbinden. Wer mitentschieden hat, welche Geruchsattribute im Modell verwendet werden, verteidigt danach die Attribut-Klassifikation. Das ist keine Management-Taktik — das ist richtiges Wissen anzapfen. Die Expertinnen und Experten im Labor wissen, welche Attribute für das Unternehmensportfolio relevant sind. Dieses Wissen gehört ins Modell.
Zweiter Punkt: Das System niemals als “KI entscheidet die Formel” kommunizieren — nicht intern, nicht beim Kunden. Die korrekte Kommunikation ist: “Wir nutzen KI-gestütztes Screening, um gezielter zu testen.” Das ist auch präziser: Das Modell reduziert die Kandidatenliste, der Parfümeur entscheidet.
Dritter Punkt: Piloten sorgfältig dokumentieren. Wenn das Modell in drei von fünf Pilotprojekten die finalen Kandidaten in den Top-5 platziert hatte, ist das ein Argument. Wenn es das nicht tat, muss man verstehen warum — nicht das System pauschal ablehnen.
Realistischer Zeitplan mit Risikohinweisen
| Phase | Dauer | Was passiert | Typisches Risiko |
|---|---|---|---|
| Technologie-Evaluation | 2–4 Wochen | Osmo-Kontakt aufnehmen oder Forschungspartner identifizieren; Anforderungen definieren | Kein passendes Angebot im Markt — proprietäre Systeme unzugänglich |
| Datenbasis-Audit | 4–8 Wochen | Eigene historische Daten sichten: Welche Projekte haben strukturierte sensorische Evaluierungen? | Daten liegen unstrukturiert vor — Aufwand für Digitalisierung unterschätzt |
| Proof of Concept | 8–16 Wochen | Pilotprojekt mit echtem Briefing; Modell-Output gegen Parfümeur-Intuition evaluieren | Modell liefert Kandidaten, die Parfümeur bereits kennt — keine Neuentdeckung, kein Erkenntnisgewinn |
| Iterationsschleife | 3–6 Monate | Feedback aus Pilotprojekten zurückspielen; Modell verfeinern; Briefing-Systematik anpassen | Parfümeur-Team gibt kein strukturiertes Feedback — Modell stagniert |
| Produktivbetrieb | ab Monat 12 | Systematischer Einsatz bei allen geeigneten Briefings; regelmäßiges Retraining | Tool wird nur für “passende” Briefings genutzt — Potenzial nicht ausgeschöpft |
Dieser Zeitplan gilt für den Weg über einen externen Service wie Osmo. Ein eigenes Modell zu trainieren verdoppelt die meisten Phasen.
Häufige Einwände — und was dahintersteckt
“Das kann kein Modell besser als ein erfahrener Parfümeur.” Das ist fast richtig. Ein Modell kann den kreativen Sprung — die unerwartete Kombination, die ein Duft zu einem Kunstwerk macht — nicht vollziehen. Was es kann: 500.000 Kandidatenmoleküle in Sekunden sichten, wovon ein Parfümeur vielleicht 3.000 kennt. Das ist kein Kreativitäts-Wettbewerb, sondern eine Suchmaschine für einen Raum, der für den menschlichen Geist schlicht zu groß ist. Der beste Vergleich: Schach-Software kann nicht verstehen, warum eine Position schön ist — aber sie sieht alle Folgekonstellationen zuverlässiger als jeder Mensch. Das Modell ist kein Parfümeur-Ersatz, es ist ein Telescope für den Duftstoffraum.
“Wir haben keine Daten in der richtigen Form.” Das ist der häufigste wahre Einwand. Die meisten Dufthäuser haben historische Formeln — aber sensorische Evaluierungsdaten sind oft nicht strukturiert dokumentiert. Das ist eine lösbare Herausforderung: Der Einstieg über einen Service wie Osmo umgeht das Problem, weil man keine eigene Datenbasis braucht. Der Aufbau einer eigenen Dateninfrastruktur ist langfristige Investition, aber lohnend: Jedes neue Projekt fügt einen Datenpunkt hinzu, der das Modell verbessert.
“Das ist nur etwas für die großen Dufthäuser.” Heute: ja, weitgehend. In drei bis fünf Jahren: wahrscheinlich nicht mehr. Das Feld entwickelt sich schnell — Osmos $70M Series-B-Runde im Februar 2026 deutet auf erhebliche Kommerzialisierungsanstrengungen hin. Wer jetzt versteht, wie die Technologie funktioniert und was sie kann, ist in einer besseren Position, wenn der Zugang breiter wird.
Woran du merkst, dass das zu dir passt
Passende Situationen:
- Du betreibst oder arbeitest für ein Dufthaus oder einen Inhaltsstofflieferanten mit mindestens 15–20 aktiven Duftentwicklungsprojekten pro Jahr
- Du hast ein Team von mindestens einem ausgebildeten Parfümeur plus Labor-Support — die menschliche Expertise zur Evaluierung von Modell-Outputs ist vorhanden
- Du arbeitest mit einem strukturierten sensorischen Panel oder hast Zugang zu einem — Panel-Daten sind die Trainingsbasis für valide Modelle
- Mindestens 200–500 historische Formulierungen mit sensorischen Notizen liegen in digitaler Form vor — das ist die Datenmindestbasis für eigene Modellentwicklung
- Dein größtes Bottleneck ist die Länge der Entwicklungszyklen, nicht der kreative Einstieg ins Projekt
Drei harte Ausschlusskriterien:
-
Du bist eine Beautymarke ohne eigenes Labor. Marken, die Duftentwicklung vollständig an externe Dufthäuser delegieren, können Olfaktions-KI nicht eigenständig einsetzen — sie haben weder die Rohstoffpalette noch die Panel-Infrastruktur. Der richtige Weg ist dann, das eigene Dufthaus zu fragen, ob es KI-gestützte Entwicklung anbietet.
-
Weniger als 10 Duftentwicklungsprojekte pro Jahr. Unterhalb dieser Schwelle sind die Iterationskosten so überschaubar, dass der Aufwand für Technologieimplementierung — inklusive Datenbasis, Trainingsinfrastruktur, Prozessanpassung — nie amortisiert wird. Der Fokus sollte auf Parfümeur-Expertisetiefe liegen, nicht auf algorithmischem Screening.
-
Kein strukturiertes sensorisches Evaluierungssystem. Wenn Geruchsbewertungen heute als handschriftliche Notizen, informelle E-Mails oder in den Köpfen der Parfümeure leben, ist der erste Schritt nicht ein KI-Modell — sondern die Systematisierung dieser Daten. Ohne strukturiertes Feedback ist jedes Modell ein Schwarzes Loch: Es nimmt Input, gibt Output, aber niemand kann prüfen, ob es lernt.
Das kannst du heute noch tun
Beginne nicht mit dem Tool, sondern mit der Datenbasis. Der einfachste erste Schritt kostet nichts außer Zeit:
Wähle zehn abgeschlossene Duftentwicklungsprojekte der letzten drei Jahre. Für jedes Projekt: Was war das Briefing (in olfaktorischen Attributen)? Welche Kandidaten wurden getestet? Welche wurden abgelehnt und warum? Welcher Kandidat hat schließlich die Freigabe bekommen — und welche Attribute haben letztlich ausgeschlagen?
Wenn du diese zehn Projekte strukturiert dokumentieren kannst, hast du den Kern einer Trainingsdatenbasis — und du weißt, ob du die 200–500 Projekte hast, die für ein ernsthaftes Modell nötig sind.
Für den unmittelbaren Einstieg in die Technologie: Lade die Pyrfume-Bibliothek über GitHub herunter und schau, wie olfaktorische Daten strukturiert sind. Das ist kostenlos, open source und zeigt dir das Datenformat, das ML-Modelle in diesem Bereich verwenden.
Wenn du eine konkrete Projektidee hast und rasch testen willst, ob Osmos Generation-Service für euer Briefing-Format funktioniert, kontaktiere Osmo direkt — sie nehmen projekt-spezifische Anfragen an.
Mitarbeiter:in
KI-Assistent
Quellen & Methodik
- Osmo/Google Research: Principal Odor Map (POM): Mayhew, E.J. et al., „A Principal Odor Map Unifies Diverse Tasks in Human Olfactory Perception”, Science, Vol. 381, Nr. 6655, August 2023, S. 999–1006 (doi:10.1126/science.ade4401). GNN-Modell trainiert auf ~5.000 annotierten Molekülen; übertrifft individuelle Panelisten in 53% der Fälle.
- Symrise + IBM Research Philyra: Symrise Pressemitteilung und C&EN-Bericht (2018/2019); Philyra-Seite auf symrise.com; Boticario Egeo-Launch (Juni 2019); Haven-Launch-Bericht (Q2 2022 — 11 Wochen von Trend-Erkennung bis Markteinführung).
- Osmo Series B: Business Wire, „Osmo, Digital Scent Design Company, Announces $70M in Series B Funding”, 4. Februar 2026.
- Osmo Generation: Cosmeticsdesign.com, „Osmo launches Generation, world’s first AI-powered fragrance house”, März 2025.
- Pyrfume-Archiv: Gerkin, R.C. et al., „Pyrfume: A window to the world’s olfactory data”, Scientific Data, 11, 1163 (2024). Über 40 Datensätze, open source (doi:10.1038/s41597-024-04051-z).
- Blend-Vorhersage: ACS Omega, „Deep Learning for Odor Prediction on Aroma-Chemical Blends” (2024) — Blend-Interaktionen deutlich schwieriger vorherzusagen als Einzelmoleküle.
- Grenzen der Modelle: Sreenivasan, V. et al., „More than meets the AI: The possibilities and limits of machine learning in olfaction”, Frontiers in Neuroscience, 16:981294 (2022).
- Entwicklungszeiten und Kosten: Branchenangaben aus Perfumer & Flavorist, Advanced Biotech und eigenem Recherche-Stand (Mai 2026). Alle Kostenzahlen sind Schätzwerte — individuelle Projekte variieren erheblich.
Du arbeitest an einem Duftentwicklungsprojekt und willst wissen, ob und wie KI-gestütztes Molekülscreening für euren spezifischen Anwendungsfall sinnvoll ist? Sprich uns an — wir helfen bei der Einschätzung.
Diesen Inhalt teilen:
Interesse an diesem Use Case?
Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.
Weitere Use Cases
KI-Hautanalyse per Smartphone: individuelle Produktempfehlung in Sekunden
Eine KI wertet ein Selfie des Kunden in Echtzeit aus und identifiziert Hauttyp, Problemzonen und Pflegebedarf. Kosmetikstudios und POS-Teams können gezielt empfehlen, ohne lange Beratungsgespräche.
Mehr erfahrenVirtual Try-On: Make-up und Haarfarbe per AR vor dem Kauf simulieren
Kunden sehen per Smartphone- oder Webcam-Feed in Echtzeit, wie ein Lippenstift, eine Foundation oder eine neue Haarfarbe auf ihrem Gesicht wirkt — ohne Tester anzufassen. Onlineshops und Salons mit Eigenmarken senken die Kaufhemmschwelle deutlich.
Mehr erfahrenInhaltsstoff-Compliance automatisieren: CPNP und EU-Kosmetikverordnung
KI prüft Rezepturen automatisch gegen die EU-Kosmetikverordnung (EG Nr. 1223/2009), INCI-Verbotslisten und CPNP-Meldeanforderungen. Für Eigenmarken-Salons und kleinere Kosmetikhersteller ersetzt das stunden-lange manuelle Recherche.
Mehr erfahren