Zum Inhalt springen
Pharmaindustrie drug-discoverymolekueldesignalphafold

Wirkstoffkandidaten per KI-Moleküldesign schneller identifizieren

Generative KI und Graph Neural Networks beschleunigen das virtuelle Screening von Milliarden Molekülkandidaten und optimieren Wirkstoffstrukturen — von der Target-Identifikation bis zur Lead-Optimierung.

⚡ Auf einen Blick
Problem
Traditionelles Drug Discovery dauert 5–10 Jahre, bevor ein Kandidat die präklinische Phase erreicht. Synthetisierung und Screening tausender Verbindungen ist extrem teuer und zeitaufwändig — mit einer Erfolgsquote unter 10 %.
KI-Lösung
KI-Systeme (AlphaFold für Protein-Strukturvorhersage, generative Modelle wie DiffSBDD, Graph Neural Networks) screenen virtuell Milliarden Verbindungen, sagen Bindungsaffinität vorher und generieren neuartige Molekülstrukturen mit gewünschten Eigenschaften.
Typischer Nutzen
Reduktion der Screening-Phase von Jahren auf Monate. Kandidatenauswahl mit höherer Trefferwahrscheinlichkeit. Einsparung von 30–50 % der Synthesekosten im frühen Discovery-Prozess.
Setup-Zeit
12–24 Monate bis valider Betrieb (Daten, Infrastruktur, Expertenwissen)
Kosteneinschätzung
30–50 % weniger Synthesekosten in der Lead-Identifikation
AlphaFold / Boltz-1 / Chai-1 (Proteinstruktur) + DiffSBDD / generative GNN-Modelle + kommerzielle Plattformen (Schrödinger Glide, AutoDock Vina) + Open-Source-Stack (RDKit, DeepChem)
Worum geht's?

Es ist Montag, 8:47 Uhr. Dr. Jana Westphal, Computational Biology Lead bei einem Heidelberger CRO, öffnet die Ergebnisliste des virtuellen Screenings vom Wochenende.

Auf dem Bildschirm: 47 priorisierte Verbindungen aus 500.000 gescreenten Kandidaten. Drei Tage Rechenzeit auf dem GPU-Cluster, AlphaFold-Strukturmodell des Targets, AutoDock Vina für das Docking, DeepChem-ADMET-Classifier für die Nachfilterung. Das Team hat nicht eine einzige Verbindung synthetisiert. Noch nicht.

Vor fünf Jahren hätte Jana für denselben Ausgangspunkt sechs Monate gebraucht — manuelle Literaturrecherche, Bestellung und Testung von Referenzsubstanzen, Hochdurchsatz-Screeningkampagne mit zehntausend echten Substanzen, und trotzdem oft keine besseren Hits als jetzt.

Das ist nicht die Ausnahme. Das ist der neue Standard für jeden CRO und jede pharmazeutische Forschungsabteilung, die versteht, was KI-gestütztes Moleküldesign heute leisten kann — und was es nicht kann.

Das echte Ausmaß des Problems

Drug Discovery ist einer der kapitalintensivsten und risikoreichsten Innovationsprozesse überhaupt. Die Zahlen sind bekannt, aber sie hören nicht auf, zu beeindrucken: Ein durchschnittliches neues Medikament kostet laut DiMasi et al. (2016, Journal of Health Economics) 1,0–2,6 Milliarden USD von der ersten Idee bis zur Zulassung und braucht 10–15 Jahre. Davon entfällt die Discovery-Phase allein — also die Identifikation des Targets, das Screening von Kandidaten und die frühe Lead-Optimierung — auf typisch 3–6 Jahre.

Die Attritionsrate ist das eigentliche Drama. Nur rund 12 % der Verbindungen, die in klinische Phase-I-Studien eintreten, erhalten letztlich eine FDA-Zulassung (PMC-Studie 2024). Phase II hat historisch eine Erfolgsquote von unter 30 %. Das bedeutet: Selbst ein gut selektierter präklinischer Kandidat hat im Erwartungswert nur eine 1-von-8-Chance, jemals Patient zu erreichen.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Wo brennt es konkret?

  • Hit-Identifikation: Aus einer kommerziellen Bibliothek mit Millionen Verbindungen die vielleicht 0,1–1 % echten “Hits” zu finden, die einen spezifischen Target hemmen oder aktivieren — das ist klassischerweise ein Hochdurchsatz-Screening-Problem mit enormem Wet-Lab-Aufwand
  • Lead-Optimierung: Aus einem schwachen Hit einen Kandidaten zu machen, der Wirksamkeit, Selektivität, ADMET-Eigenschaften (Absorption, Distribution, Metabolismus, Exkretion, Toxizität) und synthetische Zugänglichkeit in einer Struktur vereint — oft hunderte Synthesezyklen
  • Target-Validierung: Überhaupt zu verstehen, wie ein Protein aussieht und wo es angreifbar ist — bis 2021 war für Tausende medizinisch relevanter Proteine keine experimentelle Struktur verfügbar

KI greift in alle drei Brennpunkte ein. Aber es gibt klare Grenzen — und der Abschnitt über AlphaFolds Schwächen ist kein Fußnotenhinweis, sondern entscheidend für realistische Erwartungen.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KIMit KI-gestütztem Design
Hit-Identifikation (500.000 Verbindungen)6–18 Monate HTS-Kampagne2–6 Wochen virtuelles Screening
Syntheseaufwand bis erstes LeadHunderte Verbindungen30–70 Verbindungen (Prioritätsliste)
Erfolgsquote Phase I (AI-native Firmen)40–65 %80–90 % (laut PMC-Studie 2024, 39 AI-Firmen)
Gesamtkosten Discovery-Phase (konservativ)50–150 Mio. USD20–80 Mio. USD
Strukturwissen vor DesignstartOft keine experimentelle StrukturAlphaFold/Boltz-1/Chai-1 in Stunden
Attritionsrate insgesamt> 90 %Noch ~90 % (AI verbessert Phase I, nicht Phase II–III)

Die letzte Zeile ist die ehrlichste: KI verbessert nachweisbar die Effizienz der frühen Discovery-Phase und die Phase-I-Erfolgsquote. Die Gesamtattritionsrate — also die Wahrscheinlichkeit, dass ein Kandidat aus dem Labor wirklich zu einem Medikament wird — hat KI bisher nicht transformiert. Phase II scheitert nach wie vor meistens an mangelnder klinischer Wirksamkeit und unvorhergesehener Toxizität im Menschen, und dafür gibt es noch kein KI-Äquivalent zu einem echten Patienten.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Einschätzung auf einen Blick

Zeitersparnis — maximal (5/5) Die Hit-Identifikationsphase schrumpft von Monaten oder Jahren auf Wochen. Das ist kein marginaler Gewinn — es ist die stärkste Zeitersparnis in dieser Kategorie. Insilico Medicine brachte den KI-designten TNIK-Inhibitor ISM001-055 von der Target-Identifikation bis zur Phase I in 30 Monaten (Nature Medicine, 2025) — verglichen mit typisch 4–5 Jahren auf dem konventionellen Weg. Allein die wegfallenden Hochdurchsatz-Screeningkampagnen — keine 500.000 physischen Assays, nur 47 priorisierte Syntheseaufträge — machen diesen Wert zum klarsten Führungswert dieser Branche.

Kosteneinsparung — stark (4/5) 30–50 % weniger Synthesekosten in der frühen Discovery-Phase sind realistisch erreichbar, wenn eine Pipeline konsequent eingesetzt wird. Die Einsparung entsteht primär durch Reduktion der Synthesezyklen bis zum ersten validierten Lead. Schrödinger berichtet in internen Programmen von Verbesserungen der Trefferquote von 15 % auf 40 %+ in der Lead-Optimierung. Aber: Infrastruktur- und Personalkosten für die KI-Pipeline selbst sind erheblich (Computational-Chemistry-Personal, GPU-Cluster, Lizenzen). Das reduziert den Nettovorteil gegenüber einem vollständig ausgelagerten CRO-Modell.

Schnelle Umsetzung — minimal (1/5) Das ist der ehrlichste Score in dieser Bewertung. Eine produktive Drug-Discovery-KI-Pipeline aufzubauen dauert 12–24 Monate — und setzt voraus: Zugang zu Strukturdaten oder validierten AlphaFold-Modellen, einen oder mehrere erfahrene Computational Chemists mit ML-Hintergrund, eine GPU-Infrastruktur (lokal oder Cloud), eine kuratierte interne Assay-Datenbasis für ADMET-Modelle. Wer heute damit anfängt und morgen Kandidaten erwartet, hat das Problem nicht verstanden.

ROI-Sicherheit — niedrig (2/5) Der ROI dieser Investition entscheidet sich erst in Phase-II-Studien — also 5–8 Jahre nach dem Start der KI-Pipeline. Selbst wenn die Discovery-Phase effizienter wird, bleibt die klinische Attritionsrate hoch. Ein Unternehmen, das 2024 eine KI-Drug-Discovery-Pipeline aufbaut, wird ROI frühestens Ende der 2020er-Jahre sehen — wenn überhaupt, denn 90 % der Kandidaten scheitern trotzdem. Das ist kein Argument gegen KI, aber eines gegen kurzfristige ROI-Erwartungen.

Skalierbarkeit — maximal (5/5) Eine einmal eingerichtete und validierte Pipeline ist beliebig auf neue Targets anwendbar. Kein neuer Laboraufbau pro Target, keine neue Infrastruktur pro Programm. Wer die Investition in Expertenwissen und Infrastruktur gemacht hat, kann sie parallel auf fünf oder fünfzehn Programm-Targets anwenden — was für industrielle Pharma und CROs mit mehreren Portfolioprogrammen der entscheidende Multiplikator ist.

Richtwerte — stark abhängig von vorhandener Infrastruktur, Datenbasis und Expertise.

Dieser Abschnitt ist eine wissenschaftliche Orientierung, keine regulatorische oder rechtliche Beratung. Für bindende Anforderungen konsultiere die zuständige Behörde (EMA, BfArM) oder spezialisierte Rechts- und Regulatory-Affairs-Beratung.

Was das System konkret macht — die Pipeline im Detail

KI-gestütztes Moleküldesign ist kein einzelnes Tool, sondern eine Sequenz von Modellen, die aufeinander aufbauen. Hier ist der realistische Pipeline-Ablauf:

Schritt 1: Proteinstruktur bestimmen

Bevor du irgendetwas docken oder designen kannst, brauchst du eine dreidimensionale Struktur deines Zielproteins — und zwar idealerweise mit der Bindungstasche, die du adressieren willst. Drei Wege:

  • Experimentell (Gold Standard): Röntgenkristallographie oder Cryo-EM liefert Strukturen mit atomarer Auflösung. Verfügbar in der Protein Data Bank (PDB). Wenn vorhanden, bevorzuge immer die experimentelle Struktur.
  • AlphaFold 3 (DeepMind/Google): Vorhersage aus der Aminosäuresequenz. Für gefaltete Proteine exzellent (pLDDT > 80). Für Drug-Discovery-Anwendungen gilt: kostenloser Server für Forschung, kommerzielle Nutzung nur über Lizenzvertrag mit Google.
  • Boltz-1 / Chai-1 (Open Source): Beide erreichen vergleichbare Genauigkeit zu AlphaFold 3 und sind MIT- bzw. Apache-2.0-lizenziert — ohne kommerzielle Einschränkungen. Chai-1 läuft auch ohne Multiple Sequence Alignments (MSA-frei), was es für Targets mit wenig evolutionären Daten geeignet macht.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Schritt 2: Virtuelle Bibliothek screenen (Docking)

Docking berechnet, wie gut ein kleines Molekül in die Bindungstasche des Proteins passt und wie stark es binden würde (vorhergesagte Bindungsaffinität in kcal/mol). Zwei grundlegend verschiedene Ansätze:

  • AutoDock Vina: Open Source, schnell, für initiale Bibliotheks-Screens (500.000+ Verbindungen) in Tagen auf einem GPU-Cluster durchführbar. Hohe Falsch-Positiv-Rate, aber als Vorfilter unschlagbar günstig.
  • Schrödinger Glide: Kommerzieller Industriestandard. Präzisere Scoring-Funktion (XP-Glide), Induced-Fit-Docking (Proteinflexibilität), höhere Zuverlässigkeit bei Lead-Optimierung. Lizenz ab ca. 50.000 USD/Jahr für Basismodule.

Schritt 3: Hits mit ML-ADMET-Vorhersage filtern

Docking bewertet nur die Bindung — nicht ob das Molekül überhaupt als Medikament funktionieren kann. ADMET-Vorhersagen (Absorption, Distribution, Metabolismus, Exkretion, Toxizität) filtern Kandidaten nach medizinalchemischen Regeln:

  • RDKit: Open Source, für Lipinski-Regeln, PAINS-Filter (reaktive Interferenz-Gruppen), synthetische Zugänglichkeit (SA-Score). Grundlage jeder industriellen Cheminformatik-Pipeline.
  • DeepChem: Open-Source-Deep Learning-Bibliothek mit vortrainierten Machine Learning-Modellen für hERG-Kanal-Toxizität, Blut-Hirn-Schranken-Penetration, CYP450-Inhibition. Erlaubt auch Training eigener Modelle auf internen Assay-Daten.

Schritt 4: Generative Modelle für neuartige Strukturen (optional, fortgeschritten)

Wenn der Screening-Raum kommerzieller Bibliotheken ausgeschöpft ist oder du Strukturen mit spezifischer Geometrie brauchst, erzeugen generative Modelle de-novo-Kandidaten:

  • DiffSBDD (Nature Computational Science, 2024): Equivariantes Diffusionsmodell für Structure-Based Drug Design. Generiert Liganden, die geometrisch in eine definierte Protein-Tasche passen, mit kontrollierbaren physikochemischen Eigenschaften. Open Source (GitHub: arneschneuing/DiffSBDD).
  • Graph Neural Networks (GNNs): Modellieren Moleküle als Graphen (Atome = Knoten, Bindungen = Kanten). Grundlage aller modernen molekularen Property-Prediction-Modelle in DeepChem. Eine Stärke gegenüber fingerprint-basierten Methoden: GNNs lernen implizit die Topologie des Moleküls, nicht nur vordefinierte Substruktur-Bits.

AlphaFold und seine Grenzen — was du wissen musst

AlphaFold 2 und 3 haben die Strukturbiologie grundlegend verändert. Aber wer damit Drug Discovery betreiben will, braucht ein nüchternes Bild davon, wo die Grenzen liegen.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Intrinsisch ungeordnete Proteine (IDPs) machen 30–40 % des menschlichen Proteoms aus — und sind überproportional an Krebs, Neurodegeneration und Entzündungskrankheiten beteiligt. AlphaFold 3 identifiziert ungeordnete Regionen (niedrige pLDDT-Werte), kann aber deren dynamisches Verhalten nicht vorhersagen. Ein Papier auf arXiv (Oktober 2025) zeigt, dass 18 % der Residuen in biologisch relevanten Prozessbereichen von AlphaFold 3 „halluziniert” werden — eine statisch falsche Struktur, die real aussieht.

Flexible Loops und Konformationsänderungen sind das zweite strukturelle Problem. Viele Bindungstaschen öffnen oder schließen sich erst durch Ligandenbindung (Induced Fit). AlphaFold liefert eine Konformation, nicht das Ensemble. Für Targets, bei denen die Bindungstasche erst durch Ligandenbindung zugänglich wird (z. B. bestimmte GPCR-Klassen), ist das Docking auf eine AlphaFold-Struktur systematisch irreführend.

Allosterische Sites — Bindungsstellen, die nicht am aktiven Zentrum liegen, aber die Proteinaktivität indirekt beeinflussen — werden von AlphaFold nicht identifiziert. Sie erfordern Molekulardynamik-Simulationen oder experimentelle Fragmentscreening-Daten.

Fazit: Nutze AlphaFold-Strukturen als Ausgangspunkt, nicht als Wahrheit. Eine experimentell bestätigte Struktur ist immer besser — plane Kristallographie oder Cryo-EM für valide Targets ein, sobald ein Hit-to-Lead-Programm beginnt.

Konkrete Werkzeuge — was wann passt

Die Pipeline-Wahl hängt von Budget, Expertise und Programm-Phase ab.

Open-Source-Stack (für akademische Gruppen, Startups und frühe Phasen)

Dieser Stack ist kostenlos und für die meisten Hit-Identifikations-Aufgaben ausreichend:

  • Strukturvorhersage: Boltz-1 (MIT-Lizenz) oder Chai-1 (Apache 2.0) — beide ohne kommerzielle Einschränkungen, AlphaFold-3-vergleichbare Genauigkeit
  • Docking: AutoDock Vina — Standard für Hochdurchsatz-Screening, GPU-Beschleunigung mit Vina-GPU
  • Cheminformatik und Präprozessierung: RDKit — unverzichtbares Werkzeug für SMILES-Verarbeitung, Filterung, Fingerprints
  • ADMET und ML-Property-Prediction: DeepChem — GNN-Modelle für Toxizitätsvorhersage, trainierbar auf eigenen Daten
  • Retrosynthese-Planung: IBM RXN for Chemistry — kostenloser Einstieg in KI-gestützte Syntheseplanung

Gesamtlizenzkosten dieses Stacks: null Euro. Infrastrukturkosten: eine oder mehrere NVIDIA-A100-GPUs (Cloud ab ca. 2–4 USD/GPU-Stunde bei AWS/Azure).

Kommerzieller Stack (für industrielle Pharma und CROs mit Optimierungsprogrammen)

  • Strukturbasiertes Design und Lead-Optimierung: Schrödinger (Glide für Docking, FEP+ für Bindungsaffinität, Maestro als Oberfläche) — Industriestandard, ab ca. 50.000 USD/Jahr für Basismodule
  • Automatisierte Synthese: Chemify (Glasgower Spin-off, Robotik-gestützte Synthese, für Pilotprojekte siebenstellig)
  • Formulierungsoptimierung und Retrosynthese: ChemCopilot für Substitutionsvorschläge und regulatorisches Screening

Wann welcher Ansatz

  • Frühe Hit-Identifikation (> 100.000 Verbindungen, klare Budgetrestriktionen) → Open-Source-Stack
  • Lead-Optimierung mit klarem Target und verfügbarer Struktur → Schrödinger FEP+
  • De-novo-Kandidatengenerierung für neuartige Chemotypen → DiffSBDD + DeepChem-Filter
  • Vollautomatisierte Synthese-Pipeline (gut finanziertes Biotech) → Chemify

Datenschutz und Datenhaltung

Drug-Discovery-Daten zählen zum sensibelsten IP-Bestand pharmazeutischer Unternehmen. Die Implikationen für die Tool-Wahl sind erheblich.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Was auf keinen Fall über public APIs gehen sollte:

  • Chemische Strukturen aktiver Lead-Serien (SMILES, InChI, SDF-Dateien)
  • Assay-Daten mit Aktivitätswerten gegen proprietäre Targets
  • Target-Sequenzen oder Struktur-Koordinaten aus nicht-öffentlichen Kristallographie-Daten

Spezifisch für die genannten Tools:

  • AutoDock Vina, RDKit, DeepChem, Boltz-1: Laufen lokal — keine Daten verlassen das eigene System. Das ist der entscheidende IP-Vorteil des Open-Source-Stacks.
  • Chai-1: Web-Interface über US-Server — nur für öffentliche Targets nutzbar. Für IP-sensible Projekte zwingend die lokale Deployment-Variante verwenden.
  • Schrödinger: Lokal oder Hybrid-Cloud. US-Hosting für Cloud-Rechenkapazität, Datenhoheit vertraglich regelbar. Für europäische Pharmaunternehmen muss die Datenverarbeitungsvereinbarung DSGVO-konform ausgestaltet werden.
  • IBM RXN for Chemistry: Kostenlose Web-Plattform läuft über US-Server — keine IP-sensitiven Strukturen eingeben. Enterprise-Variante mit EU-Hosting verhandelbar.

Regulatorische Besonderheit: Strukturdaten aus GxP-geregelten Experimenten (z. B. Kristallstrukturen, die in ein regulatorisches Dossier einfließen) müssen den Qualitätsanforderungen des 21 CFR Part 11 bzw. Annex 11 des EU-GMP-Leitfadens entsprechen. Open-Source-Tools ohne Audit-Trail sind für diese Daten nicht geeignet — hier sind Laborinformations-Management-Systeme (LIMS) mit GxP-Validierung nötig.

Wer externe Cloud-Rechenkapazität nutzt (AWS, Azure, Google Cloud), schließt mit dem Anbieter einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO ab. Für Patentschutz-relevante Daten ist zusätzlich die rechtliche Einschätzung, ob Datenübertragung in Drittstaaten patentrechtlich riskant ist, zu prüfen — das ist kein DSGVO-Thema, sondern IP-Recht.

Was es kostet — realistisch gerechnet

Einmalige Setup-Kosten (Open-Source-Pipeline)

KomponenteKosten
GPU-Infrastruktur (1× NVIDIA A100, Workstation oder Cloud)15.000–25.000 € (einmalig) oder 3–5 €/Stunde Cloud
Computational Chemist (Einstellung, 1 VZÄ)65.000–95.000 € Jahresgehalt
Datenbanklizenzen (Enamine, ChEMBL-Premium, PDB-Zugang)5.000–30.000 €/Jahr
Open-Source-Tools (AutoDock Vina, RDKit, DeepChem, Boltz-1)0 €

Einmalige Setup-Kosten (kommerzieller Stack mit Schrödinger)

KomponenteKosten
Schrödinger Jahreslizenz (Glide + FEP+ Basispaket)ab 80.000 USD/Jahr
GPU-Cluster (lokal oder HPC-Zugang)50.000–200.000 € einmalig
Senior Computational Chemist (1–2 VZÄ)130.000–200.000 €/Jahr

ROI-Überlegung

Ein biochemischer Hochdurchsatz-Screen (HTS) gegen 500.000 Verbindungen kostet — externe CRO-Beauftragung eingeschlossen — typisch 500.000–1.500.000 €. Ein virtuelles Screening derselben Bibliothek kostet auf einer GPU-Infrastruktur, die bereits vorhanden ist, Stunden an Rechenzeit, also faktisch nur noch Infrastruktur- und Personalkosten.

Der Break-even liegt bei dem Moment, wo die Pipeline ihre erste HTS-Kampagne ersetzt. Für ein CRO mit mehreren Programm-Kunden pro Jahr ist das innerhalb von 12–18 Monaten realistisch. Für ein einzelnes kleines Biotech-Unternehmen mit einem einzigen Programm lohnt sich der Aufbau selten — hier ist die Beauftragung eines spezialisierten CRO mit eigener KI-Pipeline wirtschaftlicher.

Drei typische Einstiegsfehler

1. AlphaFold als experimentelle Wahrheit behandeln

Der häufigste und teuerste Fehler: Ein Team baut sein gesamtes virtuelles Screening auf einer AlphaFold-Struktur eines Targets auf, dessen Bindungstasche in Realität flexibel ist oder erst durch Ligandenbindung geöffnet wird. Das Screening liefert Hunderte von “Hits” — die im Wet-Lab-Assay alle inaktiv sind, weil sie an eine falsche Konformation dockten. Gegenmittel: Bei jedem neuen Target zuerst pLDDT-Score der Bindungstasche prüfen. Unter 70? Experimentelle Struktur beschaffen oder zumindest Molekulardynamik-Simulation als Validierung einsetzen.

2. ADMET-Filterung als letzten Schritt behandeln

Viele Teams screenen zuerst eine riesige Bibliothek (Docking), filtern dann Hits nach ADMET. Das ist suboptimal: Wenn 60 % aller Bibliotheks-Verbindungen bereits Lipinski-Verletzungen haben oder PAINS-Strukturen aufweisen, hast du 60 % der GPU-Rechenzeit für Verbindungen verbraucht, die ohnehin nie ein Medikament werden können. Gegenmittel: ADMET-Vorfilterung mit RDKit immer vor dem Docking-Schritt einsetzen. Reduziert die Screening-Bibliothek und verbessert Signal-Rausch-Verhältnis.

3. Die Nass-Labor-Schnittstelle nicht einplanen

Die häufigste Ernüchterung nach dem ersten virtuellen Screening: 47 priorisierte Verbindungen, aber der Synthesechemiker sagt, dass 30 davon nicht synthetisch zugänglich sind oder nur mit 6 Monaten CRO-Auftragssynthese. Das virtuelle Screening hat synthetische Zugänglichkeit nicht ausreichend bewertet. Gegenmittel: SA-Score (Ertl & Schuffenhauer, 2009, implementiert in RDKit) und SYBA-Score als explizite Filter in die Pipeline integrieren. Alternativ: Screening ausschließlich auf kommerziell verfügbaren Bibliotheken (Enamine Stock, Mcule, ChemBridge Stock) — kein Syntheseauftrag nötig, Verbindungen lieferfertig in 1–4 Wochen.

4. Die Pipeline wird gebaut, aber nicht validiert — und dann blind verwendet

Dieses Muster tritt oft nach dem ersten Erfolg auf: Eine Pipeline wurde eingerichtet, liefert Hits, das Team vertraut ihr. Aber die interne Assay-Datenbasis, auf der die ADMET-Modelle trainiert wurden, war auf Klasse-A-Kinase-Inhibitoren spezialisiert — das neue Target ist eine GPCR. Die Property-Vorhersagemodelle haben außerhalb ihrer Trainingsverteilung kein valides Signal mehr. Gegenmittel: Für jedes neue Target-Klasse die ADMET-Modell-Performance auf einer bekannten Referenzverbindungsklasse re-validieren, bevor die Pipeline produktiv eingesetzt wird. Auch wenn es zusätzliche Wochen kostet.

Die Nass-Labor-Schnittstelle — wo In-silico auf Reality trifft

Kein virtuelles Screening ist ein abgeschlossenes Ergebnis. Es ist eine priorisierte Hypothesen-Liste für das Wet Lab. Diese Schnittstelle richtig zu gestalten, entscheidet über die tatsächliche Effizienzgewinnung.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Was das Wet Lab von der In-silico-Pipeline braucht:

  • Nicht nur die Top-N-Verbindungen nach Docking-Score, sondern strukturell diverse Hits: Wenn alle 47 Top-Hits denselben Chemotyp haben und der Synthesechemiker diesen einen Chemotyp für nicht zugänglich erklärt, ist die Prioritätsliste wertlos. Aktive Diversitätsfilterung (Butina-Clustering nach Tanimoto-Ähnlichkeit) gehört in jede Pipeline.
  • Synthetische Zugänglichkeit als harte Constraint, nicht als nachgelagerte Überlegung
  • Docking-Pose als Hypothese zur Kommunikation: Der Synthesechemiker, der einen Hit derivatisieren soll, braucht das Bild des postulierten Bindungsmodus — nicht nur den SMILES-String

Was die In-silico-Pipeline vom Wet Lab braucht:

  • Quantitative Aktivitätsdaten (IC50, Ki, Kd) in standardisierter Form, nicht Tabellen-Kommentare
  • Informationen über Assay-Artefakte (häufige falsch-positive Verbindungsklassen in diesem Assay-Format)
  • Feedback-Schleifen: Welche Hits waren aktiv, welche inaktiv, und gibt es eine erkennbare SAR-Struktur?

Dieser Feedback-Kreis — Wet-Lab-Ergebnisse fließen zurück in ML-Modell-Training — ist der Mechanismus, durch den eine KI-Drug-Discovery-Pipeline mit jedem Programmzyklus besser wird. Wer ihn nicht strukturiert einrichtet, betreibt virtuelle Chemie ohne Lerneffekt.

Was mit der Einführung wirklich passiert — und was nicht

Was passiert:

  • Computational Chemists gewinnen an interner Sichtbarkeit und Einfluss, weil ihre Arbeit jetzt direkt Syntheseentscheidungen steuert — statt als “theoretische Spielerei” zu gelten
  • Die ersten 3–6 Monate sind frustrierend: Strukturdaten sind unvollständig, ADMET-Modelle brauchen Training-Daten, GPU-Infrastruktur läuft instabil, Wet-Lab-Validierung liefert ernüchternde Trefferquoten
  • Nach 12–18 Monaten konsequenter Pipeline-Nutzung zeigt sich der echte Wert: Das Team hat ein institutionelles Gedächtnis aufgebaut (welche Chemotypen gegen welche Targets aktiv sind, welche ADMET-Eigenschaften diese Klasse hat)

Was nicht passiert:

  • Die Pipeline ersetzt erfahrene Medizinalchemiker nicht. Sie beschleunigt die Hypothesenbildung und reduziert den Syntheseaufwand — aber die chemische Intuition, die einen Hit in einen Lead verwandelt, bleibt menschlich.
  • Kandidaten “entstehen aus der KI” nicht ohne weiteres valide. Jeder KI-generierte Kandidat braucht biochemische Primärvalidierung (Bindungsassay, thermische Stabilitätsverschiebung), biophysikalische Charakterisierung (ITC, SPR) und ADMET-Assays, bevor er auch nur in Erwägung gezogen wird, eine Tierstudie zu adressieren.
  • Die Attritionsrate in Phase II und III bleibt hoch. KI verbessert Phase I, nicht die klinische Wirksamkeit im Menschen.

Dieser Abschnitt ist eine wissenschaftliche Orientierung, keine regulatorische oder rechtliche Beratung. Für bindende Anforderungen konsultiere die zuständige Behörde (EMA, BfArM) oder spezialisierte Rechts- und Regulatory-Affairs-Beratung.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Infrastruktur und Daten-AuditMonat 1–2GPU-Setup, Datenbankzugänge, interne Assay-Daten sichten und formatierenInterne Assay-Daten in schlechtem Format — Normalisierung dauert länger als geplant
Pilot-Target (strukturbasiert)Monat 2–6Strukturvorhersage (Boltz-1/AlphaFold), erstes Docking-Screening einer kleinen Bibliothek (10.000 Verbindungen), Wet-Lab-Validierung Top-20-HitsAlphaFold-Struktur hat schlechte pLDDT in Bindungstasche — experimentelle Struktur nötig
Open-Source-Pipeline produktivMonat 6–12Vollständiger RDKit→AutoDock-Vina→DeepChem-Workflow auf 500.000-Verbindungen-Bibliothek, ADMET-Modell-Training auf eigenen DatenADMET-Modell schlechte Performance außerhalb Trainings-Chemotypen — Transfer-Learning evaluieren
Zweite Target-Klasse und GeneralisierungMonat 12–18Pipeline auf zweites Target ausgerollt, Feedback-Schleife aus Wet-Lab eingebaut, interne Datenbasis gewachsenTarget gehört zu IDPs — generative Modelle nötig statt Docking
Kommerzieller Stack (optional)Monat 18–24Schrödinger FEP+ für Lead-Optimization-Phase eines validierten ProgrammsLizenzkosten werden unterschätzt — nur für wirklich weiterentwickelte Programme rechtfertigbar

Häufige Einwände — und was dahintersteckt

„AlphaFold gibt es doch kostenlos — warum brauchen wir eine Pipeline?”

AlphaFold liefert eine Proteinstruktur. Eine Drug-Discovery-Pipeline braucht außerdem: Bibliotheks-Screening (AutoDock Vina), ADMET-Filterung (RDKit/DeepChem), Ergebnis-Analyse und -Dokumentation, Wet-Lab-Feedback-Integration. AlphaFold ist der erste Schritt in einer 5-Schritt-Pipeline, nicht die Pipeline selbst. Außerdem: Für kommerzielle Nutzung gelten für AlphaFold 3 kommerzielle Nutzungsbedingungen — Boltz-1 und Chai-1 haben keine dieser Einschränkungen.

„Das macht alles Insilico Medicine schon besser, warum selbst aufbauen?”

Stimmt — Insilico hat mit ISM001-055 (TNIK-Inhibitor, Nature Medicine 2025) bewiesen, dass voll-integrierte KI-Drug-Discovery-Plattformen funktionieren. Aber Insilico ist eine Plattform-Firma, kein Toollieferant. Wer das eigene Discovery-Know-how behalten will — und das sollte jede Pharma- und Biotech-Firma, die langfristig unabhängig sein will — baut eigene Kompetenz auf. Externe Plattformen können als ergänzende CRO-Dienstleistung sinnvoll sein, ersetzen aber nicht das interne Expertenwissen.

„Unsere Medizinalchemiker wollen das nicht.”

Dieser Einwand erscheint oft, ist aber selten wahr. Erfahrungsgemäß sind es die Medizinalchemiker selbst, die am frustriertesten über Syntheseaufwand für schlechte Kandidaten sind. Was nicht will — und das ist legitim — ist unkritische Übernahme der KI-Outputs ohne chemische Begutachtung. Die richtige Antwort: Die Pipeline als Hypothesengenerator einführen, bei dem die finalen Syntheseentscheidungen immer vom Medizinalchemiker kommen. Die KI sortiert, der Chemiker entscheidet.

Dieser Abschnitt ist eine wissenschaftliche Orientierung, keine regulatorische oder rechtliche Beratung. Für bindende Anforderungen konsultiere die zuständige Behörde (EMA, BfArM) oder spezialisierte Rechts- und Regulatory-Affairs-Beratung.

Woran du merkst, dass das zu dir passt

Diese Pipeline macht Sinn, wenn:

  • Du ein oder mehrere pharmazeutisch relevante Targets mit ausreichender Strukturinformation hast (PDB-Eintrag oder validierbare Sequenz)
  • Du mindestens eine Person mit Computational-Chemistry- oder Bioinformatik-Hintergrund im Team hast oder einstellen kannst
  • Du Zugang zu internen Assay-Daten hast — mindestens 200–300 gemessene Aktivitätswerte als Trainingsbasis für ADMET-Modelle
  • Dein Unternehmen in der Hit-Identifikationsphase ist, nicht in Phase II oder III (dort ist das Kandidaten-Portfolio gesetzt)
  • Du CRO bist oder mehrere Discovery-Programme parallel bedienen willst — der Skalierungsvorteil ist dann am stärksten

Wann es sich (noch) nicht lohnt — drei harte Ausschlusskriterien:

  1. Kein strukturbiologisches oder bioinformatisches Know-how im Haus und kein Budget, es einzukaufen. Eine KI-Pipeline ohne jemanden, der weiß, was pLDDT bedeutet, wofür Lipinski-Regeln stehen und wie man Docking-Ergebnisse interpretiert, produziert Outputs, die niemand kritisch einordnen kann. Das ist gefährlicher als kein Screening — falsch priorisierte Kandidaten kosten Synthesebudget und Zeit. Minimum: eine Person mit Cheminformatik- oder Structural-Biology-Hintergrund.

  2. Kein klares Target oder kein druggable Binding-Site-Hypothese. AlphaFold und Docking setzen voraus, dass du weißt, welches Protein du adressierst und wo am Protein du es tun willst. Phänotypisches Screening (keine Target-Hypothese, einfach mal schauen, was Wirkung zeigt) ist ein anderer Ansatz — und passt schlechter zur struktur-basierten KI-Pipeline. Wer noch in der Targetfindungsphase ist, sollte zuerst die Biologie klären.

  3. Fokus auf Phase-II- oder Phase-III-Kandidaten. Die Pipeline macht Hit-Identifikation und frühe Lead-Optimierung effizienter. Wenn du schon einen Kandidaten in klinischen Studien hast, ist die Discovery-Pipeline das falsche Werkzeug — dort sind Biomarkerentwicklung, Patientenrekrutierung und regulatorische Strategie die richtigen Hebel.

Dieser Abschnitt dient als wissenschaftliche Orientierung — KI-generierte Wirkstoffkandidaten erfordern vollständige präklinische und klinische Prüfung gemäß AMG/ICH-Leitlinien vor jeder Anwendung am Menschen.

Das kannst du heute noch tun

Starte mit einem öffentlichen Target, für das eine experimentelle PDB-Struktur vorliegt. Kein proprietäres IP, kein Datenschutzproblem, kostenlos verfügbar.

Konkreter erster Schritt:

  1. Gehe auf rcsb.org und such dir eine Kinase-Kristallstruktur (z. B. EGFR: PDB 1IEP) — eine der best-charakterisierten Klassen mit viel Validierungsdaten
  2. Installiere AutoDock Vina und RDKit in einem Conda-Environment
  3. Screene 10.000 Verbindungen aus der freien ZINC-Datenbank (zinc.docking.org) — Ergebnis in 2–4 Stunden auf einem normalen Laptop
  4. Vergleiche deine Top-10-Hits mit publizierten Kinase-Inhibitoren aus ChEMBL: Wie viele hast du reproduziert?

Dieser Proof-of-Concept dauert 1–2 Tage und kostet nichts. Er zeigt, ob das Konzept für euer Team funktioniert — bevor du über GPU-Investitionen oder Lizenzen nachdenkst.

Für die Projektplanung und erste interne Kommunikation hilft dieser Prompt:

Prompt: Virtuelle-Screening-Pipeline bewerten
Du bist ein erfahrener Computational Medicinal Chemist mit Expertise in KI-gestütztem Drug Discovery. Ich möchte eine virtuelle Screening-Pipeline für folgendes Target aufbauen: - Target-Protein: [PROTEINNAME UND BESCHREIBUNG] - Verfügbare Strukturinformation: [PDB-ID oder "AlphaFold-Modell pLDDT X"] - Angestrebter Indikationsbereich: [KRANKHEIT / ERKRANKUNGSKLASSE] - Teamgröße Computational Chemistry: [ANZAHL PERSONEN UND EXPERTISE] - Budget für Infrastruktur: [UNGEFÄHRE GRÖSSENORDNUNG] - Zeitrahmen bis zu ersten Wet-Lab-Ergebnissen: [MONATE] Bitte bewerte: 1. Ist dieses Target gut geeignet für struktur-basiertes virtuelles Screening? (Begründung mit pLDDT-Bewertung, Bindungstasche-Druggability, bekannte Einschränkungen) 2. Welchen Pipeline-Stack empfiehlst du für dieses Budget und diese Expertise? (Open-Source vs. kommerziell, spezifische Tool-Auswahl) 3. Welche konkreten Risiken siehst du und welche Validierungsexperimente sollten parallel zur In-silico-Phase geplant werden? 4. Was sind die drei typischen Fallstricke für dieses spezifische Target-Klasse? Antworte konkret und technisch — keine Marketingsprache.
Funktioniert mit Claude, ChatGPT, Gemini
Beispiel-Ausgabe

Mitarbeiter:in

Target: TNIK (TRAF2 and NCK-interacting kinase), idiopathische Lungenfibrose-Indikation. PDB: keine direkte Kristallstruktur, AlphaFold pLDDT 78 in der Kinase-Domäne. Team: 2 Computational Chemists. Budget: 30.000 € für Infrastruktur. Zeitrahmen: 18 Monate bis erste Wet-Lab-Hits.

KI-Assistent

Bewertung TNIK-Kinase für virtuelles Screening: **1. Target-Eignung: gut, mit Einschränkungen** TNIK gehört zur GCK-Kinase-Superfamilie mit konservierter ATP-Bindungstasche. pLDDT 78 in der Kinase-Domäne ist akzeptabel — ATP-Bindungsregion ist üblicherweise gut gefaltet. Kritisch: TNIK hat einen flexiblen C-terminalen Regulatory-Loop (Residuen 310–330), der von AlphaFold wahrscheinlich falsch modelliert wird. Empfehlung: Nur die Kinase-Domäne für Docking verwenden, Regulatory-Loop aus der Bindungstasche heraushalten. **2. Pipeline-Empfehlung für 30.000 €:** - Strukturvorhersage: Boltz-1 (MIT-Lizenz, 0 €) - Docking: AutoDock Vina mit GPU (Cloud: ca. 50 €/Screening-Lauf) - Bibliothek: Enamine REAL-Subset (kommerziell verfügbar, ca. 5.000 €/Zugang) - ADMET: DeepChem mit Kinase-spezifischen Tox21-Modellen (0 €) - GPU: Cloud (AWS p3.2xlarge, ca. 3 €/Stunde) — keine Kapex nötig **3. Kritische Risiken:** - Flexibler Activation-Loop (nicht durch AlphaFold abgedeckt): Molekulardynamik-Simulation (GROMACS, Open Source) nach Docking zur Pose-Validierung einplanen - hERG-Kanal-Liability: Kinase-Inhibitoren haben bekannte hERG-Risiken — frühzeitiges hERG-Screening (in-vitro) parallel planen - TNIK-Isoform-Selektivität: 3 bekannte Spleißvarianten — Selektivitätsprofil gegen MINK1 und MAP4K4 früh im Assay einplanen **4. Typische Fallstricke für GCK-Kinaseklasse:** 1. Planare ATP-Mimetika scoren gut im Docking, sind aber pan-Kinase-Inhibitoren — harte Selektivitätskriterien in den Filter aufnehmen 2. Covalente Inhibitoren (Cys-gerichtete) sind strukturell anders zu evaluieren — standard Docking-Scoring passt nicht 3. Phosphorylierungszustand des Activation-Loops verändert Tasche erheblich — beide Zustände screenen, wenn möglich Zeitplan realistisch: 18 Monate bis valide Hit-Serie ist machbar, wenn das Wet-Lab parallel aufgestellt ist.

Quellen & Methodik

  • Insilico Medicine ISM001-055 (TNIK-Inhibitor, IPF): Nature Medicine, 2025: „A generative AI-discovered TNIK inhibitor for idiopathic pulmonary fibrosis: a randomized phase 2a trial.” Phase IIa zeigte FVC-Verbesserung +98,4 mL vs. −62,3 mL (Placebo). Target-zu-Phase-I-Zeitrahmen: 30 Monate (vs. 4–5 Jahre konventionell). insilico.com/phase1
  • AI Phase-I-Erfolgsquote: PMC, 2024: „From Lab to Clinic: How AI is reshaping drug discovery timelines.” Analyse von 39 AI-nativen Firmen: Phase-I-PoS 80–90 % vs. historisch 40–65 %. pmc.ncbi.nlm.nih.gov/articles/PMC12298131/
  • DiffSBDD (Diffusionsmodell für SBDD): Schneuing et al., Nature Computational Science, Dezember 2024: „Structure-based drug design with equivariant diffusion models.” nature.com/articles/s43588-024-00737-x
  • AlphaFold-3-Halluzinierungen bei IDPs: arXiv:2510.15939v2, Oktober 2025: „Hallucinations in AlphaFold 3 for Intrinsically Disordered Proteins.” 18 % der biologisch relevanten Residuen halluziniert. arxiv.org/html/2510.15939v2
  • Boltz-1: MIT Jameel Clinic, Dezember 2024: „Introducing Boltz-1: Democratizing Biomolecular Interaction Modeling.” Open Source (MIT), AlphaFold-3-vergleichbare Performance auf CASP15. jclinic.mit.edu/boltz-1/
  • Klinische Attritionsrate: DiMasi et al., Journal of Health Economics, 2016 (Grundlage), aktualisiert durch PMC-Analyse 2024: ~12 % FDA-Approval aus Phase-I-Eintritt, Phase-II-PoS ~28,9 %.
  • Schrödinger-Lizenzkosten: Capterra-Marktübersicht 2026, IntuitionLabs.ai-Profil. Ab ca. 50.000 USD/Jahr für Basismodule (Glide). capterra.com/p/207300/Schrodinger/
  • Preisangaben Molecular-Libraries: Enamine, ChEMBL, ZINC-Datenbank — öffentliche Preislisten, Stand Mai 2026.
  • AutoDock-Vina-Benchmarking: MDPI Molecules 2024, „High-Throughput, High-Quality: Benchmarking GNINA and AutoDock Vina for Precision Virtual Screening.” mdpi.com/1420-3049/30/16/3361

Du willst einschätzen, ob euer konkretes Target für eine KI-gestützte Discovery-Pipeline geeignet ist — und welche Pipeline-Architektur dazu passt? Meld dich für ein kurzes technisches Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar