Zum Inhalt springen
Luft- & Raumfahrt verteidigungausschreibungnlp

Verteidigungsausschreibungen: NLP filtert und bewertet Beschaffungsunterlagen automatisch

Verteidigungsbeschaffungen umfassen hunderte Seiten Leistungsverzeichnisse, STANAG-Referenzen und Eignungskriterien. KI-NLP extrahiert Eignungsvoraussetzungen, schätzt Aufwand und bewertet Chancen — in Stunden statt Tagen.

⚡ Auf einen Blick
Problem
Unternehmen wie Diehl Aviation, Rheinmetall oder Hensoldt sichten regelmäßig Dutzende Ausschreibungen (BWB, NATO, OCCAR) auf Relevanz. Ein erfahrener Bid-Manager braucht 2–4 Tage, um eine komplexe Ausschreibung vollständig zu sichten und eine Go/No-Go-Empfehlung zu erstellen. Bei 20–30 Ausschreibungen pro Quartal ist das ein Flaschenhals — profitable Opportunities werden verpasst oder überstürzt bewertet.
KI-Lösung
LLM-basiertes Document Intelligence extrahiert automatisch: Mindestqualifikationen, technische Anforderungen (STANAG, MIL-SPEC), Bewertungskriterien, Fristen, Auftragsvolumen und strategische Passung zum eigenen Portfolio. Ausgabe: strukturierter Steckbrief plus Go/No-Go-Scorekarte.
Typischer Nutzen
Erst-Screening von 2–4 Tagen auf 2–4 Stunden reduzierbar. Bid-Manager können 3× mehr Ausschreibungen qualitativ bewerten. Weniger verpasste Opportunities durch systematisches Monitoring statt Stichproben.
Setup-Zeit
Pilot in 1–2 Tagen: PDF hochladen, Prompt starten — kein IT-Projekt
Kosteneinschätzung
Indirekte Chancenoptimierung, kein direkt messbarer Kostenblock
RAG-System auf eigener Unternehmens-Kompetenzmatrix, LLM-Extraktion (Claude oder GPT-4o), DSGVO-konformes On-Premise-Deployment für sicherheitskritische Inhalte
Worum geht's?

Es ist Montag, 8:14 Uhr.

Sandra Kowalski, Bid-Managerin bei einem Tier-2-Zulieferer für Avionik-Systeme, findet im Postfach eine Benachrichtigung: BWB hat eine neue Ausschreibung veröffentlicht — Lieferfrist Angebot in 28 Tagen. Das Dokument: 312 Seiten. Anhänge: noch einmal 180 Seiten Technische Lastenhefte, STANAG-Referenzen und Eignungsnachweise.

Sandra weiß aus Erfahrung: Allein das Inhaltsverzeichnis zu lesen und die kritischen Abschnitte zu identifizieren dauert einen halben Tag. Dann kommt die eigentliche Analyse: Welche Mindestqualifikationen werden gefordert? Welche Zertifikate muss das Unternehmen nachweisen? Welche technischen Normen gelten? Welche Bewertungskriterien zählen wie viel? Passt das Volumen zu unserer Kapazität? Und die entscheidende Frage: Ist dieses Angebot überhaupt unser Geld wert — oder verlieren wir gegen drei Platzhirsche aus dem Stand?

In dieser Woche liegen noch zwei weitere Ausschreibungen vor ihr. Und die Anbieterliste, die ihr Vertriebsleiter letzte Woche als „dringend zu prüfen” markiert hat, umfasst neun weitere potenzielle Quellen.

Das ist kein Ausnahmefall. Das ist der Alltag jedes Verteidigungszulieferers, der nicht unter den ersten fünf am Markt ist.

Das echte Ausmaß des Problems

Wer noch nie eine NATO-konforme Ausschreibung oder ein BWB-Leistungsverzeichnis aufgeschlagen hat, unterschätzt systematisch den Analyseaufwand. Diese Dokumente sind nicht nur lang — sie sind strukturell heterogen, verweisintensiv und absichtlich präzise. Ein einziges STANAG-Kürzel auf Seite 47 kann dazu führen, dass dein Unternehmen nicht qualifiziert ist. Ein Bewertungskriterium auf Seite 289 kann bestimmen, dass technische Lösungskompetenz nur mit 15 Prozent gewichtet wird, während Preis 60 Prozent bekommt — was deine Kalkulation komplett anders aussehen lässt.

Laut einer Analyse von Steerlab.ai zur tatsächlichen Kostenstruktur von Ausschreibungsantworten liegt der durchschnittliche Aufwand für das Lesen und Auswerten eines komplexen Leistungsverzeichnisses bei 40–120 Stunden Team-Aufwand — je nach Komplexität. Schon für das erste Screening, also die Frage „Bewerben wir uns überhaupt?”, kommen erfahrene Bid-Manager auf 2–4 Personentage. Bei einem mittelgroßen Verteidigungszulieferer mit 20–30 relevanten Ausschreibungen pro Quartal bedeutet das: 40–120 Personentage pro Quartal allein für das Erst-Screening — bevor das erste Wort eines Angebots geschrieben wurde.

Das hat drei Folgen:

  • Verpasste Opportunities: Bei diesem Aufwand können Teams nur einen Bruchteil der theoretisch relevanten Ausschreibungen überhaupt in Betracht ziehen. Vieles fällt durchs Raster — nicht weil es nicht gepasst hätte, sondern weil die Kapazität für die erste Sichtung fehlte.
  • Überstürzte Go/No-Go-Entscheidungen: Wenn die Zeit fehlt, wird die Entscheidung vom Bauchgefühl und vom Titel der Ausschreibung getrieben — nicht von einer gründlichen Analyse der Bewertungskriterien.
  • Fachkräfteverschleiß: Erfahrene Bid-Manager verbringen einen erheblichen Teil ihrer Arbeitszeit mit Dokumentenstrukturierung statt mit strategischer Analyse. Das ist weder wirtschaftlich noch motivierend.

Procurement Sciences AI (PSci.AI), ein US-amerikanischer Anbieter von KI-gestütztem Bid-Management für Verteidigungsaufträge, hat in Kundenstudien gezeigt, dass der Einsatz von NLP-gestützter Ausschreibungsanalyse die Zeit für das RFP-Screening (sogenanntes „RFP Shredding”) um bis zu 90 Prozent reduziert — Compliance-Matrizen entstehen in Sekunden statt in Stunden.

Mit vs. ohne KI — ein ehrlicher Vergleich

KennzahlOhne KI-UnterstützungMit NLP-Ausschreibungsanalyse
Zeit für Erst-Screening je Ausschreibung2–4 Personentage2–4 Stunden
Ausschreibungen je Quartal vollständig analysierbar5–10 (bei 2 Bid-Managern)20–40
Risiko, eine Schlüsselanforderung zu übersehenHoch — abhängig von LesesorgfaltNiedrig — strukturierte Extraktion
Einheitlichkeit der BewertungsgrundlageVariiert je Bid-ManagerStandardisiertes Scorecard-Format
Zeit bis zur ersten Go/No-Go-Empfehlung2–3 TageGleicher Tag
Qualität der NormenreferenzverknüpfungExpertenwissen nötigAutomatisch extrahiert

Die Zahlen für die linke Spalte basieren auf Erfahrungswerten aus Praxisberichten und der Steerlab-Analyse. Rechte-Spalte-Werte: Angaben aus Pilotprojekten mit LLM-gestützter Dokumentenanalyse bei Unternehmen mit 30–200 Mitarbeitenden im Verteidigungsbereich; keine repräsentative Studie, aber konsistente Beobachtungen.

Einschätzung auf einen Blick

Zeitersparnis — sehr hoch (5/5)
Die Reduktion von 2–4 Personentagen auf 2–4 Stunden je Ausschreibung ist der stärkste Zeithebel in dieser Kategorie. Das ist keine Optimierung am Rand — es ist ein Faktor 5 bis 10. Wer heute acht Ausschreibungen pro Quartal schafft, kann denselben Aufwand für 40–50 einsetzen. Dieser Effekt setzt sofort ein, sobald der erste Prompt läuft — kein Warten auf Modelltraining, keine Einführungsphase von Monaten.

Kosteneinsparung — niedrig (2/5)
Es gibt keine direkt messbaren Kostenblöcke, die durch diesen Ansatz reduziert werden. Das Tool ersetzt keine Stelle, es multipliziert die Kapazität. Die wirtschaftliche Wirkung liegt in der Angebotsseite: Mehr Ausschreibungen geprüft → potenziell mehr Angebote eingereicht → potenziell mehr Aufträge gewonnen. Das ist real, aber keine Kosteneinsparung im buchhalterischen Sinn — anders als etwa bei einer automatisierten Wartungsdokumentation, bei der der Fehleraufwand direkt sinkt.

Schnelle Umsetzung — sehr hoch (5/5)
Das ist der Ausreißer in dieser Kategorie, der diesen Anwendungsfall von fast allen anderen unterscheidet: Du kannst heute noch beginnen. Öffne Claude oder ChatGPT, lade ein nicht-klassifiziertes Ausschreibungs-PDF hoch, füge den Prompt aus diesem Artikel ein, und du hast in 15 Minuten das erste strukturierte Erst-Screening. Kein IT-Projekt, kein Azure-Setup, kein Anbieter-Gespräch. Die vollständig ausgebaute Variante mit eigener Kompetenzmatrix, automatisiertem Monitoring und strukturierter Scorecard-Ausgabe braucht 4–6 Wochen — aber der Pilot läuft in ein bis zwei Tagen. Kein anderer Anwendungsfall in dieser Kategorie hat diese Einstiegsgeschwindigkeit.

ROI-Sicherheit — niedrig (2/5)
Die Kausalität zwischen „mehr Ausschreibungen analysiert” und „mehr Aufträge gewonnen” ist real, aber indirekt und schwer zu isolieren. Ob ein Angebot gewonnen wird, hängt von Preis, Technik, Beziehungen und Wettbewerb ab — nicht davon, ob das Screening schneller war. Du wirst nie mit Sicherheit sagen können: „Dieser Auftrag kam, weil wir die Ausschreibung zehn Tage früher analysiert haben.” Was du messen kannst: Anzahl analysierter Ausschreibungen, Qualität der Go/No-Go-Entscheidungen, Angebotsquote. Den ROI direkt in Euro zuzuordnen, bleibt schwierig.

Skalierbarkeit — hoch (4/5)
Jede neue Ausschreibungsquelle — DTAD, TED, service.bund.de, NATO NSPA-Portal — lässt sich ohne Mehraufwand in den Workflow einbinden. Das System wächst mit dem Ausschreibungsvolumen. Nicht ganz maximal bewertet, weil Prompt-Engineering bei sehr unterschiedlichen Ausschreibungsformaten (VOL/A vs. VS-RICHTLINIE, MIL-STD-810 vs. NATO-AQAPs) gelegentlich Format-spezifische Anpassungen braucht.

Richtwerte — stark abhängig von Ausschreibungsvolumen, Dokumentenkomplexität und technischer Umsetzungstiefe.

Was der Ausschreibungsassistent konkret macht

Der technische Ansatz verbindet zwei Komponenten: ein LLM für semantisches Verstehen und optionale eigene Dokumente als Vergleichsbasis (RAG — Retrieval-Augmented Generation).

Schritt 1: Strukturierte Extraktion
Das System liest das Ausschreibungsdokument und extrahiert systematisch folgende Informationsklassen:

  • Formale Eignungsvoraussetzungen (Umsatzschwellen, Zertifikate, Zulassungen — z. B. ISO 9001, EN 9100, ITAR-Compliance)
  • Technische Anforderungen und referenzierte Normen (STANAG, MIL-SPEC, AQAPs, DIN EN)
  • Bewertungskriterien und deren Gewichtung (Preis, Technik, Liefertreue, Qualitätsnachweise)
  • Fristen (Angebotsfrist, Lieferfrist, Zahlungsbedingungen)
  • Auftragsvolumen, Losaufteilung, Optionen

Schritt 2: Strategische Bewertung gegen eigene Kompetenz
In der ausgereifteren Variante vergleicht das System die extrahierten Anforderungen mit einer eigenen Kompetenzmatrix — welche Zertifikate hat das Unternehmen, welche Normen sind abgedeckt, welche Fertigungskapazitäten existieren. Die Ausgabe: ein Passung-Score und eine Liste der Lücken.

Schritt 3: Strukturiertes Erst-Screening
Ausgabe ist kein weiteres Textdokument, das gelesen werden muss, sondern eine strukturierte Scorecard:

  • Formale Mindestanforderungen: erfüllt / nicht erfüllt / unklar
  • Technische Fit-Bewertung auf einer Skala
  • Aufwandsschätzung für das vollständige Angebot
  • Empfehlung: Go / No-Go / Rückfragen klären

Was das System nicht kann: Dich ersetzen. Die Bewertung strategischer Prioritäten, die Einschätzung des Wettbewerbs, die Risikoabwägung bei einem knappen Angebot — das bleibt Menschenarbeit. Was es abnimmt: das Lesen von Seite 1 bis 312, das Strukturieren der Anforderungen und das Erstellen der ersten Vergleichsbasis.

Die Bid/No-Go-Scorekarte — was das System liefert

Der entscheidende Schritt nach der Extraktion ist die Ausgabe in einer Form, die deinem Bid-Manager und deiner Geschäftsführung tatsächlich hilft. Eine gute Scorecard aus der NLP-Analyse enthält:

Formale Hürden (Hard Gates)
Diese Liste ist binär: entweder ihr erfüllt das Kriterium oder nicht. Beispiele: Mindestumsatz 50 Mio. Euro, gültige EN 9100 Zertifizierung, VS-Sicherheitsüberprüfung für Mitarbeitende, Nachweise nach AQAP-2110. Wenn ein Hard Gate nicht erfüllt ist, ist die Analyse vorbei — kein Angebot.

Technischer Fit-Score
Ein 1-10 Score auf Basis des Abgleichs extrahierter technischer Anforderungen gegen eure Kompetenzmatrix. Score 8–10: Ihr seid der natürliche Bieter. Score 5–7: Ihr könntet, es braucht Partnerschaften oder Erklärungen. Score unter 5: Nächste Ausschreibung.

Wettbewerbs-Hinweise
Hat das System Hinweise auf Single-Source-Tendenzen gefunden (z. B. sehr spezifische Normenreferenzen, die nur ein Anbieter erfüllt)? Wurden frühere Auftragnehmer im Dokument erwähnt? Ist der Zeitrahmen unrealistisch kurz — ein Indikator für einen de facto vorher festgelegten Gewinner?

Aufwands-Schätzung
Wie umfangreich ist das Angebot, das erwartet wird? Ein 50-seitiges Technical Volume oder ein 300-seitiges? Nachweise, die erst beschafft werden müssen? Diese Einschätzung hilft bei der Entscheidung, ob sich der Aufwand angesichts des Auftragsvolumens überhaupt rechnet.

Offene Fragen für die Bieterkommunikation
Welche Anforderungen sind unklar formuliert? Wo solltest du vor Angebotserstellung Klärung beim Auftraggeber einfordern?

Konkrete Werkzeuge — was wann passt

Die Entscheidung für den richtigen Ansatz hängt vor allem davon ab, wie sensibel eure Ausschreibungsunterlagen sind. Der Grundsatz: Für nicht-klassifizierte, öffentlich zugängliche Ausschreibungen (TED, DTAD, service.bund.de) gibt es günstige und schnelle Wege. Für eingestufte Unterlagen oder ITAR-relevante Dokumente sind völlig andere Anforderungen zu erfüllen.

Soforteinstieg ohne Setup
Claude und ChatGPT Plus erlauben das direkte Hochladen von PDFs und können mit einem guten Prompt in Minuten ein strukturiertes Erst-Screening liefern. Für nicht-klassifizierte Ausschreibungen mit bis zu ~200 Seiten ist das der schnellste Weg zum ersten Ergebnis. Claude ist bei langen Dokumenten mit komplexen Querverweisen erfahrungsgemäß etwas konsistenter als GPT — das 200.000-Token-Kontextfenster erlaubt es, auch große Leistungsverzeichnisse vollständig zu verarbeiten. Kosten: 20–30 Euro/Monat pro Nutzer. Kein EU-Hosting, kein AVV — nur für öffentliche, unkritische Unterlagen geeignet.

Für Teams mit EU-Datenhostingpflicht
Langdock (Berliner Anbieter, EU-Hosting auf Azure Frankfurt, ISO 27001, SOC 2 Type II) ist der pragmatischste Weg für ein kleines Bid-Team, das mehrere LLMs EU-konform nutzen will. Bid-Manager laden Ausschreibungs-PDFs hoch, nutzen einen vorkonfigurierten Assistenten mit dem Screening-Prompt und bekommen das strukturierte Erste-Sichtungs-Ergebnis in unter 30 Minuten. Langdock bietet Assistenten-Builder ohne Coding — der Prompt wird einmal eingerichtet, das Team nutzt ihn danach aus dem Interface. Kosten: ab 25 Euro/Nutzer/Monat.

meinGPT bietet vergleichbare Funktionalität mit Hosting in Deutschland (ISO 27001) und ist besonders geeignet, wenn das Unternehmen gleichzeitig ein firmenweit rollbares KI-Tool sucht — nicht nur für das Bid-Team, sondern für alle Abteilungen. Kosten: 29 Euro/Nutzer/Monat.

Für komplexe technische Ausschreibungen mit hohem Volumen
tendric.ai ist eine spezialisierte deutsche Tender-Intelligence-Plattform, die speziell für Ausschreibungen mit hunderten Anforderungen und Normenreferenzen gebaut wurde. tendric erkennt automatisch alle technischen Anforderungen, verknüpft DIN EN / ISO / STANAG-Referenzen mit internen Dokumenten und verteilt Review-Aufgaben an die Fachabteilungen. Das ist deutlich mehr als ein LLM mit Prompt — es ist ein Workflow-System für Teams, die Dutzende solcher Ausschreibungen im Jahr bearbeiten. Preise auf Anfrage, Demo nötig.

Für souveräne Deployments ohne Cloud
Aleph Alpha (PhariaAI) ermöglicht On-Premise-Deployment eines deutschen LLM — relevant für Unternehmen, die mit eingestuften Unterlagen oder hochsensiblen Informationen arbeiten müssen und keine Cloud-Anbindung tolerieren. Technisch anspruchsvoll, deutlich teurer, aber die einzige seriöse Option für Geheimschutzumgebungen. Preise auf Anfrage, typisch mittlerer bis hoher sechsstelliger Bereich jährlich.

Kostenloser Einstieg zum Testen
NotebookLM (Google, kostenlos) erlaubt das Hochladen von PDFs und ermöglicht strukturierte Abfragen. Gut für einen allerersten Test, ob das Konzept für eure Ausschreibungstypen funktioniert. Einschränkung: Datenverarbeitung in den USA, kein AVV — nur für öffentliche Ausschreibungsunterlagen geeignet, nie für VS-NfD oder eingestufte Unterlagen.

Zusammenfassung: Wann welcher Ansatz

  • Erstes Testen mit öffentlichen Ausschreibungen → Claude oder NotebookLM
  • Team-Rollout mit EU-Hosting und AVV → Langdock oder meinGPT
  • Hohe Ausschreibungszahl mit Normenreferenzen und Workflow-Verteilung → tendric.ai
  • Eingestufte oder ITAR-relevante Unterlagen → Aleph Alpha On-Premise

Sicherheitsklassifikation und Exportkontrolle

Das ist der Abschnitt, den die meisten KI-Leitfäden für Verteidigungszulieferer weglassen — und genau deshalb ist er hier.

Dieser Abschnitt ist eine fachliche Orientierung, keine Rechts- oder Exportkontrollberatung. ITAR/EAR-Anforderungen, Verschlusssacheneinstufungen und NATO-Sicherheitsakkreditierungen erfordern Fachberatung durch einen qualifizierten Exportkontroll-Compliance-Officer.

ITAR, EAR und die KI-Falle
Viele Verteidigungszulieferer betreiben Dokumenten-Repositories, in denen sich unkontrolliert kontrollierte technische Daten angesammelt haben: ITAR-pflichtige US-Technologiedaten, EAR-pflichtige Dual-Use-Informationen und unklassifizierte Unterlagen — im selben Ordner. Wenn du ein LLM-System auf diesen Bestand losgehen lässt, ohne vorher eine sorgfältige Datensegregation vorgenommen zu haben, riskierst du nach US-Recht einen „deemed export” — die unbeabsichtigte Weitergabe kontrollierter Daten an einen nicht autorisierten Empfänger, auch wenn dieser Empfänger ein KI-Modell in einem Cloud-Rechenzentrum ist.

Kiteworks hat in einer Analyse zu ITAR-Konformität und KI-Agenten darauf hingewiesen, dass „Shared Files, Cloud-Storage-Zugriff, Collaboration-Tools und KI-Prompts alle unbeabsichtigte Exporte kontrollierter technischer Daten auslösen können.” ITAR-Verstöße sind mit Zivilstrafen von bis zu 1 Million US-Dollar pro Verstoß bewehrt — ohne Vorsatzerfordernis.

Was das konkret für dein NLP-Projekt bedeutet:

  • Führe vor dem Rollout eine Klassifizierung deines Dokumentenbestands durch: Was ist unkritisch (öffentlich zugängliche Ausschreibungen), was ist intern sensibel (eigene Angebote), was ist kontrolliert (ITAR-Anhang, technische Spezifikationen mit US-Export-Kontrollkennzeichnung)?
  • Verwende für nicht-klassifizierte, öffentliche Ausschreibungsunterlagen Cloud-LLMs — das ist unkritisch
  • Für eigene technische Dokumente, die als Vergleichsbasis dienen sollen (die Kompetenzmatrix): prüfe mit deinem Compliance-Officer, ob diese Unterlagen kontrollierte Daten enthalten
  • Für eingestufte Unterlagen (VS-NfD aufwärts): kein Cloud-LLM, kein EU-Cloud-Anbieter — nur On-Premise in einem akkreditierten Umfeld

Geheimschutz und NATO-Akkreditierung
VS-NfD-Unterlagen dürfen nach deutschen Geheimschutzvorgaben nur auf akkreditierten Systemen verarbeitet werden. Das schließt alle gängigen Cloud-LLMs aus — auch wenn sie in Deutschland hosten. Die Verarbeitung dieser Unterlagen mit KI erfordert entweder:

  • Ein behördlich akkreditiertes On-Premise-System, oder
  • Einen Dienstleister mit entsprechender Geheimschutzzulassung

Für die überwiegende Mehrheit der öffentlich zugänglichen BWB/NATO-Ausschreibungen, die auf Portalen wie TED, DTAD oder service.bund.de veröffentlicht werden, gelten diese Einschränkungen nicht — diese sind nach Definition nicht eingestuft und können mit Standard-LLM-Tools analysiert werden. Das Problem entsteht erst, wenn du eigene technische Unterlagen als Kontext hinzufügst oder wenn die Ausschreibungsunterlagen selbst eingestuft sind, was bei EU-Restrikted und höher der Fall sein kann.

Datenschutz und Datenhaltung

Nicht alle Ausschreibungsanalyse-Inputs sind gleich. Es gibt drei Kategorien:

Kategorie 1 — Öffentliche Ausschreibungsunterlagen
Öffentlich veröffentlichte Ausschreibungen (TED, DTAD, service.bund.de, NATO NSPA) sind per Definition nicht vertraulich. Ihr Hochladen in ein Cloud-LLM ist aus DSGVO-Sicht unproblematisch, solange keine personenbezogenen Daten enthalten sind. Für diese Kategorie können alle genannten Tools verwendet werden.

Kategorie 2 — Eigene Unternehmensdaten als Kontext (Kompetenzmatrix)
Wenn ihr eigene Zertifikate, Referenzlisten, technische Fähigkeitsbeschreibungen als Kontext hinzufügt, handelt es sich um interne Unternehmensdaten. Hier gilt: AVV mit dem Anbieter abschließen, EU-Hosting bevorzugen, keine US-Cloud ohne expliziten DSGVO-Rechtfertigungsrahmen. Langdock, meinGPT und Azure OpenAI Service in der EU-Region sind hier geeignet.

Kategorie 3 — Eingestufte oder kontrollierte Unterlagen
Hier gelten die Regeln aus dem Abschnitt „Sicherheitsklassifikation und Exportkontrolle” — keine Cloud, nur akkreditierte On-Premise-Systeme.

Wer einen RAG-Ansatz mit eigener Wissensbasis plant, muss einen Auftragsverarbeitungsvertrag (AVV) nach Art. 28 DSGVO mit dem gewählten Anbieter abschließen. Langdock, meinGPT und Azure OpenAI Service bieten AVV standardmäßig an. Das ist keine bürokratische Formsache — es ist Pflicht, bevor ihr Unternehmensdaten in fremde Systeme ladet.

Was es kostet — realistisch gerechnet

Sofort-Einstieg (Prompt-Only, kein IT-Projekt)

  • Claude Pro oder ChatGPT Plus: 20–30 Euro/Monat je Bid-Manager
  • Einrichtungsaufwand: 1–2 Tage Prompt-Engineering intern
  • Gesamteinstieg für zwei Bid-Manager: unter 100 Euro/Monat

Mittelstufe (Team-Rollout mit EU-Hosting)

  • Langdock Business oder meinGPT für 3–5 Bid-Manager: 75–145 Euro/Monat
  • Einrichtungsaufwand: 1–2 Wochen (Assistenten konfigurieren, Kompetenzmatrix aufbauen, Prompt testen)
  • Einmalig: 0–2.000 Euro für interne Projektbegleitung

Vollausbau mit Tender-Intelligence-Plattform

  • tendric.ai: Preise auf Anfrage, Demo erforderlich; für 20+ Ausschreibungen/Quartal typischerweise wirtschaftlich
  • Aleph Alpha On-Premise: ab mittlerem sechsstelligen Bereich jährlich — nur für Sonderfälle mit strikten Geheimschutzanforderungen

Was du dagegenrechnen kannst
Wenn zwei Bid-Manager je 3 Personentage pro Woche einsparen (realistisches Potenzial bei 5–8 Ausschreibungen/Woche), entspricht das bei einem Bruttostundensatz von 50–80 Euro: 2.400–3.840 Euro wöchentlicher Zeitgewinn. (Orientierungswert für Fachkräfte im Ingenieurbereich angelehnt an Branchengehälter; variiert stark nach Region und Qualifikation.) Selbst im konservativen Szenario mit 50 Prozent dieses Effekts amortisiert sich jedes der genannten Tools innerhalb von Tagen, nicht Monaten.

Hinzu kommt der indirekte Wert: Wenn ihr durch systematisches Screening drei Ausschreibungen mehr pro Quartal ernsthaft evaluieren könnt und eine davon zu einem Auftrag führt — bei typischen Verteidigungsauftragsvolumen von 500.000 bis mehreren Millionen Euro ist das eine erhebliche Größenordnung.

Typische Einstiegsfehler

1. Klassifizierte und nicht-klassifizierte Unterlagen nicht trennen
Der häufigste und gefährlichste Fehler: Der Prompt wird einfach auf alles losgelassen, was im Netzlaufwerk liegt — ohne zu prüfen, ob dabei kontrollierte technische Daten in die Cloud übertragen werden. Lösung: Immer mit einer klaren Dokumentenklassifizierung starten. Was ist öffentlich? Was ist intern? Was ist kontrolliert? Erst dann Tool-Auswahl treffen.

2. Den Prompt zu generisch halten
„Fasse diese Ausschreibung zusammen” liefert eine Zusammenfassung. Was du brauchst, ist eine strukturierte Extraktion mit definierten Ausgabe-Kategorien. Ohne explizite Anweisung, welche Informationsklassen extrahiert werden sollen, fehlen in der Ausgabe regelmäßig die kritischen Details — z. B. Eignungsvoraussetzungen in Anhängen, die vier Ebenen tief verschachtelt sind. Der Prompt aus dem nächsten Abschnitt löst dieses Problem.

3. Nur die Hauptdokumente analysieren, Anhänge ignorieren
Leistungsverzeichnisse nach NATO-Standard haben oft kritische Anforderungen ausgelagert — in Technische Lastenhefte, Qualitätssicherungsvereinbarungen (AQAP), Sicherheitsanforderungen oder spezifische Normenblätter als Anlagen. Ein LLM, das nur das Hauptdokument liest, übersieht systematisch alles in den Anhängen. Das ist nicht nur ein Qualitätsproblem — es ist das Risiko einer formalen Disqualifikation. Lösung: immer alle Anhänge einbeziehen, die die Ausschreibung enthält.

4. Das Ergebnis nicht gegenchecken
KI-Systeme können auch bei strukturierten Extraktionen relevante Anforderungen übersehen oder falsch zuordnen — insbesondere bei ungewöhnlichen Dokumentenstrukturen oder mehrdeutigen Formulierungen. Ein Bid-Manager, der das Ergebnis ungeprüft übernimmt, hat die Fehlergefahr nicht reduziert, sondern nur verschoben. Die Regel lautet: Das KI-Screening ersetzt den Erst-Read, nicht den Expertenblick auf die kritischen Passagen. Wer die Top-5-Anforderungen der Scorecard nicht mit dem Original-Dokument abgeglichen hat, hat die Analyse noch nicht abgeschlossen.

5. Keinen Wartungs-Owner für Prompt und Kompetenzmatrix festlegen
Prompts veralten, wenn sich Ausschreibungsformate ändern. Kompetenzmatrizen veralten, wenn neue Zertifikate hinzukommen oder verfallen. Ohne eine namentlich benannte Person, die diese Basisdaten pflegt, produziert das System nach 12 Monaten falsche oder veraltete Empfehlungen — ohne dass irgendjemand es merkt.

Was mit der Einführung wirklich passiert — und was nicht

Die technische Einrichtung ist überraschend einfach. Was unterschätzt wird: Der kulturelle Widerstand im Bid-Team selbst.

Erfahrene Bid-Manager haben über Jahre ein mentales Modell entwickelt, wie sie Ausschreibungen einschätzen — Muster, Signale, Bauchgefühl. Ein System, das eine Scorekarte in 30 Minuten ausspuckt, wirkt nicht wie Unterstützung, es wirkt wie Infragestellung. „Das Tool versteht doch gar nicht, was es bei dieser Ausschreibung wirklich ankommt” — das ist keine irrationale Reaktion, das ist professioneller Selbstschutz.

Was hilft: Das Tool als Dokumentations- und Konsistenz-Werkzeug positionieren, nicht als Entscheidungsersatz. Die Scorekarte strukturiert, was sonst im Kopf bleibt. Sie macht die Go/No-Go-Empfehlung nachvollziehbar für die Geschäftsführung, reproduzierbar für neue Bid-Manager, und überprüfbar im Nachgang. Die strategische Beurteilung bleibt Menschenarbeit.

Widerstandsmuster, die typischerweise auftreten:

Der Bid-Manager, der seit Jahren auf Bauchgefühl und Erfahrung baut, wird das erste fehlerhafte Ergebnis des Systems als Beweis nehmen, dass es nicht funktioniert. Das System wird Fehler machen — besonders in den ersten Wochen, wenn der Prompt noch nicht auf eure spezifischen Ausschreibungstypen kalibriert ist. Lösung: In den ersten vier Wochen jedes KI-Screening mit einem manuellen Spot-Check einer der wichtigsten Anforderungskategorien begleiten. Wenn das System Recht hat: ausweisen. Wenn es falsch liegt: Prompt anpassen. Das schafft Vertrauen durch Transparenz, nicht durch Behauptung.

Die Abteilung, die die Scorecard bekommen soll (Geschäftsführung, Vertrieb), wird schnell anfangen, nach Shortcuts zu fragen: „Kannst du die Analyse nicht direkt schicken, ohne dass jemand nochmal drüber schaut?” Nein. Die Go/No-Go-Empfehlung des Systems ist ein Input, kein Output. Wer das nicht klar kommuniziert, schafft einen Haftungsfall: Das Unternehmen bewirbt sich auf eine Ausschreibung, die es formal disqualifiziert — und niemand hat den automatischen Fehler bemerkt, weil niemand mehr überprüft hat.

Realistischer Zeitplan mit Risikohinweisen

PhaseDauerWas passiertTypisches Risiko
Pilot-Setup1–2 TagePrompt bauen, drei öffentliche Ausschreibungen testen, Ausgabeformat definierenErster Test auf einer ungeeigneten Ausschreibung — wähle für den Pilot einen typischen, nicht extremen Fall
Prompt-KalibrierungWoche 1–2Prompt auf eure häufigsten Ausschreibungstypen schärfen (BWB, NATO, OCCAR), Kategorien anpassen, Fehler dokumentierenZu viele Kategorien auf einmal — fang mit 5–7 Kernkategorien an, nicht mit 25
Kompetenzmatrix aufbauenWoche 2–4Eigene Zertifikate, Referenzen, technische Fähigkeiten strukturiert erfassen (nur unkritische Daten!)Klassifizierungskonflikt — bevor ihr interne Dokumente hinzufügt, Compliance-Officer fragen
Pilot-BetriebWoche 3–6Echtbetrieb mit echter Ausschreibung, Go/No-Go-Empfehlung parallel zu manueller Analyse, Abweichungen dokumentierenBid-Manager-Widerstand wenn System falsch liegt — offen dokumentieren und Prompt verbessern statt System verwerfen
Rollout auf weiteren Bid-ManagerWoche 6–8Weiteres Team-Mitglied einführen, Prozess standardisieren, Scorecard-Format finalisierenIndividualisierung durch jeden Nutzer — Standards früh festlegen, sonst kein Vergleich über Ausschreibungen
Optionaler VollausbauAb Monat 3RAG auf eigener Kompetenzmatrix, automatisiertes Monitoring neuer Ausschreibungsquellen, Workflow-Integration in ProjektmanagementsystemTechnisches Schulden aufbauen — saubere Architektur lohnt sich hier, auch wenn es Wochen kostet

Häufige Einwände — und was dahintersteckt

„Die Anforderungen in Verteidigungsausschreibungen sind zu komplex für KI.”
Das stimmt teilweise — und genau deshalb ist der richtige Anspruch wichtig. KI ersetzt nicht das Urteilsvermögen eines erfahrenen Bid-Managers. Sie strukturiert und extrahiert. Ein LLM, das 312 Seiten in 30 Minuten nach definierten Kategorien durchsucht, macht dabei Fehler — genauso wie ein Mensch, der müde am Ende des dritten Lesetages ist. Die Frage ist nicht „null Fehler”, sondern: Wie hoch ist die Fehlerrate im Vergleich zur manuellen Alternative, und wie werden die kritischen Fälle abgesichert? In der Praxis zeigt sich: Für die Identifikation formaler Eignungsvoraussetzungen, Normenreferenzen und Bewertungskriterien ist die strukturierte LLM-Extraktion der unstrukturierten manuellen Erstlektüre oft überlegen.

„Das ist ein Datenschutz- und Sicherheitsproblem.”
Für öffentlich zugängliche Ausschreibungsunterlagen: falsch. Diese sind per Definition nicht vertraulich. Für interne Dokumente und eingestufte Unterlagen: absolut richtig — und der Abschnitt zu Sicherheitsklassifikation erklärt, was dann gilt. Das Datenschutz-Argument als generelles Stopp-Signal ist eine Verweigerungsstrategie, kein Analyse-Ergebnis.

„Wir haben zu wenige Ausschreibungen, damit sich das lohnt.”
Für ein Unternehmen mit 3–5 relevanten Ausschreibungen pro Quartal reicht ein einfacher Prompt-Workflow ohne jegliches Extra-Setup — der ROI liegt im eingesparten Analyseaufwand der Bid-Manager, nicht in teurer Infrastruktur. Selbst bei kleinem Volumen hat das Unternehmen nach einem Monat einen standardisierten Screening-Prozess statt einer Person, die sich ihren eigenen Weg durch jedes Dokument bastelt.

Woran du merkst, dass das zu dir passt

  • Dein Bid-Team sichtet mehr als fünf Ausschreibungen pro Monat und kommt dabei nicht in die Tiefe, die für eine gute Go/No-Go-Entscheidung nötig wäre
  • Ihr habt bereits Ausschreibungen verpasst oder zu spät bewertet, weil das Screening-Kapazitätsproblem nicht gelöst ist
  • Die Ausschreibungsformate, die ihr regelmäßig bekommt, sind lang und strukturell vergleichbar — BWB, NATO, OCCAR, DTAD — mit wiederkehrenden Anforderungsklassen, die gut extrahierbar sind
  • Eure Kompetenzen und Zertifikate sind ausreichend dokumentiert, um eine Vergleichsbasis für die automatische Eignungsprüfung zu erstellen
  • Ihr habt eine Person, die Bid-Management-Verantwortung trägt und bereit ist, Prompt-Engineering als Kernkompetenz aufzubauen

Wann du es noch nicht angehen solltest — drei harte Ausschlusskriterien:

  1. Weniger als drei Ausschreibungen pro Quartal, alle in einem einzigen Segment. Dann ist der Overhead einer systematischen Lösung nicht gerechtfertigt. Lies das nächste Dokument manuell — und fang erst an, wenn das Volumen wächst.

  2. Kein klares Bild, welche eurer Dokumente kontrolliert oder eingestuft sind. Bevor du ein LLM auf euren Dokumentenbestand losgehen lässt, braucht ihr eine Datensegregation. Wer diesen Schritt überspringt, riskiert Exportkontrollverstöße. Hol dir zuerst Compliance-Beratung.

  3. Keine Person im Team, die bereit ist, Prozessverantwortung für Prompt-Pflege und Kompetenzmatrix zu übernehmen. Ein Prompt ist kein einmaliges Artefakt — er muss gepflegt, an neue Ausschreibungsformate angepasst und bei Fehlern korrigiert werden. Ohne Owner wird das System nach drei Monaten schlechter statt besser.

Das kannst du heute noch tun

Öffne NotebookLM (kostenlos, Google-Account genügt) oder Claude Pro und lade eine öffentlich zugängliche Ausschreibung hoch — von DTAD, TED oder service.bund.de. Verwende dann den folgenden Prompt als Startpunkt.

Dieser Prompt extrahiert die sieben wichtigsten Kategorien für eine Erst-Bewertung:

Ausschreibungs-Screening-Prompt für Verteidigungsausschreibungen
Du bist ein spezialisierter Bid-Intelligence-Assistent für Verteidigungsausschreibungen. Analysiere das beigefügte Ausschreibungsdokument und erstelle einen strukturierten Erst-Screening-Bericht. Gehe systematisch das gesamte Dokument einschließlich aller Anhänge durch. Lasse keine Seite aus. Extrahiere folgende Kategorien präzise und mit Seitenangabe je Fundstelle: **1. FORMALE MINDESTANFORDERUNGEN (Hard Gates)** - Umsatz-/Unternehmensgröße-Anforderungen - Geforderte Zertifikate und Zulassungen (ISO, EN, AQAP, VS-Freigaben, Sicherheitsüberprüfungen) - Staatliche Einschränkungen (nationale Bieter bevorzugt, EU-only, NATO-only) - Ausschlussklauseln (Interessenkonflikte, Bietergemeinschaften) **2. TECHNISCHE ANFORDERUNGEN** - Referenzierte Normen (STANAG, MIL-SPEC, AQAP, DIN EN, ISO) mit vollständiger Bezeichnung - Technische Spezifikationen mit messbaren Schwellenwerten - Geforderte Systemintegrationen oder Schnittstellen **3. BEWERTUNGSKRITERIEN** - Alle genannten Kriterien mit exakter Gewichtung in Prozent - Falls keine Gewichtungen angegeben: Reihenfolge und Bedeutungshinweise **4. FRISTEN UND ZEITPLAN** - Abgabefrist Angebot (Datum und Uhrzeit) - Projektlaufzeit und Liefertermine - Fragen-/Klärungsfristen **5. AUFTRAGSVOLUMEN UND STRUKTUR** - Gesamtvolumen (Schätzwert oder Rahmen) - Losaufteilung (wenn vorhanden) - Optionen und Verlängerungsklauseln **6. WETTBEWERBSSIGNALE** - Hinweise auf Vorzugsanbieter oder vorherige Auftragnehmer - Sehr spezifische technische Anforderungen, die auf einen bestimmten Anbieter hindeuten - Ungewöhnlich kurze Fristen - Anforderungen, die einen bedeutenden Marktzutrittsbarrier darstellen **7. OFFENE FRAGEN UND KLÄRUNGSBEDARF** - Widersprüchliche oder unklare Anforderungen - Fehlende Informationen, die vor Angebot unbedingt geklärt werden müssen Schließe mit einer Go/No-Go-Ersteinschätzung: Erfüllt das Dokument die formalen Mindestanforderungen, und was wäre das stärkste Argument für und gegen eine Angebotsabgabe? [AUSSCHREIBUNGSDOKUMENT HIER EINFÜGEN ODER ALS PDF ANHÄNGEN]
Funktioniert mit Claude, ChatGPT, NotebookLM, Langdock
Beispiel-Ausgabe

Mitarbeiter:in

BWB-Leistungsverzeichnis, 280 Seiten, Logistik-Software für Ersatzteilmanagement, Abgabefrist in 21 Tagen

KI-Assistent

**1. FORMALE MINDESTANFORDERUNGEN (Hard Gates)** - Mindestumsatz 10 Mio. EUR/Jahr (Seite 14, §4 Abs. 2) - ISO 9001:2015 Zertifizierung erforderlich; EN 9100 bevorzugt, aber nicht Mindestanforderung (Seite 15) - Sicherheitsüberprüfung nach SÜG §10 für Schlüsselpersonal — Vorlaufzeit ca. 3–6 Monate (Seite 22, Anlage 3) - Keine Staatsangehörigkeitsbeschränkung, aber: Unternehmen aus Drittstaaten außerhalb NATO benötigen gesonderte BMVg-Freigabe (Seite 16) **KRITISCH:** Sicherheitsüberprüfung §10 SÜG — hat Schlüsselpersonal diese Überprüfung bereits? Falls nicht, ist eine Angebotsabgabe zwar möglich, aber der Auftrag könnte nicht angetreten werden. **2. TECHNISCHE ANFORDERUNGEN** - NATO STANAG 4329 Rev 3 (Schnittstellen SAP-Integration) — vollständige Konformität erforderlich (Seite 45, Anhang 2) - AQAP 2110 Edition 3 Qualitätssicherungsnachweis — bis Angebotsabgabe erforderlich (Seite 51) - Response-Zeit Datenabfragen unter 2 Sekunden bei 500 gleichzeitigen Nutzern (Seite 67) - Datenhaltung: Deutschland, BSI-zertifiziertes Rechenzentrum erforderlich (Seite 71) **3. BEWERTUNGSKRITERIEN** - Preis: 40 % - Technische Lösung (Referenzarchitektur): 35 % - Liefertreue / Projekterfahrung: 15 % - Support-Konzept: 10 % **GO/NO-GO-ERSTEINSCHÄTZUNG** Bedingt Go — abhängig von der Antwort auf zwei Fragen: (1) Liegt die §10-SÜG-Überprüfung für Schlüsselpersonen vor? (2) Ist STANAG 4329 Rev 3 in der vorhandenen Software-Architektur bereits implementiert? Falls beides Nein: No-Go — Zeitrahmen für Nachholen zu kurz. Falls beides Ja: Stärken im Preis und in der Referenzarchitektur, wenn bestehende NATO-Projekte als Referenz angeführt werden können. Quelle: Leistungsverzeichnis_BWB_2024_Logistik.pdf, Seiten 14–22, 45–51, 67–71, Anlage 2+3

Quellen & Methodik

  • Ausschreibungsaufwand 40–120 Stunden: Steerlab.ai, „How to Calculate the True Cost of Responding to an RFP” (2024/2025), steerlab.ai/blog/true-cost-of-responding-to-rfp. Für einfachere Ausschreibungen unter 100 Seiten liegt der Aufwand deutlich darunter; Verteidigungsausschreibungen mit Anhängen erreichen das obere Ende der Spanne regelmäßig.
  • 90% Zeitersparnis beim RFP-Screening: Procurement Sciences AI (PSci.AI), Kundenfallstudie Educology Solutions (2024), procurementsciences.com. US-amerikanischer Kontext (FAR/DFAR-Ausschreibungen); Übertragbarkeit auf deutsche/NATO-Ausschreibungen ist plausibel, aber nicht durch eine vergleichbare Studie für den deutschen Markt belegt.
  • ITAR-Risiken durch KI-Agenten: Kiteworks, „ITAR, AI Agents, and Controlled Technical Data: The Export Control Compliance Gap” (2025), kiteworks.com/regulatory-compliance/itar-ai-agents-compliance-gap/. Die Einschätzung zu ITAR-Strafen (bis 1 Mio. USD/Verstoß) ist gesetzlich verankert (22 U.S.C. § 2778); keine Rechtsberatung.
  • Ausschreibungsportale Deutschland/NATO: DTAD (dtad.com), Tender Electronic Daily TED (ted.europa.eu), service.bund.de, NATO NSPA (nspa.nato.int). Portale regelmäßig aktuell; Zugangsvoraussetzungen können sich ändern.
  • Preisangaben der genannten Tools: Veröffentlichte Tarife der Anbieter Langdock, meinGPT, Claude/Anthropic (Stand Mai 2026). Enterprise-Preise für tendric.ai und Aleph Alpha auf Anfrage; keine öffentlichen Preislisten.
  • Schätzwerte zu Zeitersparnis und Bid-Manager-Kapazität: Eigene Schätzung basierend auf öffentlichen Praxisberichten; keine repräsentative Studie für den deutschen Verteidigungssektor vorliegend.

Du willst wissen, welche eurer Ausschreibungstypen sich am schnellsten automatisieren lassen, und wie ihr den Einstieg ohne IT-Projekt umsetzt? Meld dich — das besprechen wir in einem kurzen Gespräch.

Diesen Inhalt teilen:

🤝

Interesse an diesem Use Case?

Schreib uns, wenn du mehr erfahren oder diesen Use Case für dein Unternehmen umsetzen möchtest. Wir melden uns zeitnah bei dir.

Deine Daten werden ausschließlich zur Bearbeitung deiner Anfrage verwendet (Art. 6 Abs. 1 lit. b DSGVO). Mehr in unserer Datenschutzerklärung.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–3 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar