Freemium 🇩🇪 Deutschsprachig 🇪🇺 EU-Server Zuletzt geprüft: Juni 2026

Elastic AI

Elastic N.V.

4/5

Die KI-Schicht des Elastic Stack, semantische Suche mit ELSER, native Vektor-Suche, RAG-Playground und AI Assistant in einer ausgereiften Such-Plattform. Open Source als Kern, Elastic Cloud mit EU-Region (Frankfurt), Hybrid-Suche aus klassischer BM25 und Vektoren als unique Stärke. Stärker als reine Vektor-DBs bei Volltext-Suche, schwächer als spezialisierte Anbieter bei reiner Vektor-Performance.

Kosten: Elasticsearch selbst gehostet kostenlos (Elastic License v2 / SSPL, lizenzbasiert nach Knotenzahl und RAM für kostenpflichtige Tiers). Elastic Cloud Hosted ressourcenbasiert (Pay-as-you-go monatlich oder vorausbezahlt), kleinste Konfigurationen ab rund 95 USD/Monat. Serverless nutzungsbasiert: Speicher ab 0,047 USD/GB/Monat, Ingest-Compute ab 0,14 USD/VCU-Stunde, Such-Compute ab 0,09 USD, ML-Compute ab 0,07 USD. ELSER- und Vektor-Inferenz im Cluster-Compute enthalten. Managed LLM ab 4,50 USD/Mio. Input-Token und 21 USD/Mio. Output-Token, Elastic Inference Service ab 0,08 USD/Mio. Token. Externe LLM-Provider (OpenAI, Anthropic, Bedrock) werden separat beim Anbieter abgerechnet.

Stärken

ELSER-Modell, Out-of-the-box semantische Suche ohne eigenes Embedding-Modell
Hybrid-Suche aus klassischer Lexikalsuche (BM25) und Vektorsuche in einer Query
Open Source unter Elastic License v2 / SSPL, Self-Hosting ohne Lizenzkosten möglich
EU-Region in Frankfurt mit AVV und SOC-2-konformer Verarbeitung
AI Assistant für Observability und Security mit Kontextzugriff auf Elasticsearch-Daten
Playground für RAG-Prototyping mit anbinder-agnostischem LLM-Switch (OpenAI, Anthropic, Bedrock, Azure)
Bewährte Skalierung, von wenigen MB bis hin zu Multi-Petabyte-Clustern in Produktion

Einschränkungen

Reine Vektor-Performance bei Hochlast unter dedizierten Anbietern wie Qdrant oder Pinecone
Lizenzwechsel 2021 (Apache 2.0 → SSPL/ELv2) hat OpenSearch-Fork und Verunsicherung im Markt erzeugt
ELSER ist englisch-zentriert, für deutsche semantische Suche besser multilinguales E5 oder eigenes Embedding
Cluster-Tuning verlangt Elastic-Erfahrung, Shard-Allocation, Heap-Size, JVM-Garbage-Collection sind kein Plug-and-Play
Elastic Cloud Pricing intransparent, Konfigurator notwendig, schnelle TCO-Schätzung schwierig
AI Assistant aktuell auf Observability- und Security-Use-Cases beschränkt, kein generischer Chatbot

Passt gut zu

Enterprise-Search RAG-Architekturen Log- und Observability-Analyse Security-Analytics Hybrid-Suche

Wann ja, wann nein

Wann ja

Du hast bereits einen Elastic Stack im Einsatz und willst semantische Suche oder RAG ergänzen
Du brauchst Hybrid-Suche aus klassischer Volltextsuche und Vektorähnlichkeit in einer Query
Du suchst eine EU-gehostete Vektor-Datenbank mit AVV und Frankfurt-Region
Du willst Volltext-, Vektor- und Log-Daten in einer Plattform statt drei separater Systeme

Wann nein

Du baust einen reinen Vektor-Suchindex mit hohen Latenz-Anforderungen ohne Volltext-Bedarf
Du hast keine Elastic- oder Search-Engineering-Kapazität im Team
Du brauchst eine schlanke, leichtgewichtige Embedding-Pipeline ohne Cluster-Overhead
Dein primäres Suchszenario ist deutschsprachig und du willst nicht auf eigenes Embedding-Modell umsteigen

Kurzfazit

Elastic AI ist die KI-Schicht über dem Elastic Stack, also keine eigenständige neue Plattform, sondern eine Sammlung von KI-Funktionen, die in Elasticsearch, Kibana und Elastic Cloud eingebaut sind. Das umfasst die hauseigene semantische Suche ELSER, native Vektor-Suche mit HNSW-Index, ein RAG-Playground für Prototyping, einen AI Assistant für Observability und Security und Inferenz-APIs für externe LLM-Anbieter. Stärke ist die Verbindung aus klassischer Volltextsuche und Vektorsuche in einer einzigen Query, wer beides braucht, ist hier richtig. Schwächen: Reine Vektor-Performance liegt unter dedizierten Anbietern wie Qdrant, ELSER ist englisch-zentriert, und der Lizenzwechsel 2021 hat einen großen Fork (OpenSearch) erzeugt, der bis heute parallel läuft. Für Teams mit bestehendem Elastic-Setup ist Elastic AI die natürliche Erweiterung; für Greenfield-RAG-Projekte ohne Such-Erbe sind schlankere Stacks oft schneller.

Für wen ist Elastic AI?

Bestehende Elastic-Anwender: Wer Elasticsearch bereits für Logs, Volltext-Suche oder Observability nutzt, bekommt mit ELSER und Vektor-Indexen ohne Plattformwechsel semantische Suche. Indizes können mit dense_vector- und sparse_vector-Feldern erweitert werden, ohne ein zweites System einzuführen, das spart Operations-Aufwand und vermeidet Datensilos.

Enterprise-Search-Architekt:innen: Wer eine zentrale Suche über interne Wissensbasen (Confluence, SharePoint, Jira, Salesforce, eigene Datenbanken) bauen muss, profitiert von den Connectors und der Hybrid-Suche. Klassische BM25-Treffer und Vektor-Ähnlichkeit werden in einer Query kombiniert (Reciprocal Rank Fusion), das liefert in der Regel bessere Ergebnisse als reine Vektor-Suche allein.

RAG-Entwickler mit DSGVO-Anforderungen: Elastic Cloud bietet eine EU-Region (Frankfurt), AVV und SOC-2-Compliance. Wer einen RAG-Stack für Recht, Medizin oder Finanzen baut, hat hier eine gut dokumentierte und auditierbare Plattform, anders als bei vielen US-zentrierten Vektor-DBs.

Observability- und Security-Teams: Der AI Assistant in Kibana ist auf zwei klare Use-Cases zugeschnitten: Logs analysieren („Warum spike die Latenz?”) und Security-Events korrelieren („Welche IPs haben in den letzten 30 Tagen failed Logins versucht?”). Das ist kein generischer Chatbot, sondern ein domänenspezifischer Agent mit direktem Datenzugriff.

Hybrid-Stack-Strategien: Wer parallel klassische Suche, Logs und semantische RAG-Pipelines auf einer Plattform betreiben will, statt drei separate Systeme (Solr/Elasticsearch + Splunk + Pinecone) zu pflegen, hat mit Elastic einen pragmatischen Konsolidierungspfad.

Weniger geeignet für: Teams ohne Search-Engineering-Erfahrung (Cluster-Tuning ist kein Plug-and-Play), reine Vektor-Workloads mit Höchstanforderungen an Latenz (dedizierte Anbieter sind schneller), und kleine Greenfield-RAG-Prototypen, bei denen Postgres mit pgvector oder Qdrant in Stunden statt Tagen läuft.

Preise im Detail

Tier	Preis (USD/Monat)	Was du bekommst
Self-Managed (Open Source)	0	Elasticsearch + Kibana unter Elastic License v2 / SSPL, alle Vektor-Funktionen, ELSER, Connectors, AI-Inferenz-APIs, eigene Infrastruktur
Elastic Cloud Standard	ab ~95	Managed Hot-Node-Cluster, monatlich, EU-Region wählbar, Standard-Support
Elastic Cloud Gold	ab ~110	Standard + erweiterte Sicherheits-Features, RBAC, längere Logs-Retention, schnellerer Support
Elastic Cloud Platinum	ab ~125	Gold + Cross-Cluster-Replication, ML-Anomalieerkennung, Graph-Analytics, 24/7-Support
Elastic Cloud Enterprise	Auf Anfrage	Platinum + dedizierte Hardware, Premium-SLAs, dediziertes Customer-Success-Team
Elastic Cloud Serverless	nutzungsbasiert	Speicher ab 0,047 USD/GB/Monat, Ingest-Compute ab 0,14 USD/VCU-Stunde, Such ab 0,09, ML ab 0,07, automatische Skalierung
Managed LLM / Inference	nach Verbrauch	Managed LLM ab 4,50 USD/Mio. Input-Token und 21 USD/Mio. Output-Token, Elastic Inference Service (EIS) ab 0,08 USD/Mio. Token
Externe LLM-Provider	nach Verbrauch	Wenn du externe Modelle (OpenAI, Anthropic, Bedrock) im Playground oder via Inferenz-API nutzt, fallen separate Kosten beim Anbieter an

Einordnung: Die Open-Source-Variante ist tatsächlich kostenlos, du installierst Elasticsearch auf eigenen Servern und nutzt alle KI-Features (ELSER, Vektor-Suche, Inferenz-APIs) ohne Lizenzkosten. Das ist eine reale Option für Teams mit Operations-Kapazität. Bei Elastic Cloud beginnt der Sweetspot je nach Datenvolumen bei ein paar hundert USD pro Monat, die kleinsten Hot-Node-Konfigurationen liegen bei rund 95 USD, aber für produktive RAG-Workloads mit ELSER-Inferenz sind 500–1.500 USD/Monat realistisch. Die Serverless-Variante ist 2024 eingeführt worden und für unregelmäßige Workloads attraktiv: Du zahlst Speicher (ab 0,047 USD/GB/Monat), Such-Compute (ab 0,09 USD/VCU-Stunde) und Ingest-Compute (ab 0,14 USD) getrennt, kein leerlaufendes Cluster mehr. Seit dem Zusammenschluss mit Jina AI bietet Elastic über den Elastic Inference Service (EIS) auch eigene Embedding- und Reranker-Modelle (ab 0,08 USD/Mio. Token) sowie ein Managed LLM (4,50 USD/Mio. Input-, 21 USD/Mio. Output-Token) an, du musst also nicht zwingend einen externen Provider anbinden. Achtung: Externe LLM-Aufrufe (z. B. Claude oder GPT-4o im Playground) werden beim jeweiligen Anbieter abgerechnet, Elastic stellt nur die Infrastruktur, nicht die Modelle.

Stärken im Detail

ELSER als Out-of-the-box semantische Suche. ELSER (Elastic Learned Sparse EncodeR) ist ein hauseigenes Sparse-Embedding-Modell, das ohne externe API funktioniert. Du indizierst Dokumente, lädst das Modell ins Cluster und kannst sofort semantisch suchen, keine OpenAI-Embeddings-API, keine separaten Inferenz-Server, keine Token-Kosten pro Embedding. Das ist ein realer Wettbewerbsvorteil gegenüber reinen Vektor-DBs, die Embeddings selbst nicht erzeugen können. Schwäche: ELSER ist primär auf Englisch trainiert.

Hybrid-Suche als Killer-Feature. Klassische Volltextsuche (BM25) findet exakte Begriffstreffer; Vektorsuche findet semantische Ähnlichkeit; die Wahrheit liegt fast immer in der Mitte. Elasticsearch erlaubt seit Version 8.9 beide Suchformen in einer Query und kombiniert die Ergebnisse mit Reciprocal Rank Fusion, das liefert in den meisten Praxistests bessere Top-10-Ergebnisse als jede der beiden Methoden allein. Wer ernsthaft Suche baut, will diese Kombination, und Elastic ist hier branchenführend.

Echte Open-Source-Variante mit voller Funktionalität. Anders als bei vielen kommerziellen Vektor-DBs sind die KI-Features in der Self-Managed-Variante nicht beschnitten. Du kannst ELSER, Vektor-Suche, Inferenz-APIs und sogar den AI Assistant lokal betreiben. Das ist ein realer Hebel für DSGVO-sensible Branchen, die On-Prem-Deployment vorschreiben.

EU-Region in Frankfurt mit klarer Compliance-Story. Elastic Cloud bietet seit Jahren Frankfurt als Region mit AVV, SOC-2-Type-II-Audit und Standardvertragsklauseln. Das ist kein nachträglich angeflanschter EU-Knopf, sondern Teil des Kerngeschäfts, Elastic hat europäische Großkunden in regulierten Branchen seit über einem Jahrzehnt.

Playground als pragmatischer RAG-Prototyper. Im Kibana-UI gibt es einen RAG-Playground: Du wählst einen Index, ein Embedding-Modell, einen LLM-Anbieter (OpenAI, Anthropic, Bedrock, Azure OpenAI) und stellst Fragen. Innerhalb von Minuten siehst du, ob deine Datenstruktur und Chunking-Strategie überhaupt passende Antworten liefert, bevor du den vollen Code in LangChain oder LlamaIndex schreibst. Das ist ein echter Zeitgewinn in der Architekturphase.

AI Assistant für domänenspezifische Aufgaben. In Kibana sind zwei spezialisierte Assistenten eingebaut: einer für Observability (Log-Analyse, Anomalien, Performance) und einer für Security (Threat Hunting, Alert-Triage). Beide haben direkten Zugriff auf die zugrunde liegenden Indizes und können in natürlicher Sprache komplexe Queries generieren. Für Site-Reliability-Engineers und Security-Analysten ein realer Produktivitätsgewinn.

Skalierung von 1 MB bis Multi-Petabyte. Elasticsearch ist seit über zehn Jahren in produktiven Einsätzen mit zigtausenden Knoten erprobt. Die Vektor-Funktionen erben diese Reife, Shard-Routing, Replikation, Cross-Cluster-Replication, Snapshot-Backups funktionieren auch für Vektor-Indizes. Wenige Anbieter im Vektor-Markt haben diese Operations-Tiefe.

Schwächen ehrlich betrachtet

Reine Vektor-Performance unter dedizierten Anbietern. Wenn dein Workload nur Vektor-Ähnlichkeitssuche ist (z. B. Embedding-basierte Empfehlung mit Millionen QPS), liefern Qdrant, Pinecone oder Milvus messbar bessere Latenzen pro Euro Hardware. Elastic ist breiter aufgestellt, und zahlt das mit etwas Overhead. Für Hybrid-Workloads ist das egal, für reine Vektor-Lasten ein Faktor.

Lizenz-Saga seit 2021. Elastic hat 2021 die Lizenz von Apache 2.0 auf SSPL und Elastic License v2 (ELv2) gewechselt, als Reaktion auf AWS, das Elasticsearch als Managed Service angeboten hatte. Daraufhin forkte AWS Elasticsearch und Kibana zu OpenSearch, das unter Apache 2.0 weiterläuft. Bis heute existieren beide Welten parallel. Wer maximale Lizenz-Freiheit will, schaut zu OpenSearch; wer ELSER, AI Assistant und das volle Elastic-Feature-Set will, bleibt bei Elastic. Das ist eine strategische Wahl, die viele Architektur-Diskussionen begleitet.

ELSER ist englisch-zentriert. Das offizielle ELSER-Modell ist primär auf englischen Daten trainiert. Für deutsche semantische Suche ist die Qualität spürbar geringer als bei multilingualen Embedding-Modellen wie E5-multilingual oder OpenAI text-embedding-3-large. Workaround: Du kannst eigene Embedding-Modelle (Hugging Face) in den Cluster laden und über die Inferenz-API nutzen, aber das ist nicht das Out-of-the-Box-Versprechen von ELSER.

Cluster-Tuning verlangt Erfahrung. Elasticsearch ist mächtig, aber nicht selbsterklärend. Shard-Allocation, Heap-Size, JVM-Garbage-Collection, Refresh-Intervalle, Mapping-Design, wer das falsch konfiguriert, bekommt schlechte Performance oder OOM-Fehler. Vektor-Indizes verschärfen das (HNSW-Indizes sind RAM-hungrig). Ein Senior mit Search-Erfahrung ist quasi Pflicht, pure Plug-and-Play-Erwartungen werden enttäuscht.

Pricing-Intransparenz bei Elastic Cloud. Die Cloud-Preise hängen von Knotengröße, Region, Speichervolumen, Such-Compute, ML-Knoten und Support-Stufe ab, du musst durch den Konfigurator klicken, um eine Hausnummer zu bekommen. Schnelle Vergleiche mit Konkurrenten („Was kostet 100 GB mit semantischer Suche pro Monat?”) sind ohne Sales-Gespräch schwer.

AI Assistant nur für Observability und Security. Der AI Assistant ist heute kein generischer Daten-Chatbot, er ist auf zwei klar abgegrenzte Domänen zugeschnitten. Wer einen offenen RAG-Chat über beliebige Indizes will, muss den Playground oder eine eigene Anwendung bauen. Die Roadmap deutet auf Erweiterung, aktueller Stand bleibt limitiert.

Alternativen im Vergleich

Wenn du…	…nimm stattdessen
Eine schlanke, dedizierte Vektor-DB mit niedrigster Latenz brauchst	Qdrant
Open Source mit Apache-2.0-Lizenz und identischer Elastic-Architektur willst	OpenSearch
Ein Framework zum Bauen von RAG-Pipelines auf beliebigen Datenstores suchst	LangChain
Embedding-Modelle und Open-Source-LLMs trainieren oder hosten willst	Hugging Face
EU-gehostete LLM-Inferenz für die Antwortgenerierung brauchst	Azure OpenAI Service

Erwähnenswert ohne eigene Tool-Seite: Pinecone (US-Marktführer bei Managed Vektor-DBs, kein EU-Hosting), Weaviate (Open-Source-Vektor-DB aus Amsterdam mit eigener semantischer Suche), Milvus (CNCF-Graduate, sehr performant, technisch anspruchsvoll), Vespa (von Yahoo, Hybrid-Suche-Pionier mit einigen Architekturvorteilen) und pgvector (Postgres-Erweiterung, der pragmatische Einstieg, wenn man bereits Postgres betreibt). Elastic AI bleibt im Markt 2026 die Plattform der Wahl, wenn klassische Suche und Vektor-Suche zusammen gebraucht werden, für reine Vektor-Workloads gibt es schnellere Alternativen.

So steigst du ein

Schritt 1: Trial in Elastic Cloud, und einen echten Index aufsetzen. Starte 14 Tage kostenlos auf cloud.elastic.co, wähle Frankfurt als Region und lege einen Index mit 1.000–10.000 deiner echten Dokumente an. Aktiviere ELSER über die ML-Modelle-Seite in Kibana und lade es ins Cluster. Nach ein paar Minuten Inferenz hast du einen funktionierenden semantischen Index, und einen realistischen Eindruck, ob ELSER für deine Sprache und Domäne ausreicht.

Schritt 2: Hybrid-Query bauen und mit reiner BM25 vergleichen. Stelle dieselbe Frage zweimal: einmal als klassische match-Query, einmal als Hybrid-Query mit RRF (Reciprocal Rank Fusion) aus match und text_expansion (ELSER) oder knn (Vektor). Vergleiche die Top-10-Treffer. Bei deutschen Texten oft wichtiges Detail: Das multilinguale E5-Embedding läuft besser als ELSER, Modell laden und in der Inferenz-Pipeline ersetzen.

Schritt 3: Playground für RAG-Prototyping nutzen. In Kibana → „Playground”: Index wählen, LLM-Anbieter konfigurieren (OpenAI-API-Key, Anthropic, Azure OpenAI in EU oder Bedrock in Frankfurt), Test-Frage stellen. Innerhalb einer halben Stunde weißt du, ob dein Chunking, deine Felder und dein Embedding-Modell brauchbare Antworten liefern. Erst danach lohnt sich der Schritt in eine Produktionsarchitektur mit LangChain oder eigenem Code.

Schritt 4: Operations-Reife einplanen. Sobald die Architektur steht, kalkuliere Operations-Aufwand realistisch: HNSW-Indizes brauchen Speicher (RAM), Cluster-Größen müssen geplant werden, Backup- und Rotations-Strategien für Embeddings sind nicht trivial. Für produktive Workloads ist eine ELK-erfahrene Person im Team Pflicht, oder ein Vertrag mit Elastic-Support oder einem Partner.

Ein konkretes Beispiel

Ein deutscher Versicherungskonzern in Köln (450 IT-Mitarbeitende, mehrere Bestandsmanagement-Systeme) baut eine interne Wissensplattform für 3.500 Sachbearbeiter. Quellen: rund 12.000 Tarifrichtlinien (PDF), 80.000 Confluence-Seiten zu Schadensbearbeitung, 200.000 alte Tickets in Jira mit Lösungsbeschreibungen. Architektur: Elastic Cloud Platinum in Frankfurt, drei Hot-Knoten plus zwei ML-Knoten für ELSER-Inferenz. Ingest über Elastic Connectors (Confluence, Jira) und einen eigenen S3-Connector für die PDF-Bibliothek. Indizierungsstrategie: Hybrid-Index mit text-Feld für klassische BM25-Treffer, text_expansion-Feld mit multilingual-e5-large für deutsche semantische Suche, dense_vector-Feld optional für hochpräzise Re-Ranking. Suchschicht: Kibana-Playground für Architektur-Validierung, dann eigene React-App, die Elasticsearch-Queries absetzt und Antworten über Azure OpenAI in der EU-Region generiert. Aufwand: Drei Senior-Engineers, ca. zwölf Wochen für Produktivversion. Spürbarer Effekt: Die durchschnittliche Bearbeitungszeit pro Komplex-Schaden sinkt von 47 Minuten Recherche auf 12 Minuten, eine konservative Hochrechnung über 80.000 Schadensfälle/Jahr ergibt eine sechsstellige jährliche Zeitersparnis allein bei der Recherche. Datenschutzrechtlich saubere Lösung dank Frankfurt-Region und AVV.

DSGVO & Datenschutz

Datenhosting: Elastic Cloud bietet eine Frankfurt-Region (Deutschland) sowie weitere EU-Regionen (Irland, Niederlande, Schweden). Self-Hosted natürlich auf eigener Infrastruktur, beliebig in der EU.
Datennutzung: Elastic nutzt Kundendaten nicht für eigenes Modell-Training. ELSER und alle hauseigenen ML-Modelle werden auf öffentlichen Daten trainiert, nicht auf Kundendaten.
Externe LLM-Aufrufe: Wenn du im Playground OpenAI, Anthropic oder Bedrock anbindest, gilt der Datenschutz des jeweiligen Providers. Empfehlung: Azure OpenAI in EU-Region oder Bedrock in eu-central-1 verwenden.
Auftragsverarbeitung (AVV): Standardmäßig für Elastic Cloud verfügbar. Standardvertragsklauseln (SCC) Teil des Vertrages. SOC-2 Typ II, ISO 27001, ISO 27017, ISO 27018 zertifiziert.
Retention und Löschung: Volle Kontrolle über Index-Lifecycle-Policies (ILM). Daten können nach beliebigen Regeln rotiert, archiviert oder gelöscht werden.
Verschlüsselung: TLS in Transit, AES-256 at Rest standardmäßig, optionale Customer-Managed Keys (CMK) im Enterprise-Plan.
Empfehlung für Unternehmen: Für DSGVO-sensible Branchen (Versicherung, Banking, Recht, Medizin) ist Elastic Cloud Frankfurt mit AVV und SCC sauber dokumentiert. LLM-Aufrufe konsequent auf EU-Region-Anbieter (Azure OpenAI Niederlande oder Bedrock Frankfurt) routen, sonst entsteht ein Drittlandtransfer durch die Hintertür.

Gut kombiniert mit

LangChain, Elastic AI liefert die Such- und Vektor-Schicht, LangChain orchestriert den RAG-Workflow mit Retrieval, Prompt-Templating und LLM-Aufruf. Beide haben offizielle Integrationen, der Aufwand ist minimal.
Hugging Face, Wenn ELSER für deine Sprache nicht reicht, lädst du multilinguale Embedding-Modelle (z. B. E5-multilingual oder German-BERT-Embeddings) aus dem Hugging-Face-Hub direkt in den Elastic-ML-Knoten. Das ist der Standardpfad für deutsche RAG-Anwendungen.
Azure OpenAI Service, Für die Antwortgenerierung im RAG-Workflow ist Azure OpenAI in der EU-Region die DSGVO-konforme Wahl. Elastic übernimmt das Retrieval, Azure OpenAI generiert die Antwort, beides in der EU.

Unser Testurteil

Elastic AI verdient 4 von 5 Sternen. Es ist die breiteste und produktionsreifste Plattform für die Kombination aus klassischer Suche und Vektor-/semantischer Suche, mit echter EU-Hosting-Story, Open-Source-Variante und der seltenen Eigenschaft, dass alle KI-Features auch self-managed verfügbar sind. Den fünften Stern verlieren wir an drei Punkten: ELSER ist für deutsche Texte nur zweite Wahl (Workaround mit eigenem Embedding möglich, aber gegen die Out-of-the-Box-Erwartung), die reine Vektor-Performance liegt unter dedizierten Anbietern, und der Lizenzwechsel von 2021 mit dem OpenSearch-Fork lässt strategische Fragen offen, die jeder Architekt selbst bewerten muss. Trotzdem: Wer 2026 einen ernsthaften Such-Stack mit RAG-Komponente in einem regulierten Umfeld baut, sollte Elastic AI mindestens evaluieren, in den meisten Fällen wird es im Stack landen, oft als zentrales Rückgrat.

Was wir bemerkt haben

2021, Elastic hat die Lizenz von Apache 2.0 auf SSPL und Elastic License v2 gewechselt. AWS forkte daraufhin Elasticsearch und Kibana zu OpenSearch unter Apache 2.0. Beide Welten existieren weiterhin parallel, bei jeder Architektur-Entscheidung kommt heute die Frage: Elastic oder OpenSearch?
2023, Mit Elasticsearch 8.8 wurde ELSER eingeführt. Sparse-Encoder-Modelle, die ohne externe Embedding-API funktionieren, waren bis dahin im Markt selten. Elastic positionierte sich damit klar als Vektor-Anbieter neben Pinecone, Weaviate und Qdrant.
2024, Elastic Cloud Serverless wurde gelauncht. Statt feste Cluster zu provisionieren, zahlst du nutzungsbasiert für Speicher, Such- und Ingest-Compute getrennt. Für unregelmäßige Workloads ein realer Sprung; bei stabilen High-Throughput-Workloads sind dedizierte Cluster weiter günstiger.
2024, Die Search AI Lake-Architektur und der AI Assistant für Observability/Security wurden eingeführt. Damit hat Elastic den Schritt vom „Such-Werkzeug” zur „KI-Plattform mit Datengrundlage” vollzogen, eine direkte Antwort auf Splunk, Datadog und Snowflake-AI.
Oktober 2025, Elastic und Jina AI haben sich zusammengeschlossen (Ankündigung 9.10.2025). Han Xiao, vormals CEO von Jina AI, ist jetzt VP of AI bei Elastic. Jinas Embedding- und Reranker-Modelle bleiben kostenlos auf Hugging Face und laufen zusätzlich über den Elastic Inference Service. Das adressiert direkt die alte ELSER-Schwäche bei mehrsprachigen und visuellen Dokumenten.
2026, Elastic hat Agent Builder und native Workflows in Elasticsearch eingeführt (mit Freikontingent, danach nutzungsbasiert). Damit verschiebt sich die Plattform vom reinen Retrieval-Layer Richtung agentischer Orchestrierung direkt an der Datenquelle. Zusätzlich gibt es jetzt ein Managed LLM und den Elastic Inference Service, du kannst RAG also komplett innerhalb von Elastic betreiben, ohne externen LLM-Provider.
Mai 2026, Elastic positioniert sich konsequent als „Search AI Platform”. Die KI-Features sind im Marketing zentral, in der Realität aber stark mit der bestehenden Such-Plattform verzahnt, neue RAG-Greenfield-Projekte ohne Such-Erbe haben oft schlankere Wege. Wer Elastic schon hat, gewinnt; wer von Null startet, sollte realistisch alternative Stacks (Qdrant + LangChain + EU-LLM) gegenrechnen.

Quellen

Elastic – Serverless Search Pricing. https://www.elastic.co/pricing/serverless-search (abgerufen am 2026-06-13). Serverless: Speicher ab 0,047 USD/GB/Monat, Ingest 0,14, Such 0,09, ML 0,07 USD/VCU-Stunde, Managed LLM 4,50/21 USD pro Mio. Token, Elastic Inference Service ab 0,08 USD/Mio. Token, Workflows und Agent Builder mit Freikontingent.
Elastic – Search AI Platform. https://www.elastic.co/search-ai (abgerufen am 2026-06-13). Vektor- und Hybrid-Suche, Jina-AI-Suchmodelle (Embeddings, Reranker), Agent Builder und Workflows nativ in Elasticsearch.
Elastic – Elastic and Jina AI (Oktober 2025). https://www.elastic.co/blog/elastic-jina-ai (abgerufen am 2026-06-13). Elastic und Jina AI haben sich am 9.10.2025 zusammengeschlossen, Han Xiao wird VP of AI, Jina-Modelle bleiben kostenlos auf Hugging Face und laufen über den Elastic Inference Service.

Diesen Inhalt teilen:

LinkedIn X / Twitter E-Mail WhatsApp

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei Elastic N.V.?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob Elastic AI zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen

KI-Tools und Trends

KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools

Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.

Newsletter abonnieren

Zurück zur Tool-Übersicht