Zum Inhalt springen
⚠️ Hybrid Geprüft: April 2026

Weaviate

Weaviate B.V.

4/5
Tool öffnen

Open-Source-Vektordatenbank mit eingebauten Vectorizer-Modulen für RAG-Systeme. Als niederländisches Unternehmen (Amsterdam) mit EU-Hosting-Option die erste Wahl für DSGVO-konforme KI-Anwendungen auf eigenen Dokumenten.

Kosten: Open Source selbst gehostet kostenlos, Weaviate Cloud: Flex ab 45 USD/Monat, Premium ab 400 USD/Monat

Stärken

  • Open Source — selbst hostbar auf Hetzner, Azure EU oder any on-premise Server
  • Eingebaute Vectorizer-Module für OpenAI, Cohere, HuggingFace — kein separates Embedding-Service nötig
  • Hybrid-Suche kombiniert semantische Vektorsuche und BM25-Keyword-Suche in einem Query
  • Native Multi-Tenancy für strikte Mandantentrennung in SaaS-Produkten
  • GraphQL und REST API — saubere Integration in beliebige Tech-Stacks
  • SOC 2 Type 1 & 2 und ISO 27001 zertifiziert

Einschränkungen

  • Erfordert Entwicklerressourcen für Setup, Betrieb und Skalierung
  • Kein visuelles Interface — alles über API und CLI
  • Cloud-Preise (Flex ab 45 USD/Monat) höher als Pinecone für Einstieg
  • Kleineres Ökosystem als Elasticsearch für klassische Suchaufgaben
  • Lernkurve bei Schema-Design, Vectorizer-Konfiguration und Performance-Tuning

Passt gut zu

Entwicklerteams DSGVO-sensible Anwendungen RAG-Systeme Self-Hosting Enterprise-KI

Wann ja, wann nein

Wann ja

  • Du baust eine RAG-Pipeline auf eigenen Dokumenten und willst volle Datenkontrolle
  • Dein Unternehmen hat DSGVO-Anforderungen — Self-Hosting auf EU-Infrastruktur ist Pflicht
  • Du brauchst Hybrid-Suche (semantisch + Volltextsuche) in einem System
  • Du willst nicht vendor-locked in eine proprietäre Cloud-Lösung sein

Wann nein

  • Du suchst eine No-Code-Lösung ohne Entwicklerressourcen
  • Du brauchst sofort einsatzbereite Managed Services ohne DevOps-Aufwand
  • Dein Projekt ist ein einfacher Prototyp — Chroma reicht völlig aus
  • Du hast wenig Erfahrung mit Docker, Kubernetes oder Datenbankoperationen

Kurzfazit

Weaviate ist die stärkste Wahl für Teams, die RAG-Systeme mit vollständiger Datenkontrolle aufbauen wollen. Als Open-Source-Vektordatenbank aus Amsterdam lässt sie sich auf eigener EU-Infrastruktur betreiben — ohne dass auch nur ein Dokument ein deutsches Rechenzentrum verlässt. Die eingebauten Vectorizer-Module (OpenAI, Cohere, HuggingFace) nehmen einem viel Integrationsarbeit ab, und die native Hybrid-Suche kombiniert semantisches Verständnis mit klassischer Keyword-Suche. Schwäche: Weaviate ist kein Tool für Nicht-Entwickler. Wer keinen Engineer im Team hat, ist mit einem verwalteten Cloud-Service besser bedient.

Für wen ist Weaviate?

ML-Engineers und Backend-Entwickler: Weaviate ist explizit für Entwickler gebaut. Wer RAG-Pipelines, semantische Suche oder KI-Assistenten auf eigenen Daten aufbaut, findet hier eine ausgereifte, API-first Lösung mit GraphQL und REST. Die Python-, JavaScript- und Go-Clients sind gut dokumentiert.

Datenschutzbeauftragte und DSGVO-sensible Branchen: Für Kanzleien, Krankenhäuser, Behörden und Finanzinstitute ist Self-Hosting auf eigener Hardware oder EU-Cloud die einzige akzeptable Option. Weaviate ist dafür gebaut — kein anderes major Vector-DB-Produkt macht das so konsequent möglich.

SaaS-Anbieter mit Multi-Mandanten-Anforderungen: Native Multi-Tenancy erlaubt es, Tausende von Kundenmandanten in einer Instanz mit strikter Datentrennung zu betreiben. Das spart Infrastrukturkosten gegenüber einer Instanz-pro-Kunde-Architektur erheblich.

Unternehmen, die Vendor Lock-in vermeiden wollen: Weaviate ist Open Source (Apache 2.0). Kein Vendor kann Preise ändern, Funktionen sperren oder den Dienst einstellen, ohne dass du einen Ausweg hast. Für kritische KI-Infrastruktur ist das ein strategisches Argument.

Weniger geeignet für: Prototypen-Entwickler ohne Production-Anforderungen (Chroma ist einfacher), Teams ohne DevOps-Kapazität, und alle, die eine vollständig verwaltete Lösung ohne Betriebsaufwand suchen.

Preise im Detail

PlanPreisWas du bekommst
Open SourceKostenlosSelbst gehostete Instanz, vollständiger Funktionsumfang, Community-Support über Forum und GitHub
Cloud Free Trial0 € (14 Tage)Sandbox-Cluster in Weaviate Cloud, alle Core-Features, danach automatisch Flex
Flexab 45 USD/MonatGeteilter Cloud-Cluster, 99,5 % Uptime-SLA, E-Mail-Support (Reaktionszeit nächster Werktag), nutzungsbasierte Abrechnung
Premiumab 400 USD/MonatDedizierter oder geteilter Cluster, bis zu 99,95 % Uptime, 1-Stunden-Response für kritische Probleme, globale Cloud-Abdeckung (AWS, GCP, Azure), technisches Account-Team

Die Flex-Kosten setzen sich aus mehreren Dimensionen zusammen: Vektor-Dimensionen (ca. 0,01 USD pro Million), Storage (ca. 0,21 USD pro GiB) und optionale Embeddings-Services. Für kleine Produktionsanwendungen kommt man realistisch auf 60–150 USD/Monat.

Einordnung: Open Source Self-Hosting ist für produktionsreife Setups wirtschaftlich unschlagbar — wer einen Hetzner-Server für 30 EUR/Monat mietet, bekommt volle Funktionalität. Flex lohnt sich, wenn du DevOps-Aufwand vermeiden willst, aber noch keine 400 USD/Monat Budget hast. Premium ist für Enterprise-Teams, die SLAs, dedizierte Infrastruktur und Account-Management brauchen.

Stärken im Detail

Open Source mit echter Produktionsreife. Weaviate ist nicht nur “auch Open Source” — das Projekt hat über 12.000 GitHub-Stars, ist Apache 2.0 lizenziert und wird aktiv von einem kommerziellen Anbieter entwickelt. Version 1.30 brachte BlockMax WAND-Algorithmus mit bis zu 10-fachem Speedup bei Keyword-Suchen. Du bekommst eine ausgereifte Produktionsdatenbank ohne Lizenzkosten.

Eingebaute Vectorizer-Module nehmen Komplexität heraus. Andere Vektordatenbanken erwarten, dass du Embeddings extern berechnest und dann übergibst. Weaviate kann das direkt — über 20 ML-Modelle und Frameworks sind integriert, darunter OpenAI text-embedding, Cohere embed und lokale HuggingFace-Modelle. Das reduziert die Anzahl der Systemkomponenten erheblich.

Hybrid-Suche in einem Query. Die Kombination aus semantischer Vektorsuche und klassischer BM25-Keyword-Suche ist in Weaviate nativ — kein zweites System, kein Extra-Aufwand. Das ist wichtig, weil reine Vektorsuche bei exakten Begriffen (Produktnummern, Namen, Codes) oft schlechter abschneidet als Keyword-Suche. Hybrid gibt dir das Beste aus beiden Welten.

Native Multi-Tenancy für skalierbare SaaS-Produkte. Jeder Mandant bekommt isolierten Speicher innerhalb einer Instanz. Das ermöglicht Systeme mit Tausenden von Kunden auf gemeinsamer Infrastruktur, ohne Sicherheitskompromisse. Tenant-Aktivierung und -Deaktivierung (“cold” Tenants) spart Ressourcen bei inaktiven Accounts.

GraphQL und REST API für maximale Flexibilität. Weaviate bietet beide Schnittstellen — GraphQL für komplexe Abfragen mit Filterlogik, REST für CRUD-Operationen. Clients für Python, JavaScript/TypeScript und Go sind offiziell unterstützt und gut gepflegt.

Schwächen ehrlich betrachtet

Kein visuelles Interface — alles Terminal. Weaviate hat keine Web-UI für Nicht-Entwickler. Es gibt Community-Projekte für einfache Visualisierungen, aber produktionsreife dashboards musst du selbst bauen. Für Teams, die Datenbankoperationen durch einen Datenanalysten (ohne Coding-Kenntnisse) durchführen lassen wollen, ist das ein echtes Problem.

Betriebsaufwand bei Self-Hosting unterschätzt. Docker-Setup ist einfach, aber Produktions-Betrieb bedeutet: Backups konfigurieren, Monitoring einrichten, Updates testen, Speicher managen. Wer das nicht intern abdecken kann, sollte realistisch die Cloud-Preise gegen DevOps-Zeit gegenrechnen.

Cloud-Einstiegspreise höher als Pinecone. Pinecone bietet einen echten kostenlosen Dauertier, Weaviate Cloud hat nur einen 14-tägigen Trial. Für Prototypen und kleine Anwendungen ist Pinecone (oder lokal Chroma) günstiger. Weaviates Stärke ist Self-Hosting — wer das nicht will, sollte Pinecone ernsthaft in Betracht ziehen.

Schema-Design-Lernkurve. Weaviate ist schema-basiert: Du definierst Klassen, Properties und Vectorizer-Konfiguration vorab. Änderungen am Schema in Production sind eingeschränkt möglich. Für Entwickler, die schnell iterieren wollen, ist das anfangs mühsam — Chroma ist hier wesentlich flexibler.

Kleineres Ökosystem als Elasticsearch. Für Teams, die aus der klassischen Suche kommen, fehlen viele Elasticsearch-Ökosystem-Tools. Log-Aggregation, Analytics-Dashboards und fertige Konnektoren gibt es bei Weaviate nicht in dieser Breite.

Alternativen im Vergleich

Wenn du……nimm stattdessen
Eine vollständig verwaltete Cloud-Lösung ohne Betriebsaufwand willstPinecone
Einen einfachen lokalen Prototyp bauen willst (kein Production-Setup)Chroma
Klassische Volltextsuche mit optionaler Vektor-Erweiterung brauchstOpenSearch
Bestehende Elasticsearch-Infrastruktur um Vektorsuche erweitern willstElasticsearch

Weaviate ist die richtige Wahl, wenn du DSGVO-Konformität, Open-Source-Freiheit und Produktionsreife gleichzeitig brauchst. Für reine Cloud-Convenience ohne Datenschutzanforderungen ist Pinecone oft einfacher zu starten.

So steigst du ein

Schritt 1: Starte Weaviate lokal mit Docker: docker run -p 8080:8080 cr.weaviate.io/semitechnologies/weaviate:latest. Das reicht für erste Entwicklung und Tests. Für DSGVO-sensible Produktionsdaten empfiehlt sich Self-Hosting auf Hetzner Cloud (Frankfurt), Azure Germany North oder einer anderen zertifizierten EU-Cloud. Für den schnellen Einstieg ohne Setup: Weaviate Cloud Free Trial (14 Tage).

Schritt 2: Definiere ein Schema für deine Daten und wähle einen Vectorizer. Für die meisten RAG-Anwendungen empfiehlt sich text2vec-openai (OpenAI Ada) oder ein lokales text2vec-transformers-Modell für maximale Datenkontrolle. Lade deine Dokumente mit dem Python-Client hoch — Weaviate vektorisiert automatisch: client.collections.get("Dokument").data.insert({"inhalt": "...", "quelle": "..."}).

Schritt 3: Baue die RAG-Pipeline: Weaviate findet per Hybrid-Suche die relevantesten Textpassagen, diese landen als Kontext in deinem LLM-Prompt. Mit LangChain oder LlamaIndex ist Weaviate in wenigen Zeilen integriert: WeaviateVectorStore als Retriever, dann RetrievalQA Chain drüber. Ergänze Metadaten-Filter (Autor, Datum, Abteilung), um Antworten auf bestimmte Dokumentbereiche einzugrenzen.

Ein konkretes Beispiel

Eine Berliner Rechtsanwaltskanzlei mit 500.000 internen Dokumenten — Verträge, Urteile, Gutachten der letzten 20 Jahre — baut mit Weaviate einen internen Recherche-Assistenten. Weaviate läuft on-premises auf einem dedizierten Server in der Kanzlei, kein einziges Dokument verlässt das interne Netzwerk. Die Anwälte können in natürlicher Sprache suchen: “Urteile zu Mietminderung bei Schimmel in Altbauten ab 2020 — nur BGH und OLG Hamburg.” Die Hybrid-Suche kombiniert semantisches Verständnis (“Mietminderung Schimmel”) mit exakten Filtern (Gericht, Datum). Was früher 45 Minuten manuelle Datenbankrecherche kostete, dauert jetzt 8 Sekunden — mit direkten Textausschnitten aus den relevantesten drei Dokumenten.

DSGVO & Datenschutz

  • Unternehmensstandort: Amsterdam, Niederlande — EU-Unternehmen mit DSGVO-Grundanforderungen als Rechtsbasis
  • Datenhosting Self-Hosting: Vollständige Kontrolle — du bestimmst, auf welchem Server in welchem Land deine Daten liegen. On-Premises oder EU-Cloud möglich.
  • Datenhosting Weaviate Cloud: AWS, GCP und Azure — EU-Regionen verfügbar (z. B. eu-west). Datentransfers außerhalb der EU erfolgen über EU-Standardvertragsklauseln (SCC)
  • Zertifizierungen: SOC 2 Type 1, SOC 2 Type 2 und ISO 27001 — für Unternehmenseinsatz relevant
  • Datenverschlüsselung: In Transit und At Rest vollständig verschlüsselt
  • Auftragsverarbeitung (AVV): Über Trust Portal (trust.weaviate.io) zugänglich; für Premium-Kunden standardmäßig verfügbar
  • Datennutzung: Weaviate nutzt keine Inhalte aus selbst gehosteten Instanzen. Cloud-Metadaten (nicht Inhalte) werden für Betrieb und Support genutzt
  • Empfehlung für Unternehmen mit hohen DSGVO-Anforderungen: Self-Hosting auf EU-Infrastruktur ist die sicherste Option. Für alle, die Cloud nutzen: EU-Region explizit beim Cluster-Setup wählen und AVV abschließen.

Gut kombiniert mit

  • OpenSearch — OpenSearch übernimmt klassische Log-Aggregation und Analytics, Weaviate liefert die semantische Suche. Beide Systeme parallel eingesetzt decken Volltext- und Vektorsuchbedürfnisse ab, ohne Kompromisse in einem der Bereiche.
  • Pinecone — In Multi-Cloud-Architekturen nutzen manche Teams Weaviate für DSGVO-sensitive EU-Daten und Pinecone für globale, weniger sensible Workloads — gleiche RAG-API, verschiedene Datenkategorien.
  • Chroma — Chroma als lokale Entwicklungs- und Testdatenbank, Weaviate für Production. Same API-Pattern, einfacher Wechsel: Entwickler iterieren lokal schnell, ohne Produktionsdaten zu riskieren.

Unser Testurteil

Weaviate verdient 4 von 5 Sternen. Die Kombination aus Open-Source-Freiheit, eingebauten Vectorizer-Modulen, nativer Hybrid-Suche und der klaren EU-DSGVO-Story macht es zur besten Wahl für ernst gemeinte RAG-Infrastruktur in datenschutzbewussten Organisationen. Den fünften Stern kostet der fehlende DevOps-freie Einstieg: Wer nicht bereit ist, mindestens einen Engineer für Setup und Betrieb einzuplanen, wird frustriert sein. Für Entwicklerteams mit klaren DSGVO-Anforderungen gibt es aber keine bessere Open-Source-Alternative.

Was wir bemerkt haben

  • 2023 — Weaviate sammelte eine 50-Millionen-Dollar-Series-B-Finanzierungsrunde ein. Das Unternehmen ist finanziell gut aufgestellt und investiert stark in das managed Cloud-Angebot.
  • 2024/2025 — Version 1.30 brachte den BlockMax WAND-Algorithmus mit bis zu 10-fachem Speedup bei Keyword-Suchen — eine erhebliche Performance-Verbesserung für die Hybrid-Search-Anwendungsfälle.
  • 2024 — Weaviate Cloud wurde als vollständig verwalteter Service deutlich ausgebaut. Der freie Trial (14 Tage) blieb bestehen, aber Nutzer, die kostenlose Sandbox-Cluster benötigten, wurden auf den Trial hingewiesen — ein Flex-Plan ohne upfront-Kosten ist die neue Einstiegsoption, aber nach Trial-Ende fallen Kosten an.

Diesen Inhalt teilen:

Empfohlen in 8 Use Cases

Redaktionell bewertet · Preise und Funktionen können sich ändern.

Stimmt etwas nicht?

Preise geändert, Feature veraltet oder etwas fehlt? Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Nicht sicher, ob Weaviate zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag — unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen
Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen — du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar