Zum Inhalt springen
Freemium 🇺🇸 US-Server Geprüft: Mai 2026

Zep

Zep AI, Inc.

4/5
Tool öffnen

Memory-Layer für KI-Agenten und Chatbots, kombiniert temporalen Wissensgraphen mit Fakten-Extraktion und Entity-Tracking. Open-Source-Kern Graphiti plus Zep Cloud als kommerzieller Dienst. P95-Retrieval unter 200 ms macht den Dienst auch für Voice- und Video-Agenten tauglich. Wer keine eigene Memory-Architektur aus pgvector und Redis basteln will, findet hier die produktionsreifere Abkürzung.

Kosten: Graphiti (Open-Source-Kernbibliothek) kostenlos unter Apache-2.0-Lizenz. Zep Cloud Free Tier mit voller API ohne Kreditkarte. Zep Cloud Paid nach Verbrauch (Token-/Nachrichtenkontingent). Zep Enterprise auf Anfrage mit SOC 2 Type 2, HIPAA, dediziertem Support und Self-Hosting-Optionen.

Stärken

  • Temporaler Wissensgraph, invalidiert veraltete Fakten automatisch, statt nur Embeddings zu vergleichen
  • Open-Source-Kern Graphiti unter Apache 2.0, vollständiges Self-Hosting möglich
  • Sub-200-ms-P95-Latenz, schnell genug für Sprach- und Video-Agenten
  • Multi-Source-Ingestion: Chats, JSON-Geschäftsdaten, Dokumente und App-Events landen im selben Graphen
  • Drei-Zeilen-Integration in bestehende Agenten-Frameworks (LangChain, LlamaIndex, Eigenbau)
  • Enterprise-Compliance mit SOC 2 Type 2 und HIPAA-Konformität

Einschränkungen

  • Cloud-Hosting ausschließlich in den USA, keine native EU-Region für Zep Cloud
  • Kein deutschsprachiger Support, Dokumentation komplett auf Englisch
  • Volle Funktionalität (Graph-RAG, Web-Konsole) nur in der Cloud, Self-Hosted Graphiti ist Library, kein Komplettprodukt
  • Konkrete Cloud-Preise nicht öffentlich, Verhandlung pro Use-Case nötig
  • Erfordert klares Mental-Modell von Knoten, Kanten und temporaler Invalidierung, nicht für Hobby-Bastler
  • Junges Produkt (Series A 2024), Roadmap und API noch in Bewegung

Passt gut zu

Entwicklerteams KI-Agenten mit Gedächtnis Customer-Service-Bots Personalisierte Chatbots Voice-Agenten

Wann ja, wann nein

Wann ja

  • Du baust einen Agenten, der sich über mehrere Sessions hinweg an Nutzerpräferenzen, Verträge oder Vorgeschichte erinnern soll
  • Du brauchst Sub-200-ms-Memory-Retrieval für Voice- oder Realtime-Anwendungen
  • Du willst veraltete Fakten automatisch entwerten lassen, ohne selbst Versionierung zu programmieren
  • Du willst zwischen Graphiti (Self-Hosted, Open Source) und Zep Cloud flexibel wechseln können

Wann nein

  • Du brauchst nur einen einzelnen Chat mit kurzem Kontextfenster, direkter LLM-Aufruf reicht
  • Du hast strikte DSGVO-Anforderungen ohne Ressourcen für Self-Hosting, Zep Cloud läuft in den USA
  • Du hast keine Entwicklerkapazität, Zep ist ein Developer-Tool, kein No-Code-Produkt
  • Dein Use-Case ist reine Dokumentensuche, dafür ist eine klassische Vektor-DB einfacher

Kurzfazit

Zep ist die ernsthafte Antwort auf die Frage „Wie behält mein KI-Agent über mehrere Sessions hinweg den Überblick?”, ein Memory-Layer mit temporalem Wissensgraphen, der über bloße Vektor-Embeddings hinausgeht. Statt Konversationen nur als Texthäufchen zu speichern, extrahiert Zep Fakten und Entitäten, baut Beziehungen zwischen ihnen auf und invalidiert veraltete Aussagen automatisch, sobald neue Informationen sie überholen. Der Open-Source-Kern Graphiti steht unter Apache 2.0 und lässt sich vollständig selbst hosten, die Zep Cloud bringt Web-Konsole, Multi-Source-Ingestion und Enterprise-Compliance. Mit P95-Latenzen unter 200 ms ist der Dienst auch für Voice- und Video-Agenten schnell genug. Den fünften Stern verlieren wir wegen des US-only-Hostings, der intransparenten Cloud-Preise und der Tatsache, dass volle Funktionalität nur in der Cloud verfügbar ist.

Für wen ist Zep?

Entwicklerteams mit Agenten in Produktion: Wer einen Agenten baut, der mehr als eine Single-Shot-Frage beantworten soll, etwa Customer-Support, Vertriebs-Assistent oder persönlicher Coach, stößt früh an die Grenzen des Modell-Kontextfensters. Zep löst das Problem auf einer dedizierten Schicht: Memory-Aufbau, -Pflege und -Retrieval bleiben außerhalb des LLM-Calls.

Voice- und Realtime-Anwendungen: Sub-200-ms-Retrieval ist die harte Anforderung, an der viele Vektor-DBs scheitern. Wer einen Sprach-Bot oder einen Echtzeit-Avatar mit Gedächtnis bauen will, braucht genau diese Latenz-Garantie, Zep ist dafür ausgelegt.

Customer-Service- und Vertriebs-Teams mit eigener KI-Plattform: Ein Support-Bot, der weiß, dass der Kunde vor zwei Wochen schon angerufen hat und welches Produkt er hat, ist deutlich nützlicher als einer, der jedes Gespräch bei null beginnt. Zeps Knowledge-Graph macht diese Sicht ohne aufwendige eigene CRM-Integrationen möglich.

Open-Source-affine Architekten: Mit Graphiti gibt es einen ernsthaften Self-Hosting-Pfad. Wer Vendor-Lock-in vermeiden will oder DSGVO-Pflichten hat, kann Graphiti in der eigenen EU-Cloud betreiben und nur die Features nachziehen, die wirklich gebraucht werden.

Forschung und Prototyping in der KI-Agenten-Welt: Wer Multi-Agenten-Architekturen testet oder akademisch zu episodic memory in LLMs forscht, findet in Graphiti eine saubere, dokumentierte Implementierung, deutlich bequemer als alles selbst aus pgvector und Neo4j zusammenzubauen.

Weniger geeignet für: Fachabteilungen ohne Entwicklerkapazität (Zep ist Developer-only), Projekte mit strengen DSGVO-Pflichten und ohne Self-Hosting-Ressourcen, einfache Single-Shot-Use-Cases (Memory ist hier Overkill) und Teams, die reine Volltextsuche wollen, dafür ist eine klassische Vektor-DB wie Qdrant oder Weaviate einfacher und billiger.

Preise im Detail

KomponentePreisWas du bekommst
Graphiti (Open Source)0 USD (Apache 2.0)Vollständige Library für temporale Wissensgraphen, Self-Hosting, Python + TypeScript
Zep Cloud Free Tier0 USDVolle API ohne Kreditkarte, begrenzte Anzahl Nutzer/Sessions, ideal zum Evaluieren
Zep Cloud PaidNach VerbrauchHöhere Limits, Web-Konsole, Multi-Source-Ingestion. Pricing nicht öffentlich kommuniziert, Verhandlung im Sales-Prozess
Zep EnterpriseAuf AnfrageSOC 2 Type 2, HIPAA, dediziertes Support-Team, SLAs, Self-Hosting-Optionen, SSO

Einordnung: Der Free Tier ist mehr als ein Showroom, du bekommst die volle API ohne Kreditkarte und kannst echte Prototypen damit bauen. Sobald aber ein Produktiv-Workload mit Hunderten Sessions/Tag entsteht, verlässt du den Free Tier. Die Tatsache, dass Zep konkrete Paid-Preise nicht öffentlich auflistet, ist ein typisches Signal für Enterprise-Sales-Modell: Du wirst in Gespräche gezogen, statt einen Self-Service-Plan klicken zu können. Wer das vermeiden will, hostet Graphiti selbst, das ist der ehrliche Kompromiss. Für DSGVO-pflichtige Branchen ist Self-Hosting ohnehin der einzige saubere Pfad, weil die Zep Cloud in den USA läuft.

Stärken im Detail

Temporaler Wissensgraph statt platter Embeddings. Klassische RAG-Ansätze speichern Konversationen als Vektoren und holen ähnliche Snippets zurück. Das funktioniert für „Was hat der Nutzer gesagt?”, aber nicht für „Was weiß der Nutzer aktuell?”. Zep extrahiert Fakten als Knoten, baut Beziehungen als Kanten und markiert veraltete Aussagen automatisch als invalide, sobald neuere Informationen sie überholen. „Der Kunde wohnt in Hamburg” wird beim Umzug nach München nicht überschrieben, sondern bekommt einen Gültigkeitszeitraum, und der Agent kennt beide Stände.

Graphiti als ernsthafter Open-Source-Kern. Anders als manche „Open-Core”-Anbieter, die nur eine ausgehöhlte Variante als OSS veröffentlichen, ist Graphiti die echte Engine unter Zep Cloud, verfügbar unter Apache 2.0 auf GitHub, Python und TypeScript. Wer DSGVO-pflichtig ist oder Vendor-Lock-in scheut, hat einen funktionierenden Self-Hosting-Pfad. Das ist im Memory-Layer-Markt selten und ein echter Wettbewerbsvorteil gegenüber rein proprietären Konkurrenten.

Latenz, die für Realtime ausreicht. Zep nennt für die Cloud P95-Retrieval-Latenzen unter 200 Millisekunden, das ist das Niveau, auf dem ein Voice-Agent noch natürlich klingt. Viele Vektor-DBs liegen bei komplexen Hybrid-Queries deutlich darüber. Für Sprach- und Video-Anwendungen, in denen jede Sekunde Verzögerung das Nutzererlebnis kippt, ist das ein konkreter, messbarer Vorteil.

Multi-Source-Ingestion in einem Graphen. Du kannst Chat-Nachrichten, strukturierte JSON-Geschäftsdaten (z. B. CRM-Datensätze), Dokumente und App-Events alle in denselben Knowledge-Graphen ingestieren. Das heißt: Der Agent sieht nicht nur die Konversation, sondern auch „Dieser Kunde hat letzten Monat ein Premium-Abo abgeschlossen”, ohne dass du selbst eine Korrelations-Schicht baust.

Drei-Zeilen-Integration in bestehende Stacks. Wer LangChain oder LlamaIndex nutzt, klemmt Zep mit wenigen Zeilen dazwischen, als Memory-Provider statt als Ersatz. Das senkt die Adoption-Hürde drastisch: Du musst dein Agenten-Framework nicht aufgeben, sondern erweiterst es nur um eine Memory-Schicht.

Enterprise-Compliance bereits vorhanden. SOC 2 Type 2 und HIPAA-Konformität sind im Enterprise-Plan Standard. Für US-Healthcare und regulierte SaaS-Anbieter, die Zep weiterverkaufen, ist das ein realer Türöffner, und die Tatsache, dass ein Series-A-Startup das schon hat, signalisiert eine ernsthafte Enterprise-Strategie.

Schwächen ehrlich betrachtet

Zep Cloud läuft ausschließlich in den USA. Eine native EU-Region wird nicht beworben und ist auch nicht in Aussicht gestellt. Für DSGVO-sensible Workloads (Recht, Medizin, Banking, öffentliche Verwaltung) ist die Cloud schlicht keine Option ohne zusätzliche Standardvertragsklauseln, Datenschutz-Folgenabschätzung und juristisches Risiko-Polster. Der saubere Pfad heißt dann: Graphiti selbst hosten, was Kubernetes-Know-how und Postgres-/Neo4j-Betrieb bedeutet.

Volle Funktionalität nur in der Cloud. Graphiti ist eine Library, keine Komplett-Plattform. Web-Konsole, Multi-Source-Ingestion-Workflows, Dashboards und einige der Convenience-Features sind Cloud-only. Wer Self-Hostet, baut Drumherum-Tooling selbst, das ist Open-Source-Realität, sollte aber in der Aufwandsschätzung stehen.

Cloud-Preise nicht öffentlich. Zep listet keine konkrete Tabelle für den Paid-Plan. Du erfährst die Kosten erst nach Sales-Kontakt, was für Indie-Entwickler oder kleine Teams Reibung erzeugt. Andere Memory-Layer-Konkurrenten (etwa Pinecone für reine Vektor-Suche) sind hier transparenter.

Junges Produkt mit beweglicher API. Zep AI, Inc. hat 2024 die Series A geschlossen und entwickelt rasch weiter. Das ist gut für Features, aber bedeutet auch: API-Versionen, Preismodelle und sogar Produktnamen können sich ändern. Wer auf Zep produktiv setzt, sollte API-Versions-Pinning und Migrationspfade von Anfang an einplanen.

Erfordert ein klares Mental-Modell. Knoten, Kanten, Validity-Periods, Fact-Invalidierung, das ist mehr als „ich pumpe Strings in Embeddings rein”. Wer aus reiner Vektor-RAG-Welt kommt, braucht ein paar Tage, um das Konzept zu durchdringen. Die Dokumentation ist gut, aber komplett auf Englisch.

Kein deutschsprachiger Support, kein deutscher Vertrieb. Anbieter ist ein US-Startup. Tickets, Dokumentation und Sales laufen ausschließlich auf Englisch. Für deutsche Mittelständler, die einen Ansprechpartner in der eigenen Zeitzone und Sprache erwarten, ist das ein Reibungspunkt, der bei Open-Source-Self-Hosting weniger schmerzt als bei Cloud-Verträgen.

Alternativen im Vergleich

Wenn du……nimm stattdessen
Klassische Vektor-Suche ohne Graph-Memory brauchstPinecone
Selbstgehostete Open-Source-Vektor-DB mit aktiver EU-Community willstWeaviate
Memory innerhalb eines Agenten-Frameworks willst, ohne separate SchichtLangChain
Den schnellsten Weg zu RAG ohne Memory-Komplexität willstLlamaIndex
Workflow-Automatisierung um den Agenten herum brauchstn8n

Erwähnenswert ohne eigene Tool-Seite: Mem0 (direkter Konkurrent, ebenfalls auf Memory-Layer für Agenten spezialisiert, mit etwas anderem Architektur-Ansatz), Letta (vormals MemGPT, akademisch geprägt, fokussiert auf agentic memory), Redis in Kombination mit eigenem Embedding-Pipeline (wer sich die volle Komplexität antun will) sowie pgvector auf Postgres (für minimal-invasive Setups). Zep ist im Memory-Layer-Markt 2026 das produktionsreifste Komplettangebot, wer DSGVO-pflichtig ist, baut aber häufig auf Graphiti Self-Hosted oder eine pgvector-Eigenlösung.

So steigst du ein

Schritt 1: Graphiti lokal ausprobieren. Installiere pip install graphiti-core und durchlaufe das offizielle Quickstart-Notebook mit einer Beispiel-Konversation. Das vermittelt das mentale Modell, Knoten, Kanten, Fakten-Extraktion, Invalidierung, in ein bis zwei Stunden. Erst wenn du verstanden hast, wie der Graph wächst und sich selbst pflegt, sind die nächsten Schritte sinnvoll.

Schritt 2: Free Tier in Zep Cloud anmelden und einen echten Use-Case verbinden. Registriere dich auf getzep.com ohne Kreditkarte, hole einen API-Key und schließe Zep an einen vorhandenen Prototyp an, etwa einen Customer-Support-Bot mit drei Beispiel-Nutzern. Lass den Bot über mehrere Sessions laufen und beobachte in der Web-Konsole, wie der Knowledge-Graph wächst.

Schritt 3: Architektur-Entscheidung treffen. Spätestens nach zwei Wochen Evaluation steht die Frage: Cloud oder Self-Hosted? Cloud wenn du USA akzeptierst und schnell skalieren willst, Self-Hosted wenn DSGVO oder Vendor-Lock-in-Vermeidung vorrangig ist. Graphiti unter Self-Hosting braucht Postgres und etwas Betriebsaufwand, ist aber technisch geradlinig.

Schritt 4: Produktivierung mit Versionierung und Monitoring. Wenn der Agent live geht, pinne die Zep-/Graphiti-Version, baue Migrationsfähigkeit in deinen Code (Schema-Versionen können sich ändern) und richte Tracing ein, etwa über LangSmith oder ein eigenes OpenTelemetry-Setup. Memory-Bugs sind notorisch schwer zu debuggen, ohne Trace bist du blind.

Ein konkretes Beispiel

Ein Berliner SaaS-Anbieter (35 Mitarbeitende, B2B-Tool für Recruiting-Agenturen) baut einen KI-Vertriebsassistenten, der mit Interessenten über Wochen hinweg sprechen und sich an alles erinnern soll: gewünschtes Modul, Branche, Bestandssystem, Bedenken aus früheren Calls. Architektur: Graphiti Self-Hosted in einer Hetzner-Cloud-VM in Falkenstein, Postgres mit pgvector als Backend, ein Python-FastAPI-Service als Wrapper, Anbindung an Claude Sonnet via AWS Bedrock Frankfurt für die Antwort-Generation. Workflow: Jede Konversation, jede E-Mail-Antwort und jedes CRM-Update werden in den Graphen ingestiert; vor jeder neuen Antwort holt der Agent den relevanten Subgraphen für diesen Lead. Spürbarer Effekt: Die Sales-Abschlussquote bei „warmen” Leads (3+ Touchpoints) steigt um ca. 18 Prozent, weil der Bot sich an Detail-Wünsche aus dem ersten Call erinnert. Aufwand: zwei Entwickler, sechs Wochen für MVP, weitere vier für Härtung. Ohne Zep/Graphiti hätte das Team eine eigene Memory-Schicht aus pgvector und Custom-Fact-Extraction bauen müssen, geschätzt drei Monate Mehraufwand.

DSGVO & Datenschutz

  • Zep Cloud: Hosting ausschließlich in den USA. Anbieter ist Zep AI, Inc. (US-Gesellschaft). Für DSGVO-sensible Workloads keine Empfehlung ohne zusätzliche Maßnahmen (Standardvertragsklauseln, Datenschutz-Folgenabschätzung, möglichst keine personenbezogenen Daten).
  • Graphiti Self-Hosted: Vollständige Kontrolle über Hosting-Region. Lässt sich in jeder EU-Cloud (AWS Frankfurt, Hetzner, OVH, Azure West Europe) deployen. DSGVO-konforme Architektur ist damit machbar, erfordert aber eigene Datenbank-Operations.
  • Datennutzung: Zep gibt an, Kundendaten nicht für Modell-Training zu verwenden. Bei Graphiti Self-Hosted irrelevant, keine Daten verlassen die eigene Infrastruktur.
  • Compliance-Zertifikate: SOC 2 Type 2 und HIPAA für Zep Cloud Enterprise. Für deutsche Behörden- oder Bankenkunden zusätzlich BSI-/EBA-Anforderungen prüfen.
  • Auftragsverarbeitung (AVV): Für Zep Cloud Enterprise auf Anfrage verfügbar. Bei Self-Hosting nicht relevant.
  • Empfehlung für Unternehmen: Cloud nur für interne Tools mit unkritischen Daten oder für US-Märkte. Bei DSGVO-Pflichten: Graphiti in eigener EU-Cloud hosten und gegen die hauseigenen LLM-Schnittstellen (etwa Azure OpenAI EU oder Bedrock Frankfurt) verbinden.

Gut kombiniert mit

  • LangChain, Zep klemmt sich als Memory-Provider in eine LangChain-Pipeline. Du behältst die Vorteile des Frameworks und gewinnst den temporalen Wissensgraphen ohne Eigenbau.
  • Claude, Claude liefert die Antworten, Zep den Kontext. Über AWS Bedrock Frankfurt entsteht damit eine DSGVO-tragfähige Kombination, wenn du Graphiti zusätzlich selbst hostest.
  • n8n, wenn die Memory-Aktualisierung per Workflow ausgelöst werden soll (z. B. neuer CRM-Eintrag → Fact ingestieren), übernimmt n8n die Orchestrierung. So bekommt der Agent automatisch neue Geschäftsdaten in seinen Graphen.

Unser Testurteil

Zep verdient 4 von 5 Sternen. Es ist der produktionsreifste Memory-Layer-Anbieter im Markt 2026, und mit Graphiti unter Apache 2.0 die einzige Lösung in dieser Klasse mit einem ernsthaften Open-Source-Pfad. Der temporale Wissensgraph ist konzeptionell stärker als reine Vektor-Embeddings und löst echte Probleme (veraltete Fakten, Multi-Session-Persistenz). Den fünften Stern verlieren wir wegen des US-only-Hostings der Cloud, der fehlenden Preistransparenz im Paid-Plan und der Tatsache, dass volle Funktionalität nur in der Cloud verfügbar ist. Für Entwicklerteams, die einen Agenten mit echtem Gedächtnis bauen wollen, und das sind 2026 zunehmend viele, ist Zep mindestens evaluierungspflichtig. Wer DSGVO-konform arbeiten muss, geht Graphiti Self-Hosted, wer in den USA skaliert, nimmt die Cloud.

Was wir bemerkt haben

  • 2024, Zep AI, Inc. hat die Series A geschlossen (Investor unter anderem Engineering Capital). Das Produkt hat sich seit dem Wechsel von „Memory Server” zur „Context Engineering Platform” deutlich repositioniert, weg vom reinen Backend, hin zum vollwertigen Agenten-Memory-Stack.
  • 2024, Graphiti wurde als eigenständiges Open-Source-Projekt unter Apache 2.0 ausgegliedert. Damit hat Zep die strategische Entscheidung getroffen, den eigenen Kern offen zu legen, ein im Memory-Layer-Markt seltener Schritt, der die Adoption sichtbar beschleunigt hat.
  • 2025, Konkurrenz im Memory-Layer-Segment ist deutlich gewachsen: Mem0, Letta (vormals MemGPT) und mehrere Eigenbau-Lösungen großer LLM-Anbieter drängen in dieselbe Nische. Zep behält bislang den Vorsprung bei Graph-Modellierung und Latenz, der Markt sortiert sich aber gerade neu.
  • 2025, SOC 2 Type 2 und HIPAA-Compliance offiziell ausgerollt, ein klares Signal in Richtung US-Healthcare und regulierte SaaS-Verticals. Für deutsche Compliance-Anforderungen ist das nicht unmittelbar relevant, aber ein Indikator für Enterprise-Reife.
  • Mai 2026, Eine native EU-Region für Zep Cloud wurde nicht angekündigt. Wer DSGVO-konform arbeiten will, bleibt auf Graphiti Self-Hosting angewiesen. Diese Lücke ist seit Produktstart unverändert und ein wiederkehrendes Verkaufsthema in europäischen Sales-Gesprächen.

Diesen Inhalt teilen:

Arthur Atlas

KI-Analyst

So entsteht diese Bewertung

Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.

Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.

Preise geändert, Feature veraltet oder etwas fehlt?

Wir freuen uns über Hinweise und Ergänzungen.

Feedback geben

Du arbeitest bei Zep AI, Inc.?

Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.

Testzugang anbieten

Nicht sicher, ob Zep zu euch passt?

Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.

Erstgespräch anfragen
Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar