Vapi ist eine Developer-First-API-Plattform für KI-Sprachagenten. Wer Voice-Bots vollständig per Code und API steuern will, LLM, TTS und Telefonie getrennt konfigurierbar, findet hier maximale Flexibilität. Für Nicht-Entwickler ungeeignet; Kosten summieren sich durch Add-ons stärker als bei Konkurrenten. Marktführer im technischen Developer-Segment für Voice-AI-Infrastruktur.
Kosten: Pay-as-you-go: 0,05 USD/Min. Vapi-Hosting + durchgeleitete Kosten für LLM, TTS und STT. Reale Gesamtkosten typisch 0,14–0,33 USD/Min. Telefonnummer: 2 USD/Monat. HIPAA: 2.000 USD/Monat, Zero Data Retention: 1.000 USD/Monat. Kein Free-Plan, kein festes Monatsmindest.
Kategorien
Stärken
- Maximale Entwicklerfreiheit: eigenes LLM, eigene TTS-Engine, eigenes SIP-Telefonie frei wählbar
- Vollständige API-Kontrolle, jede Komponente des Voice-Stacks unabhängig konfigurierbar
- Pay-as-you-go ohne Plattformgebühr, günstig für niedrige Volumen und Pilotprojekte
- Breite SDK-Unterstützung: Python, TypeScript, React, Web; gute Dokumentation
- Aktive Entwickler-Community (Discord) mit schneller Peer-Support-Kultur
Einschränkungen
- Keine grafische Oberfläche für Nicht-Entwickler, Business-Nutzer können Vapi nicht selbst bedienen
- Echte Gesamtkosten erst nach Produktivbetrieb erkennbar (LLM + TTS + STT + Telefonie summieren sich)
- US-Datenhaltung ohne EU-Alternative im Standard, DSGVO-kritisch
- HIPAA-Compliance kostet 2.000 USD/Monat extra, kein Standard im Build-Plan
- Kein dedizierter Account-Support im Build-Plan, nur Discord und E-Mail
Passt gut zu
Wann ja, wann nein
Wann ja
- Du bist Entwickler und willst Voice-AI per API vollständig kontrollieren
- Du möchtest dein eigenes LLM oder deine eigene TTS-Engine mit Telefonie-Infrastruktur kombinieren
- Du brauchst flexibles Pay-as-you-go ohne monatliche Grundgebühr
- Du baust einen dedizierten Voice-Bot als Teil einer eigenen Anwendung
Wann nein
- Du suchst eine No-Code-Lösung für Business-Nutzer ohne Entwickler im Team
- Du brauchst DSGVO-konformes EU-Hosting für die Sprachdaten
- Du willst einen fertigen Voice-Bot mit vorgefertigten Gesprächsflüssen ohne Code
- Dein Budget ist begrenzt und HIPAA-Compliance ist Pflicht, 2.000 USD/Monat wirkt schnell
Kurzfazit
Vapi ist die technischste und flexibelste Voice-AI-Plattform im Markt, und genau das ist sowohl ihre Stärke als auch ihre klare Einschränkung. Entwicklerteams, die einen Sprachagenten mit ihrem eigenen LLM, einer bestimmten TTS-Stimme und eigenem Telefonie-Setup bauen wollen, finden hier die sauberste API-Schicht dafür. Wer dagegen einen fertigen, konfigurierbaren Voice-Bot ohne Entwicklungsaufwand sucht, ist bei Retell AI oder spezialisierten No-Code-Lösungen besser aufgehoben. Die Kosten von Vapi sehen im Basis-Tarif günstig aus (0,05 USD/Min.), aber LLM, TTS, STT und Telefonie kommen obendrauf, realistische Gesamtkosten liegen bei 0,14–0,33 USD/Minute je nach Stack. DSGVO-konformes Hosting in der EU gibt es nicht ohne Scale-Vertrag.
Für wen ist Vapi?
Softwareentwickler und technische Gründer: Vapi ist primär eine API, keine Low-Code-Plattform, keine grafische Oberfläche für Business-Nutzer. Wer Python oder TypeScript beherrscht und einen Voice-Agenten als Bestandteil einer eigenen Applikation bauen will, findet in Vapi die sauberste Abstraktionsschicht. Das SDK ist gut gepflegt, die Dokumentation vollständig.
Unternehmen mit eigenen Modellen oder spezifischen LLM-Anforderungen: Vapi erzwingt kein bestimmtes Sprachmodell. Du kannst GPT-4o, Claude, Llama oder ein eigenes Fine-Tuned Model als Gehirn des Voice-Bots verwenden. Gleiches gilt für TTS (ElevenLabs, Azure, Deepgram, Google) und STT (Deepgram, AssemblyAI). Diese Modularität ist einzigartig im Markt.
Startups in der Wachstumsphase: Der Pay-as-you-go-Ansatz ohne Plattformgebühr ist attraktiv für Volumen, das stark schwankt. In Phasen ohne Anrufe entstehen keine Grundkosten. Wenn das Produkt wächst, kann auf den Scale-Plan mit Volumenrabatten gewechselt werden.
Entwicklerteams in US-amerikanischen Unternehmen oder DSGVO-unkritischen Bereichen: Wer die Datenschutzanforderungen einer US-amerikanischen oder globalen Kundschaft bedient und keine EU-spezifischen Compliance-Anforderungen hat, kann die US-Datenhaltung problemlos akzeptieren.
Weniger geeignet für: Business-Nutzer ohne Entwickler im Team, Unternehmen mit DSGVO-kritischen Sprachdaten, kleine Teams ohne Kapazität für den initialen Engineering-Aufwand und Organisationen, die sofortige HIPAA-Compliance ohne Zusatzkosten benötigen.
Preise im Detail
| Plan | Basispreis | Kosten pro Minute | Was du bekommst |
|---|---|---|---|
| Build | 0 $/Monat + Verbrauch | 0,05 $/Min. (Vapi) + Modell-Kosten | Community-Support, 10 parallele Leitungen, Pay-as-you-go |
| Scale | Auf Anfrage (Jahresvertrag) | Volumenrabatt verhandelbar | Enterprise-Compliance, SSO, RBAC, Data Residency, dedizierter Account Manager |
| HIPAA-Add-on | 2.000 $/Monat | - | HIPAA Business Associate Agreement |
| Zero Data Retention | 1.000 $/Monat | - | Keine Speicherung von Anrufprotokollen und Transkripten |
Vollständige Kostenrechnung (Beispiel): Ein einfacher Vapi-Bot mit GPT-4o mini als LLM, Deepgram für STT und Deepgram TTS: ca. 0,05 + 0,007 + 0,008 + 0,015 = ca. 0,08 USD/Min. Bei ElevenLabs TTS: ca. 0,05 + 0,007 + 0,008 + 0,08 = ca. 0,145 USD/Min. Bei GPT-4o (statt mini): schnell über 0,25 USD/Min. Telefonnummern kosten zusätzlich 2 USD/Monat pro Nummer.
Einordnung: Vapi ist für niedrige Volumina und Pilotprojekte günstig. Bei skalierten Produktionsbetrieben summieren sich die Kosten erheblich, ein Bot mit 10.000 Minuten pro Monat kostet realistisch 1.400–3.300 USD allein für den Betrieb. HIPAA-Compliance (+2.000 USD/Monat) und Zero Data Retention (+1.000 USD/Monat) sind massive Aufschläge, die die Basis-Preisgünstigkeit konterkarieren. Wer diese Anforderungen hat, sollte den Total Cost of Ownership sorgfältig kalkulieren.
Stärken im Detail
Vollständig modularer Voice-Stack. Vapi ist das einzige Tool im Markt, das LLM, TTS und STT vollständig unabhängig konfigurierbar macht, und dabei sowohl API-Schlüssel des Nutzers (“bring your own key”) als auch Vapi-verwaltete Integrationen unterstützt. Das ermöglicht Kostenoptimierung auf jeder Ebene: Für schnelle Kurz-Antworten ein günstiges Modell, für komplexe Analyse ein leistungsstärkeres.
Erstklassige Dokumentation für Entwickler. Die Dokumentation auf docs.vapi.ai ist vollständig, enthält Code-Beispiele in Python, TypeScript und curl, und wird aktiv gepflegt. Webhooks, Event-Schemas, Edge Cases bei Stille-Erkennung und Gesprächsende, alles ist dokumentiert. Das ist für eine Developer-Tool-Plattform in diesem Reifegrad ungewöhnlich gut.
Pay-as-you-go ohne Lock-in. Keine Mindestumsätze, keine Vertragslaufzeit, kein Plattform-Fee im Build-Plan. Für Startups und Pilotprojekte ist das ein echter Vorteil, man zahlt erst, wenn tatsächlich Minuten anfallen. Wer 500 Minuten pro Monat braucht, zahlt entsprechend wenig; wer skaliert, wechselt auf Scale mit verhandelten Volumenpreisen.
Aktive Community und schneller Peer-Support. Der Vapi-Discord-Server ist einer der aktivsten im Voice-AI-Bereich mit mehreren tausend Entwicklern, die sich gegenseitig helfen und Vapi-Entwickler, die regelmäßig Fragen beantworten. Für technische Teams mit spezifischen Integrationsfragen ist das ein echter Mehrwert.
Breite Telefonie-Kompatibilität. Vapi unterstützt In- und Outbound-Telefonie über mehrere Provider (Twilio, Vonage, eigenes SIP), WebRTC für browserbasierte Anwendungen und Web-SDK für direkte App-Integration. Das ermöglicht flexible Deployment-Modelle je nach Infrastruktur.
Schwächen ehrlich betrachtet
Keine grafische Oberfläche für Business-Nutzer. Vapi ist eine API, Punkt. Es gibt zwar ein Dashboard zum Testen und Monitoring, aber wer einen Gesprächsfluss ohne Code ändern will, ist hier falsch. Jede inhaltliche Anpassung des Bots erfordert Code-Änderungen und einen Deploy-Zyklus. Teams ohne dauerhaft verfügbare Entwickler können Vapi nicht selbst betreiben.
Kostenkomplexität schafft Budget-Unsicherheit. Die Preisseite zeigt nur die Vapi-Basiskosten (0,05 USD/Min.), was der reale Stack kostet, erfährt man erst nach eigener Kalkulation. Gerade in frühen Projekten unterschätzen Teams regelmäßig die LLM- und TTS-Kosten. Auch Inaktivitätskosten durch gehaltene Telefonleitungen können unerwartet auftauchen.
US-Datenhaltung ist ein echtes DSGVO-Problem. Sprachtranskripte enthalten häufig personenbezogene Daten. Ohne Data Residency-Option (nur im Scale-Plan) werden alle Daten auf US-Servern verarbeitet. Für europäische Unternehmen mit Kundenkontakt ist das ein handfestes Compliance-Risiko. Zero Data Retention löst das Problem teilweise, kostet aber 1.000 USD/Monat extra.
HIPAA ist ein Luxusfeature, kein Standard. Im US-amerikanischen Healthcare-Bereich ist HIPAA oft Voraussetzung. Dass die HIPAA-Compliance 2.000 USD/Monat kostet, unabhängig vom genutzten Volumen, macht Vapi für kleine Healthcare-Anbieter wirtschaftlich unattraktiv. Retell AI und andere Wettbewerber haben HIPAA teils in niedrigeren Plan-Stufen integriert.
Support-Qualität unterhalb des Scale-Plans ist Community-getrieben. Im Build-Plan gibt es keinen dedizierten Account-Manager und keinen garantierten Response-Time-SLA. Wer in Produktion ein kritisches Problem hat und nachts auf Discord-Antworten wartet, wird das als Risiko empfinden.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Einen No-Code-Voice-Bot ohne Entwickleraufwand brauchst | Retell AI |
| Voice-Infrastruktur mit Telefonie-Integration und mehr Vorkonfiguration suchst | Twilio |
| Hochwertige TTS-Stimmen als zentralen Baustein brauchst | ElevenLabs |
| Speech-to-Text als primären Use Case hast | Deepgram |
Retell AI ist der direkteste Wettbewerber mit mehr Low-Code-Komfort, besser für Teams ohne dedizierten Voice-AI-Ingenieur. Twilio bietet mehr Telefonie-Tiefe und Enterprise-Compliance ohne die Modulkosten-Komplexität, ist aber teurer in der Grundgebühr. Bland AI (ohne eigene Seite hier) ist ein weiterer Developer-Wettbewerber mit ähnlichem Ansatz, aber kleinerem Community-Ökosystem.
So steigst du ein
Schritt 1: Account auf vapi.ai erstellen und die Dokumentation (docs.vapi.ai) als ersten Stop nutzen. Vapi setzt Python- oder TypeScript-Kenntnisse voraus. Starte mit dem Quickstart für einen einfachen Inbound-Agenten, ein lauffähiger Test-Bot ist in 30 Minuten aufgebaut. Verknüpfe eine Telefonnummer (2 USD/Monat) und konfiguriere ein einfaches LLM (z. B. GPT-4o mini über eigenen API-Key).
Schritt 2: Jede Stack-Komponente bewusst wählen. TTS-Engine (ElevenLabs für beste Qualität, Deepgram für niedrigste Kosten), STT-Anbieter (Deepgram empfohlen für Echtzeit, AssemblyAI für bessere Transkriptqualität bei Fachvokabular) und System-Prompt des LLM. Dieser modulare Konfigurationsschritt ist Vapis größter Hebel, plane dafür explizite Zeit ein.
Schritt 3: Webhooks für Events aufbauen (Anruf gestartet, Transkript verfügbar, Anruf beendet) und in das eigene Backend-System integrieren. Erst wenn der vollständige Datenpfad, von Anruf über Transkript bis zur CRM-Aktualisierung, automatisiert ist, ist der eigentliche Wert von Vapi realisiert. Kalkulation: Plane für eine vollständige Integration zwei bis drei Entwicklertage ein.
Ein konkretes Beispiel
Ein SaaS-Unternehmen mit 40 Mitarbeitenden entwickelt ein Produkt für die Immobilienverwaltung. Neue Nutzer können nach dem Onboarding per Sprachanruf Fragen zur Software-Einrichtung stellen, der Vapi-Bot greift per RAG auf die aktuelle Produktdokumentation zurück und beantwortet Konfigurationsfragen auf Deutsch in Echtzeit. Das Entwicklerteam hat bewusst Vapi gewählt, weil eigene API-Keys für GPT-4o mini und Deepgram eingebracht werden konnten, Vapi verwaltet nur die Verbindungsschicht. Der Aufbau hat drei Entwicklertage gedauert (ein Tag Vapi-Integration, ein Tag Webhook-Backend, ein Tag Testing). Die laufenden Kosten liegen bei ca. 200 USD/Monat für rund 2.000 Minuten monatlicher Nutzung, deutlich günstiger als eine Full-Service-Voice-AI-Plattform mit Plattformgebühr.
DSGVO & Datenschutz
- Datenhosting: USA (Vapi AI Inc., San Francisco). Keine EU-Region im Standard-Build-Plan verfügbar.
- Data Residency: Nur im Scale-Plan (Enterprise-Vertrag) optional konfigurierbar. Kein Self-Service für EU-Hosting.
- Datennutzung: Vapi speichert standardmäßig Anrufaufzeichnungen, Transkripte und Metadaten. Retention: 14 Tage im Build-Plan (konfigurierbar im Scale-Plan).
- Zero Data Retention: Option für 1.000 USD/Monat, keine Speicherung von Transkripten und Aufzeichnungen. Sinnvoll für datenschutzsensitive Anwendungen, aber mit erheblichem Aufschlag.
- HIPAA: Business Associate Agreement (BAA) für 2.000 USD/Monat verfügbar. SOC 2 Type II und PCI-DSS sind im Scale-Plan enthalten.
- Empfehlung für Unternehmen: Für DSGVO-konforme Anwendungen mit Sprachdaten ist Vapi in der Standard-Konfiguration problematisch. Entweder Scale-Plan mit Data Residency evaluieren oder eine Alternative mit nativem EU-Hosting (z. B. Twilio mit EU-Region) prüfen. Keine vertraulichen personenbezogenen Daten im Build-Plan verarbeiten.
Gut kombiniert mit
- ElevenLabs, für hochwertige, natürlich klingende Stimmen im Voice-Bot. Vapi integriert ElevenLabs direkt als TTS-Provider; die Stimmqualität ist der größte wahrnehmbare Qualitätsunterschied für Endnutzer.
- Deepgram, als STT-Engine für Echtzeit-Transkription mit niedrigen Latenzen. Deepgram-Integration ist in Vapi nativ und bietet das beste Preis-Latenzverhältnis für die meisten Anwendungsfälle.
- Twilio, für erweiterte Telefonie-Infrastruktur: Vapi übernimmt den Voice-AI-Layer, Twilio liefert die Enterprise-Telefonie (Rufnummernverwaltung, internationale Nummern, Compliance-Features). Diese Kombination ermöglicht anspruchsvolle Produktionssysteme.
Unser Testurteil
Vapi verdient 3 von 5 Sternen. Für Entwicklerteams, die maximale Kontrolle über ihren Voice-AI-Stack wollen, ist Vapi die technisch überlegene Wahl, keine andere Plattform bietet diese Modulfreiheit. Was den vierten Stern kostet: Die Kostenkomplexität (Basispreis plus drei bis vier Add-on-Komponenten), das DSGVO-Problem ohne EU-Hosting-Option, der fehlende No-Code-Layer für Business-Nutzer und die prohibitiven Preise für HIPAA und Zero Data Retention. Vapi ist ein hervorragendes Werkzeug für das richtige Profil, aber das ist ein deutlich engeres Profil als die Marketing-Botschaft impliziert. Wer kein Entwicklerteam hat oder DSGVO-kritische Daten verarbeitet, sollte zu einer Alternative greifen.
Was wir bemerkt haben
- 2025, Vapi hat den Scale-Plan mit Enterprise-Features (SOC 2, HIPAA, PCI, SSO, Data Residency) eingeführt, der nur per Jahresvertrag verfügbar ist. Die klare Plan-Trennung zwischen “Build” (selbst konfigurieren, Community-Support) und “Scale” (Enterprise-Vertrag) macht Vapi für professionelle Produktionsumgebungen teurer als es auf den ersten Blick wirkt.
- 2025, Die HIPAA-Compliance-Kosten wurden von 1.000 USD/Monat auf 2.000 USD/Monat erhöht. Für kleine Healthcare-Anbieter ist das ein signifikanter Kostentreiber, der Vapi im US-Healthcare-Markt weniger wettbewerbsfähig macht.
- 2024–2025, Das Vapi-Ökosystem ist erheblich gewachsen: mehr Integrationen (Bland AI, neue TTS-Provider), bessere SDK-Coverage, aktivere Community. Der Discord-Server gilt im Developer-Umfeld als einer der hilfreichsten im Voice-AI-Bereich.
- Stand Mai 2026, Eine native EU-Hosting-Option außerhalb eines Scale-Enterprise-Vertrags ist nicht verfügbar. Für DSGVO-kritische Voice-Anwendungen ist das ein fortbestehender Einschränkungsfaktor.
Quellen
- Vapi – Pricing. https://vapi.ai/pricing (abgerufen am 2026-06-20). Build-Plan: 0,05 USD/Min. Vapi-Kosten plus durchgeleitete Modellkosten; HIPAA-Add-on 2.000 USD/Monat; Zero Data Retention 1.000 USD/Monat. Parallelleiter im Build-Plan inklusive (10 Leitungen), Scale-Plan mit Volumenrabatten und Enterprise-Features auf Anfrage..
- Vapi – Privacy Policy. https://vapi.ai/privacy (abgerufen am 2026-06-20). Datenverarbeitung erfolgt in den USA (Vapi Inc.); keine EU-Datenhaltungsoption im Standard-Plan; DSGVO-Rechte für EU/EEA-Nutzer werden anerkannt, jedoch ohne dedizierte EU-Region..
Diesen Inhalt teilen:
Empfohlen in 1 Use Cases
Branchenübergreifend
Empfohlen für diese Branchen
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei Vapi AI Inc.?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob Vapi zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.
KI-Tools und Trends
KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools
Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.