Retell AI ist eine US-Plattform für KI-Voice-Agenten, die eingehende und ausgehende Telefongespräche automatisieren, Terminvereinbarungen, Lead-Qualifizierung, After-Hours-Annahme. Kernstärke ist der visuelle Flow-Builder mit Pay-as-you-go-Abrechnung und überdurchschnittlich niedriger Latenz. Schwächen: kein EU-Hosting für Standardkunden, englische Oberfläche, deutsche Sprachqualität hängt stark von der gewählten TTS-Engine ab.
Kosten: Pay-as-you-go ab 0,07 USD/Min. (Basis-Voice-Engine); realistisch 0,11–0,20 USD/Min. inkl. LLM, TTS, Telefonie und Knowledge-Base-Aufschlag. Telefonnummern 2 USD/Monat. 20 gleichzeitige Anrufe inklusive. 10 USD Startguthaben. Enterprise auf Anfrage.
Kategorien
Stärken
- Visueller Drag-and-Drop-Builder, Voice Agent in Minuten ohne Code aufsetzen
- Transparente Pay-as-you-go-Preisstruktur ohne Plattform-Monatsgebühr
- Gute Latenzwerte (unter 800 ms) für natürlich klingende Konversation
- Modellwahl bei LLM und TTS: GPT-4.1, Claude 4.5, Gemini 2.5, ElevenLabs, Cartesia, Deepgram
- 20 gleichzeitige Anrufe kostenlos im Standardplan, Skalierung über Add-on (8 USD/Concurrent)
- Integrationen mit HubSpot, Salesforce, Calendly, Zapier, Make.com via API/Webhook
- SOC-2 Type II, HIPAA-Compliance und Enterprise-On-Prem-Option verfügbar
Einschränkungen
- Daten auf US-Servern, kein EU-Hosting für Standardkunden, EU-Residency nur Enterprise-On-Prem
- Oberfläche und Support auf Englisch, keine deutsche Dokumentation
- Reale Kosten höher als advertised: 0,07 USD/Min. ist nur die Voice-Engine, nicht all-in
- Deutsche Sprachqualität von der gewählten TTS-Engine abhängig, nicht standardmäßig optimiert
- Halluzinationsrisiko ohne sorgfältige Wissensbasis-Konfiguration und Eskalationsregeln
- Branded Call (Caller-ID-Authentifizierung) nur in den USA verfügbar, in DACH kein Vorteil
Passt gut zu
Kurzfazit
Retell AI ist eine der besseren Pay-as-you-go-Plattformen für KI-Voice-Agenten, schnelle Einrichtung, niedrige Latenz, freie Modellwahl bei LLM und Sprachsynthese. Wer einen Terminbot, eine Lead-Qualifizierung oder einen After-Hours-Agent für Standardanfragen braucht, kommt mit dem visuellen Builder in wenigen Stunden zu einem produktionsfähigen Ergebnis. Die Schwäche liegt eindeutig im DACH-Kontext: Kein EU-Hosting für Standardkunden, englische Oberfläche und eine deutsche Sprachqualität, die maßgeblich von der gewählten TTS-Engine (ElevenLabs, Cartesia) abhängt. Für DSGVO-sensible Branchen oder Kundengespräche, in denen ein hörbarer Akzent stört, ist Retell die zweite Wahl gegenüber europäischen Konkurrenten.
Für wen ist Retell AI?
KMU mit hohem Anrufaufkommen außerhalb der Bürozeiten: Handwerksbetriebe, Praxen, Immobilienverwaltungen und kleine Dienstleister, die abends und am Wochenende Anrufe verlieren oder Mitarbeitende übermäßig binden. Retell nimmt strukturierte Anfragen entgegen, erstellt ein Ticket und eskaliert Notfälle, typische Kosten 80–150 USD/Monat statt eines bezahlten Bereitschaftsdienstes.
Sales-Teams für Lead-Qualifizierung: Inbound-Leads aus Web-Formularen oder Outbound-Kampagnen werden von einem Voice-Agenten vorqualifiziert (Budget, Zeitrahmen, Entscheider), bevor ein menschlicher SDR übernimmt. Bei hohen Lead-Volumen amortisiert sich der Agent schnell, weil Kaltakquise-Stunden eingespart werden.
Entwickler und Agenturen, die Voice-Lösungen für Kunden bauen: Der visuelle Builder kombiniert mit der API-Tiefe macht Retell zur ernsthaften Alternative zu Twilio-Eigenbau. Wer mehrere Kunden mit ähnlichen Use-Cases bedient, kann Templates wiederverwenden und über die Custom-LLM-Schnittstelle eigene Logik einbinden.
Power-User, die Modellwahl brauchen: Wer experimentieren will (GPT-4.1 vs. Claude 4.5 vs. Gemini 2.5) oder eine spezifische Stimme (ElevenLabs vs. Cartesia vs. Deepgram) testen will, bekommt mit Retell eine Plattform, die das offen erlaubt, ohne sich auf einen einzigen Stack festzulegen.
Weniger geeignet für: Anwälte, Ärzte, Steuerberater und Behörden mit DSGVO-Pflicht (US-Hosting ist ohne Enterprise-On-Prem ein echtes Hindernis), Unternehmen mit anspruchsvoller deutscher Stimm-Qualität (die TTS-Lücke zu europäischen Spezialisten ist hörbar), und Anwender, die deutsche Oberfläche und deutschsprachigen Support erwarten.
Preise im Detail
| Plan | Preis | Was du bekommst |
|---|---|---|
| Free Tier | 0 USD + 10 USD Startguthaben | Voller Plattformzugriff, 20 gleichzeitige Anrufe, Community-Support |
| Pay-as-you-go (Voice) | 0,07–0,31 USD/Min. + Add-ons | Voice-Engine 0,055 USD/Min., LLM 0,006–0,08 USD/Min., TTS 0,015–0,040 USD/Min. |
| Pay-as-you-go (Chat) | ab 0,002 USD/Nachricht | KI-Chat-Agenten für Web und Messaging |
| Add-ons | variabel | Knowledge Base +0,005 USD/Min., Denoising +0,005 USD/Min., PII Removal +0,01 USD/Min., Branded Call +0,10 USD/Outbound |
| Telefonnummern | 2 USD/Monat (10 USD verifiziert) | Inbound-Nummer, USA und weitere Länder |
| Zusätzliche Concurrency | 8 USD/Concurrent Call/Monat | Skalierung über die 20 inklusiven Calls hinaus |
| Enterprise | Auf Anfrage | SLA, Priority-Support, On-Prem-Option, dedizierte Compliance-Klärung, EU-Residency |
Einordnung: Die advertised 0,07 USD/Min. sind nur der Einstiegspreis der Voice-Infrastruktur, realistisch landest du bei 0,11–0,20 USD/Min. (rund 6–12 Cent in Euro), sobald du LLM, TTS, Knowledge Base und Telefonkosten zusammenrechnest. Ein typisches 3-Minuten-Gespräch kostet 0,40–0,60 USD. Bei 200 Anrufen pro Monat sind das ca. 100 USD plus Nummer, günstig im Vergleich zu menschlicher Bereitschaft, aber kein Schnäppchen gegenüber einfacheren Voicemail-Lösungen. Enterprise lohnt sich erst bei Volumen über 3.000 USD/Monat oder wenn EU-Hosting zwingend ist. Wer DSGVO-sauber arbeiten muss, sollte gar nicht erst auf dem Standardplan starten.
Stärken im Detail
Niedrige Latenz ist der Markenkern. Retell wirbt mit Unter-800-ms-Antwortzeiten zwischen Nutzerende-Erkennung und erstem TTS-Token, und hält das in der Praxis auch ein. Das ist der Unterschied zwischen einem Bot, der sich “wie ein Bot” anhört, und einem, bei dem Anrufer erst nach dem Auflegen merken, dass sie mit einer KI gesprochen haben. Im Voice-Agenten-Markt ist Latenz das wichtigste Qualitätsmerkmal.
Visueller Flow-Builder ohne Code. Conversation-Knoten, Entscheidungsbäume, Tool-Calls und Eskalationsregeln werden per Drag-and-Drop modelliert. Wer schon einmal mit n8n oder Make.com gearbeitet hat, fühlt sich sofort zu Hause. Für komplexere Logik gibt es den Custom-LLM-Slot, du kannst deinen eigenen LLM-Endpoint einbinden und die Konversationssteuerung selbst übernehmen.
Freie Wahl bei LLM und TTS. Retell zwingt dich nicht auf einen Modellstack. GPT-4.1 (für balancierte Performance), Claude 4.5 (für nuancierte Sprache), Gemini 2.5 Flash Lite (für günstige Hochvolumen-Cases). Bei der Stimmsynthese kannst du zwischen ElevenLabs, Cartesia, Deepgram und PlayHT wählen, alle mit deutschen Voices, aber unterschiedlicher Qualität und Latenz. Diese Wahlfreiheit ist gegenüber Wettbewerbern wie Air.ai oder Bland AI ein klarer Vorteil.
Pay-as-you-go ohne Plattform-Gebühr. Im Gegensatz zu Voiceflow oder Synthflow, die monatliche Plattformgebühren ab 50–500 USD/Monat verlangen, kostet Retell nur, was du nutzt. Für KMU mit unregelmäßigem Anrufvolumen ist das ein echter Vorteil, kein Lock-in, keine Fixkosten.
Skalierbare Concurrency. 20 gleichzeitige Anrufe sind im Standardplan inklusive, genug für die meisten KMU. Skalierung läuft transparent über 8 USD pro zusätzlichem Concurrent Call. Für Call-Center-ähnliche Use-Cases lassen sich problemlos 100+ parallele Gespräche fahren.
Enterprise-Optionen mit SOC-2, HIPAA und On-Prem. Wer wirklich Compliance braucht, bekommt mit dem Enterprise-Plan SOC-2 Type II, HIPAA-Konformität und eine On-Prem-Deployment-Option. Damit ist auch ein EU-Datenresidency-Setup theoretisch möglich, aber eben nur Enterprise. Für DACH-Mittelständler ohne IT-Abteilung ist das ein hoher Einstieg.
Schwächen ehrlich betrachtet
US-Datenhosting ohne EU-Standard-Option. Alle Anrufdaten gehen über US-Server. Eine EU-Region für Standardkunden gibt es nicht, nur Enterprise-On-Prem-Kunden können Daten in der EU verarbeiten lassen. Für Anwaltskanzleien, Praxen und Behörden ist das praktisch ein K.o.-Kriterium. Das DSGVO-Versprechen “GDPR-compliant” auf der Website bezieht sich auf Vertragsklauseln, nicht auf den Verarbeitungsort.
Englische Oberfläche und Doku. Das gesamte Dashboard, die Knowledge-Base-Konfiguration, alle Fehlermeldungen und der Support sind ausschließlich auf Englisch. Wer ein Team von Customer-Service-Mitarbeitern an die Konfiguration heranführen will, braucht entweder zweisprachige Mitarbeitende oder eine Übersetzungs-Stütze. Für deutschsprachige KMU ist das ein nicht zu unterschätzender Reibungsfaktor.
Deutsche Sprachqualität schwankt mit der TTS-Engine. Retell selbst liefert keine optimierte deutsche Stimme, die Qualität hängt vollständig von der gewählten TTS-Engine ab. ElevenLabs Multilingual klingt sehr gut, kostet aber mehr (0,040 USD/Min.). Cartesia ist schneller, aber bei langen deutschen Sätzen mit Eigennamen oder Fachbegriffen weniger zuverlässig. Plane Test-Iterationen ein, eine Stimme, die auf Englisch beeindruckt, klingt auf Deutsch nicht zwangsläufig genauso gut.
Reale Kosten höher als advertised. Der Werbe-Einstiegspreis von 0,07 USD/Min. ist die nackte Voice-Infrastruktur. Realistisch zahlst du für ein nutzbares Setup (GPT-4.1 + ElevenLabs + Knowledge Base) ca. 0,15 USD/Min. Bei Outbound-Kampagnen mit Branded Call kommen zusätzlich 0,10 USD pro Anruf dazu. Wer den advertised Preis 1:1 in eine Kalkulation übernimmt, unterschätzt die Tageskosten um den Faktor 2.
Halluzinationsrisiko ohne Knowledge-Base-Pflege. Wie alle LLM-basierten Voice-Agenten kann Retell unter Druck Antworten erfinden, die plausibel klingen, aber falsch sind. Das ist im Telefonkontext besonders kritisch, der Anrufer hat keine Chance, Quellen zu prüfen. Saubere Konfiguration der Wissensbasis, explizite Eskalationsregeln und regelmäßiges Monitoring der Gesprächsmitschnitte sind Pflicht, kein Komfort.
Branded Call ist USA-only. Die Caller-ID-Authentifizierung (STIR/SHAKEN) gegen Spam-Markierung funktioniert nur mit US-Telefonnummern. In Deutschland bringt dieses Feature nichts, die 0,10 USD/Outbound-Aufschlag entfallen, der Reputationsschutz aber auch.
Alternativen im Vergleich
| Wenn du… | …nimm stattdessen |
|---|---|
| Volle Entwickler-Kontrolle und eine API-First-Architektur willst | |
| Komplexere Conversation Flows mit Multi-Channel (Web, WhatsApp, Voice) brauchst | |
| Die beste deutsche Sprachsynthese als Standalone-Komponente brauchst |
Erwähnenswert ohne eigene Tool-Seite oder als unverlinkte Peers: Bland AI (US, ähnliches Pay-as-you-go-Modell mit fokussierterem Outbound), Synthflow (deutsches Team, EU-Hosting-Option, deutlich teurer aber DACH-ready), Air.ai (US, marketinglastig, Pricing intransparent), PolyAI (Enterprise-only, sehr starke deutsche Stimmen, aber Sechsstellige Verträge), Twilio + ConversationRelay (Eigenbau auf Twilio-Stack, maximale Kontrolle, aber Wochen statt Stunden Setup). Wer EU-Hosting zwingend braucht und nicht Enterprise-Budget hat, sollte primär Synthflow oder eine PolyAI-Demo evaluieren, Retell bleibt dann erst die zweite Wahl.
So steigst du ein
Schritt 1: Account auf retellai.com anlegen, die 10 USD Startguthaben reichen für ca. 60 Test-Minuten. Im visuellen Flow-Builder ein Template wählen (“Inbound Receptionist” oder “Lead Qualifier”) und an deinen Use Case anpassen. Wähle deine Stimm-Engine bewusst aus, ElevenLabs Multilingual ist der sichere Default für deutsche Anrufer, kostet aber mehr als Cartesia oder Deepgram.
Schritt 2: Wissensbasis sauber aufbauen. Lade FAQs, Produktinfos und Eskalationsregeln strukturiert hoch. Definiere explizit, bei welchen Anfragen sofort an einen menschlichen Mitarbeitenden weitergeleitet werden soll, das schützt vor Halluzinationen. Teste den Agenten mit mindestens 20 internen Anrufen, darunter typische Edge-Cases (Hintergrundgeräusche, Dialekt, lange Eigennamen).
Schritt 3: Telefonnummer kaufen (2 USD/Monat) oder eigene Nummer per SIP einbinden. Integriere CRM (HubSpot, Salesforce) oder Terminplanungstool (Calendly) über die Webhook-API, Gesprächsdaten landen dann automatisch im richtigen System. Aktiviere Conversation-Logging und plane wöchentliche Stichproben in den ersten 4 Wochen ein. Wenn Volumen oder Compliance-Anforderungen wachsen, frühzeitig Enterprise mit AVV und EU-Residency anfragen, nicht erst, wenn die Probleme da sind.
Ein konkretes Beispiel
Eine mittelständische Immobilienverwaltung mit 18 Mitarbeitenden im Ruhrgebiet nutzt Retell AI, um außerhalb der Bürozeiten eingehende Mieteranrufe zu Wartungsanfragen entgegenzunehmen. Der Voice-Agent (GPT-4.1 + ElevenLabs Multilingual) fragt Mietername, Wohnungsadresse und Art des Problems ab, erstellt ein strukturiertes Ticket im Hausverwaltungssystem (über Webhook in Domus 4) und gibt eine automatische Eingangsbestätigung. Komplexe Notfälle (Wasserrohrbruch, Heizungsausfall) werden anhand definierter Schlüsselwörter sofort auf das Notfalltelefon des Bereitschaftsdienstes weitergeleitet. Rund 60 % der After-Hours-Anrufe (etwa 120 von 200 monatlich) werden ohne menschliche Einbindung strukturiert erfasst. Kosten: ca. 110 USD/Monat (Telefonnummer 2 USD + ca. 300 Minuten à 0,15 USD + Knowledge-Base-Add-on + 5 USD Puffer). Vorher kostete der Bereitschaftsdienst eines externen Dienstleisters ca. 600 EUR/Monat, Ersparnis netto rund 500 EUR. Da Mieterdaten verarbeitet werden, läuft parallel die Prüfung, ob mittelfristig auf Synthflow mit EU-Hosting umgestellt werden sollte.
DSGVO & Datenschutz
- Datenhosting: USA (AWS-Regionen us-east, us-west). Eine EU-Region für Standardkunden gibt es nicht.
- EU-Residency: Nur über Enterprise-On-Prem-Deployment möglich, erfordert Verhandlung, eigene Infrastruktur und entsprechendes Budget.
- Datennutzung: Gesprächsmitschnitte werden für Quality-Monitoring und auf Wunsch für Training genutzt. Pro- und Enterprise-Kunden können das in den Einstellungen deaktivieren, Free-Tier nur eingeschränkt.
- Compliance-Zertifikate: SOC-2 Type II, HIPAA-Compliance, GDPR-Vertragsklauseln. Die Zertifizierungen beziehen sich auf Prozesse und Verträge, nicht auf den Verarbeitungsort.
- Auftragsverarbeitung (AVV): Auf Anfrage für zahlende Kunden verfügbar. Für Standardkunden im Pay-as-you-go-Modus muss aktiv angefragt werden.
- Speicherdauer: Aufzeichnungen werden standardmäßig 30 Tage gespeichert, danach gelöscht. Konfigurierbar im Enterprise-Plan.
- Empfehlung für deutsche Unternehmen: Für nicht-personenbezogene Standardgespräche (z. B. Lieferterminbestätigungen ohne sensible Daten) ist Retell akzeptabel mit AVV. Für Branchen unter Berufsgeheimnis (Anwälte, Ärzte, Steuerberater) oder mit Mitarbeitenden-Daten zwingend Enterprise-On-Prem oder einen europäischen Anbieter wählen. Datenschutz-Folgenabschätzung vor Produktivnutzung Pflicht.
Gut kombiniert mit
, wenn die Standard-TTS-Stimmen in Retell nicht reichen, lässt sich eine geklonte ElevenLabs-Stimme einbinden (eigene Markenstimme, hörbarere Differenzierung). Sinnvoll für Markenartikler, die einen wiedererkennbaren Voice-Charakter wollen. , Retell schreibt qualifizierte Leads direkt ins HubSpot-CRM, dort übernimmt das HubSpot-AI-Modul das Lead-Scoring und triggert Follow-up-Sequenzen. Klassisches Tandem aus Voice-Capture und CRM-Automatisierung. , für die Verbindung mit Tools, die Retell nicht nativ unterstützt (z. B. deutsche Handwerker-Software, Praxis-Verwaltungen). Zapier triggert auf abgeschlossene Anrufe und überträgt die Strukturdaten ins Zielsystem.
Unser Testurteil
Retell AI verdient 3 von 5 Sternen. Für Entwickler und Agenturen, die schnell Voice-Agenten bauen wollen und keine zwingenden DSGVO-Anforderungen haben, ist Retell eine der besseren Optionen am Markt, niedrige Latenz, freie Modellwahl, transparente Pay-as-you-go-Preise. Die englische Oberfläche und die nicht zwingend optimierte deutsche Sprachqualität sind kalkulierbare Reibungspunkte. Der Hauptgrund für den 3-Sterne-Abzug: Für die Mehrheit der deutschsprachigen Anwendungsfälle (KMU, Mittelstand, regulierte Branchen) ist das fehlende EU-Hosting ein echtes Hindernis, das nur Enterprise-Kunden umgehen können. Wer beides braucht, den niedrigen Einstieg von Retell und EU-Hosting, sollte primär Synthflow evaluieren. Wer maximale Architekturkontrolle will, geht direkt auf Vapi oder Twilio-Eigenbau.
Was wir bemerkt haben
- 2025, Retell hat das Custom-LLM-Feature eingeführt, mit dem Entwickler ihren eigenen Sprachmodell-Endpoint einbinden können. Das war eine Reaktion auf die Konkurrenz von Vapi und macht Retell deutlich flexibler für komplexe Logik außerhalb der Standard-LLM-Anbieter.
- Anfang 2026, Die TTS-Auswahl wurde um Cartesia ergänzt, eine schnellere, günstigere Alternative zu ElevenLabs. Für hochvolumige Standardgespräche ist das ein echter Kostenfaktor (rund 50 % Ersparnis bei der TTS-Komponente).
- 2026, Branded Call (STIR/SHAKEN-Caller-ID-Authentifizierung) wurde als USA-only-Feature gelaunched. Für DACH-Markt bringt es keinen direkten Vorteil, die Spam-Markierungsmechaniken funktionieren in Europa anders.
- Mai 2026, Eine native EU-Region für Standardkunden gibt es weiterhin nicht. Das Versprechen “GDPR-compliant” bezieht sich auf Vertragsklauseln, nicht auf den Verarbeitungsort. Diese Lücke ist seit Launch unverändert und macht Retell für regulierte Branchen praktisch nur über die Enterprise-On-Prem-Schiene nutzbar.
Quellen
- Retell AI – Preisseite. https://www.retellai.com/pricing (abgerufen am 2026-06-20). Pay-as-you-go ab 0,07 USD/Min. (Voice-Engine 0,055 USD/Min.); TTS je nach Anbieter 0,015 bis 0,040 USD/Min.; LLM-Kosten variabel; 20 gleichzeitige Anrufe inklusive; Telefonnummern 2 USD/Monat; Enterprise auf Anfrage..
- Retell AI – Blog: AI Voice Agent Pricing Full Cost Breakdown. https://www.retellai.com/blog/ai-voice-agent-pricing-full-cost-breakdown-platform-comparison-roi-analysis (abgerufen am 2026-06-20). Preis-Modell ist nutzungsbasiert ohne Plattform-Grundgebühr; 5.000 Minuten kosten ca. 350 USD/Monat; Abrechnung konsolidiert Voice-, TTS- und LLM-Kosten..
Diesen Inhalt teilen:
Empfohlen in 1 Use Cases
Branchenübergreifend
Empfohlen für diese Branchen
Arthur Atlas
KI-Analyst
So entsteht diese Bewertung
Diese Seite bewerten wir redaktionell, mit kräftiger Unterstützung von Arthur Atlas, unserem KI-Analysten. Er prüft Bewertungen nach und markiert veraltete Angaben, sobald sich der Markt dreht. Unsere Angaben stammen überwiegend aus öffentlich zugänglichen Quellen wie Anbieter-Website, Doku und Preislisten. Preise und Funktionen können sich ändern.
Hinweis: Diese Angaben können veraltet oder fehlerhaft sein. Prüfe im Zweifel immer direkt auf der Website des Anbieters.
Preise geändert, Feature veraltet oder etwas fehlt?
Wir freuen uns über Hinweise und Ergänzungen.
Du arbeitest bei Retell AI Inc.?
Gib uns einen Testzugang, dann schauen wir tiefer rein und ergänzen die Bewertung aus erster Hand.
Nicht sicher, ob Retell AI zu euch passt?
Wir helfen bei der Tool-Auswahl und begleiten die Einführung in euren Arbeitsalltag, unverbindlich und kostenlos im Erstgespräch.
KI-Tools und Trends
KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools
Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.