Alle Kosten entstehen direkt auf Ihrer Azure-Rechnung — transparent, nachvollziehbar und ohne versteckte Aufschläge. Hier sind drei realistische Szenarien.
Die Realtime API rechnet in Audio-Tokens ab: 1 Token pro 100ms Audio-Input, 1 Token pro 50ms Audio-Output. Bei einem 30-Sekunden-Gespräch entstehen etwa 150 Input- und 300 Output-Tokens. Dazu kommen Text-Tokens für den System-Prompt und Tool-Definitionen. Ein Kontextfaktor von 1,2× berücksichtigt, dass die API bei jedem Turn die bisherige Konversation mitsendet.
Die Datenbank speichert Ihre Prompts, FAQs, Produkte und Anrufprotokolle. B1ms (1 vCore, 2 GB RAM) ist die günstigste produktionsreife Option mit automatischen Backups (7 Tage). Fixkosten unabhängig vom Anrufvolumen.
Beinhaltet eine deutsche Festnetznummer (~4 €/Monat) und die Inbound-Gesprächsminuten (~0,8 Cent/Minute). Diese Kosten skalieren linear mit dem Anrufvolumen, sind aber minimal im Vergleich zur OpenAI API.
Der Voicebot läuft als Always-on-Container (0,25 vCPU, 0,5 GB RAM), damit Anrufe sofort beantwortet werden — ohne Cold-Start-Verzögerung. Im Leerlauf gilt ein reduzierter Tarif. Die Kosten sind nahezu identisch über alle drei Szenarien.
Im Bridge-Modus telefoniert Ihr Bot über unsere Infrastruktur. Die Azure-Kosten entstehen erst, wenn Sie in Ihren eigenen Tenant umziehen.
Live-Demo starten →