Transparente Azure-Kosten

Was kostet der Betrieb auf Ihren Azure-Ressourcen?

Alle Kosten entstehen direkt auf Ihrer Azure-Rechnung — transparent, nachvollziehbar und ohne versteckte Aufschläge. Hier sind drei realistische Szenarien.

Berechnungsgrundlage: Durchschnittliche Gesprächsdauer 30 Sekunden · OpenAI Realtime API (gpt-4o-realtime) · Preise Standard Pay-as-you-go (Stand April 2026) · Angaben in € (netto) · 1 USD ≈ 0,92 EUR · Context-Akkumulationsfaktor 1,2× berücksichtigt
Starter
20 Anrufe/Tag
Einzelner Empfang oder kleine Praxis
Anrufe/Monat
600
Minuten/Monat
300
OpenAI Realtime API54 €
PostgreSQL (B1ms)16 €
Telefonkosten (ACS)6 €
Container App5 €
Container Registry5 €
Log Analytics0 €
Azure Gesamt / Monat~86 €
Kosten pro Anruf
~8.9 Cent
Typisch Mittelstand
Wachstum
50 Anrufe/Tag
Mittelständisches Servicetelefon
Anrufe/Monat
1.500
Minuten/Monat
750
OpenAI Realtime API134 €
PostgreSQL (B1ms)16 €
Telefonkosten (ACS)10 €
Container App6 €
Container Registry5 €
Log Analytics0 €
Azure Gesamt / Monat~171 €
Kosten pro Anruf
~8.9 Cent
Volumen
200 Anrufe/Tag
Kundencenter mit hohem Aufkommen
Anrufe/Monat
6.000
Minuten/Monat
3.000
OpenAI Realtime API537 €
PostgreSQL (B1ms)16 €
Telefonkosten (ACS)28 €
Container App6 €
Container Registry5 €
Log Analytics0 €
Azure Gesamt / Monat~592 €
Kosten pro Anruf
~8.9 Cent

Was steckt hinter den Zahlen?

OpenAI Realtime API (größter Kostenfaktor)

Die Realtime API rechnet in Audio-Tokens ab: 1 Token pro 100ms Audio-Input, 1 Token pro 50ms Audio-Output. Bei einem 30-Sekunden-Gespräch entstehen etwa 150 Input- und 300 Output-Tokens. Dazu kommen Text-Tokens für den System-Prompt und Tool-Definitionen. Ein Kontextfaktor von 1,2× berücksichtigt, dass die API bei jedem Turn die bisherige Konversation mitsendet.

PostgreSQL Flexible Server (B1ms)

Die Datenbank speichert Ihre Prompts, FAQs, Produkte und Anrufprotokolle. B1ms (1 vCore, 2 GB RAM) ist die günstigste produktionsreife Option mit automatischen Backups (7 Tage). Fixkosten unabhängig vom Anrufvolumen.

Azure Communication Services (ACS)

Beinhaltet eine deutsche Festnetznummer (~4 €/Monat) und die Inbound-Gesprächsminuten (~0,8 Cent/Minute). Diese Kosten skalieren linear mit dem Anrufvolumen, sind aber minimal im Vergleich zur OpenAI API.

Container App (Consumption, minReplicas=1)

Der Voicebot läuft als Always-on-Container (0,25 vCPU, 0,5 GB RAM), damit Anrufe sofort beantwortet werden — ohne Cold-Start-Verzögerung. Im Leerlauf gilt ein reduzierter Tarif. Die Kosten sind nahezu identisch über alle drei Szenarien.

Hinweis: Alle Angaben sind Schätzwerte basierend auf öffentlich verfügbaren Azure-Preislisten (Stand April 2026). Die tatsächlichen Kosten hängen von Ihrer Azure-Vereinbarung, Region und dem konkreten Nutzungsverhalten ab. OpenAI-Preise können sich ändern. Die Sontor-Lizenzgebühr ist in diesen Beträgen nicht enthalten.

Kostenlos testen — ohne eigene Azure-Kosten

Im Bridge-Modus telefoniert Ihr Bot über unsere Infrastruktur. Die Azure-Kosten entstehen erst, wenn Sie in Ihren eigenen Tenant umziehen.

Live-Demo starten →