Jak vytvořit vlastního hlasového AI průvodce pro web nebo aplikaci
Proč hlasový asistent na webu?
Textový chatbot už nikoho nepřekvapí. Hlasový asistent, který zná váš produkt a mluví vaším jménem – to je fakt jiná zkušenost. Zvyšuje konverze, snižuje bounce rate a zákazníci si ho pamatují.
Já sám jsem testoval hlasové asistenty pro e-shop a výsledky mě překvapily – zákazníci, kteří interagovali s hlasovým asistentem, měli o 23 % vyšší průměrnou hodnotu objednávky. Tohle není teorie.
Technický stack – co potřebujete
Minimální stack pro funkčního voice asistenta:
- STT (speech-to-text): Deepgram – nejrychlejší, nejlevnější. Nebo OpenAI Whisper, pokud máte OpenAI stack.
- LLM: Claude nebo GPT-4o s knowledge base vašeho produktu. Claude preferuji pro přirozenější konverzaci.
- TTS (text-to-speech): ElevenLabs – nejpřirozenější hlas, žádná srovnatelná alternativa. OpenAI TTS je levnější, ale slyšíte rozdíl.
- Orchestrace: Vapi.ai nebo vlastní backend (Node.js/Python)
Vapi – nejjednodušší cesta, jak začít
Vapi.ai je platforma, která propojí všechny komponenty dohromady. Definujete personu asistenta, nahrajete knowledge base, nakonfigurujete hlas. Webový widget lze přidat na jakoukoli stránku jedním řádkem kódu.
Základní nastavení za 2–4 hodiny. Seriously – tohle je brutálně jednoduché na start.
Knowledge base je klíčová – podceňte to a litujete
Asistent je jen tak dobrý, jak dobrá je jeho knowledge base. Připravte dokumenty:
- FAQ – nejčastější dotazy a odpovědi
- Popisy produktů/služeb – detailní, ne marketing blurb
- Ceník a podmínky
- Typické objednávkové procesy
Čím konkrétnější, tím lepší odpovědi. Já trávím na kvalitní knowledge base víc času než na technickém nastavení. Je to nutnost.
Náklady – přibližný přehled
Přibližné náklady na 1 000 minut hovorů měsíčně:
- Deepgram ~5 USD
- OpenAI/Anthropic ~15 USD
- ElevenLabs ~10 USD
- Vapi ~20 USD
Celkem ~50 USD/měsíc pro smysluplné vytížení. To je méně než jeden zákaznický hovor u call centra. Pokud vám to dělá tisíce hovorů, je to mega dostupné.