Stworzenie Voice AI (real-time) – „Call Santa” – interaktywny system rozmów głosowych z dziećmi (Twilio/VoIP + LLM + TTS
Poszukuję doświadczonego wykonawcy (mid/senior), który stworzy system Voice AI umożliwiający dzieciom dzwonienie do Świętego Mikołaja i prowadzenie naturalnej rozmowy w czasie rzeczywistym.
Chodzi o funkcjonalność podobną do WonderCall (www.wondercall.co.uk
), ale z naszym scenariuszem:
— dziecko dzwoni do Mikołaja,
— chce „oddać znaleziony portfel Świętego Mikołaja”,
— Mikołaj prowadzi z nim interaktywną, płynną, naturalną rozmowę (2-way real-time voice).
System będzie obsługiwać dużą liczbę połączeń równocześnie (nawet kilka tysięcy), więc konieczna jest architektura skalowalna.
🔧 Zakres prac:
1. Moduł połączeń telefonicznych (VoIP/telephony)
Integracja z Twilio, Vonage lub podobnym providerem.
Obsługa połączeń przychodzących.
Routing + webhooki.
2. Real-time Speech-to-Text
Integracja z Whisper API / Deepgram / AssemblyAI (rozmowy dziecięce!).
Stałe transkrypcje w czasie rzeczywistym.
3. Moduł AI (główny mózg rozmowy)
Model językowy (GPT-4, GPT-4o mini, Llama 3.1 lub inny zalecony).
Odpowiednie „persona prompts”: Święty Mikołaj, ciepły i empatyczny, interaktywny.
Logika rozmowy: zgubiony portfel, nice list, pytania o Mikołaja, odpowiedzi na milion pytań dziecka.
Pamięć rozmowy.
4. Real-time Text-to-Speech
Integracja z ElevenLabs / Azure Neural Voice / PlayHT.
Głos Mikołaja (ciepły, spokojny, bajkowy).
Zero-latency streaming.
5. Infrastruktura & Skalowanie
System musi obsłużyć 1000–7000 jednoczesnych połączeń.
Architektura typu serverless lub autoscaling (np. AWS Lambda, GCP Cloud Run).
Kolejkowanie i monitoring połączeń.
6. Panel dla nas (może być prosty)
Statystyki połączeń.
Logs: transkrypcje, czasy rozmów.
Możliwość włączania/wyłączania kampanii.