Stworzenie Voice AI (real-time) – „Call Santa” – interaktywny system rozmów głosowych z dziećmi (Twilio/VoIP + LLM + TTS

Zleceniodawca
no avatar
Marcin
Opis

Poszukuję doświadczonego wykonawcy (mid/senior), który stworzy system Voice AI umożliwiający dzieciom dzwonienie do Świętego Mikołaja i prowadzenie naturalnej rozmowy w czasie rzeczywistym.

Chodzi o funkcjonalność podobną do WonderCall (www.wondercall.co.uk

), ale z naszym scenariuszem:

— dziecko dzwoni do Mikołaja,

— chce „oddać znaleziony portfel Świętego Mikołaja”,

— Mikołaj prowadzi z nim interaktywną, płynną, naturalną rozmowę (2-way real-time voice).

System będzie obsługiwać dużą liczbę połączeń równocześnie (nawet kilka tysięcy), więc konieczna jest architektura skalowalna.

🔧 Zakres prac:

1. Moduł połączeń telefonicznych (VoIP/telephony)

Integracja z Twilio, Vonage lub podobnym providerem.

Obsługa połączeń przychodzących.

Routing + webhooki.

2. Real-time Speech-to-Text

Integracja z Whisper API / Deepgram / AssemblyAI (rozmowy dziecięce!).

Stałe transkrypcje w czasie rzeczywistym.

3. Moduł AI (główny mózg rozmowy)

Model językowy (GPT-4, GPT-4o mini, Llama 3.1 lub inny zalecony).

Odpowiednie „persona prompts”: Święty Mikołaj, ciepły i empatyczny, interaktywny.

Logika rozmowy: zgubiony portfel, nice list, pytania o Mikołaja, odpowiedzi na milion pytań dziecka.

Pamięć rozmowy.

4. Real-time Text-to-Speech

Integracja z ElevenLabs / Azure Neural Voice / PlayHT.

Głos Mikołaja (ciepły, spokojny, bajkowy).

Zero-latency streaming.

5. Infrastruktura & Skalowanie

System musi obsłużyć 1000–7000 jednoczesnych połączeń.

Architektura typu serverless lub autoscaling (np. AWS Lambda, GCP Cloud Run).

Kolejkowanie i monitoring połączeń.

6. Panel dla nas (może być prosty)

Statystyki połączeń.

Logs: transkrypcje, czasy rozmów.

Możliwość włączania/wyłączania kampanii.

Opublikowano
2025-12-01
Prawa autorskie
Przeniesienie praw autorskich
Wymagane funkcje:
📌 Wymagania względem wykonawcy: ✔ doświadczenie w projektach Voice AI / Twilio / real-time audio ✔ praktyczne doświadczenie z LLM (OpenAI / Llama / mistral) ✔ znajomość STT i TTS na poziomie produkcyjnym ✔ umiejętność zaprojektowania skalowalnej architektury ✔ komunikacja po polsku (projekt będzie omawiany PL), ale implementacja EN ✔ uczciwa i przejrzysta wycena 📅 Termin i budżet: Jestem elastyczny — zależy mi przede wszystkim na pewnym i stabilnym wykonawcy. Proszę o: krótki opis doświadczenia, portfolio lub linki do podobnych projektów (jeśli są), proponowaną wycenę lub widełki. Projekt jest natychmiastowy — start ASAP. 🎄 O projekcie: System będzie wykorzystywany komercyjnie w ramach sezonowej akcji świątecznej. To poważne wdrożenie — celem jest jakość na poziomie WonderCall, nie amatorski chatbot.

Wysłane oferty (15)

android
aplikacje mobilne
aplikacje webowe
+ 7 więcej
Budżet
Do negocjacji
Prawa autorskie
Przeniesienie praw autorskich
Ważne przez
30 dni

Najnowsze zlecenia z kategorii