음성 에이전트 API
음성 인식(STT), 언어 모델(LLM), 음성 합성(TTS)을 하나의 파이프라인으로 통합하여 실시간 대화형 AI를 구축하게 해주는 도구이다. 지연 시간을 최소화하여 실제 사람과 대화하는 듯한 자연스러운 인터페이스를 제공하는 것이 핵심이다.