스트리밍 오디오
전체 오디오 파일이 생성될 때까지 기다리지 않고 생성되는 즉시 데이터를 전송하여 재생하는 방식이다. LLM의 토큰 생성 속도에 맞춰 음성을 출력함으로써 사용자 경험의 지연 시간을 획기적으로 줄여준다.
API 비용 제로 ElevenLabs를 대체할 로컬 음성 복제 TTS 서버