토큰 단위 스트리밍
모델이 전체 문장을 완성하기 전에 생성되는 개별 토큰을 즉시 전송하는 방식이다. Claude의 출력을 실시간으로 받아 문장 단위로 TTS에 전달함으로써 사용자가 느끼는 첫 음성 출력까지의 대기 시간을 획기적으로 줄인다.