토큰 단위 생성
대형 언어 모델(LLM)이 전체 문장을 한 번에 출력하지 않고 작은 단위인 토큰을 순차적으로 생성하는 방식이다. 이 과정에서 발생하는 지연을 줄이기 위해 실시간 음성 합성 기술과의 연동이 중요하다.