확산 언어 모델
확산 모델(Diffusion Model)의 원리를 언어 모델에 적용하여 토큰을 순차적으로 생성하는 대신 병렬로 생성하는 기술이다. 기존 오토레그레시브 방식보다 추론 속도가 매우 빨라 지연 시간에 민감한 실시간 애플리케이션에 적합하다.