네이티브 오디오 지원
비디오 생성 모델이 영상 생성과 동시에 해당 맥락에 맞는 음성을 직접 생성하는 기능이다. 별도의 음성 합성 도구 없이도 캐릭터의 입 모양과 목소리가 일치하는 결과물을 얻을 수 있게 한다.