이중 자기회귀
음성 생성 과정을 언어적 구조를 담당하는 모델과 음향적 세부 사항을 담당하는 모델로 나누어 처리하는 구조이다. 속도와 품질이라는 상충하는 목표를 동시에 달성하기 위해 설계되었다.