디코더 공진화
정책과 VQ 디코더를 교대 업데이트하여 토큰-픽셀 체인이 시뮬레이션되는 분포를 함께 조정하는 학습 패러다임. 이는 Latent Covariate Shift를 해소하고 픽셀 공간의 품질과 텍스트-이미지 정합성을 동시에 향상시키려는 목적에 부합한다.