잠재 공변량 시프트
VQ decoder가 ground-truth 코드의 분포에서 벗어나 토큰 분포를 받으면서 디코더 재구성의 품질이 정책의 개선과 함께 비례해 왜곡될 수 있는 현상. RankE가 이를 디코더와 정책의 동시 진화를 통해 흡수하는 것이 핵심 아이디어다.