연속값 토큰
픽셀 패치처럼 연속값 벡터를 단일 토큰으로 취급하는 표현 방식으로, 각 토큰이 고차원 실수 벡터로 존재한다. 이 논문 맥락에서는 패치(예: 16×16×3)를 하나의 연속 토큰으로 모델링하여 토큰 차원이 768과 같이 매우 커질 수 있다. 연속 토큰은 확률적 샘플링·diffusion 기반 예측과 결합될 때 단일 스텝 예측 난이도를 크게 증가시켜 누적 오류를 유발한다.