연속 패치 마스킹
패치를 연속적인 길이의 마스크된 구간으로 구성해 학습 중 다수의 미래 구간을 한 번에 예측하도록 학습하는 기법. 이는 자동회귀(decoding)로 인한 누적 오차를 줄이고 단일 패스 예측을 가능하게 한다.