마스크된 다음 토큰 예측
Masked Next-Token Prediction의 약자로, 텍스트의 일부를 가리고 양방향 문맥을 활용해 이를 예측하도록 학습시키는 기법입니다. 생성형 모델이 양방향 문맥을 이해하도록 적응시키는 핵심 단계입니다.