중간 학습
사전 학습(Pretraining)과 사후 학습(Posttraining/SFT) 사이의 중간 단계에서 도메인 특화 데이터를 섞어 학습하는 기법이다. 일반적인 사전 학습 데이터와 타겟 도메인 데이터 간의 분포 격차를 줄여 모델이 특정 태스크에 더 잘 적응하도록 돕는 가교 역할을 한다.