콜드스타트 초기화
모델 학습의 초기 단계에서 사전 학습된 가중치를 특정 작업에 맞게 조정하기 위해 수행하는 초기 미세 조정 과정이다. 이 단계에서 형성된 어텐션 패턴이 이후 강화학습 성능에 결정적인 영향을 미친다.