하이퍼파라미터 전이
소규모 모델에서 실험을 통해 찾아낸 최적의 학습 설정(학습률, 배치 크기 등)을 수십 배에서 수만 배 더 큰 대규모 모델에 추가 수정 없이 그대로 적용하는 프로세스이다. 거대 모델 학습 시 발생하는 막대한 시행착오 비용을 줄이는 핵심 기술이다.