데이터 믹싱
도메인 특화 데이터와 모델의 일반 능력을 유지하기 위한 범용 데이터를 특정 비율로 혼합하여 학습시키는 기법이다. 파인튜닝 시 모델이 특정 지식만 배우느라 기존의 일반적인 추론 능력을 잃어버리는 '파괴적 망각' 현상을 방지하는 데 핵심적인 역할을 한다.