학습 후 차이 분석
두 개의 서로 다른 SFT 파이프라인을 비교하여 모델의 특정 행동 특성이 어디서 기인하는지 식별하는 방법론. 베이스 모델, 프롬프트, 학습 응답을 교차 실험하여 행동의 근원을 추적한다.