손실 마스킹
학습 과정에서 특정 토큰 구간에 대한 손실(Loss) 계산을 의도적으로 제외하는 기법이다. 이 논문에서는 외부 도구가 반환한 정보처럼 모델이 직접 생성하지 않은 텍스트 구간을 마스킹하여, 모델이 오직 자신의 추론 로직과 도구 호출 문법을 개선하는 데만 집중하게 한다.