추론 토큰
모델이 답변을 생성하기 전 사고 과정을 거치며 발생하는 중간 토큰이다. 이 실험에서는 추론 토큰이 대화 이력에 남지 않아 다음 턴의 비용을 높이지 않는 일회성 자원임을 확인했다.
모델은 스스로 오케스트레이션하지 않는다 - 3만 라인 코딩 실험의 진실