추론 시간 사고
모델이 최종 답변을 내놓기 전 내부적으로 일련의 추론 과정을 거치는 기법이다. 주로 텍스트 토큰을 생성하며 논리적 단계를 밟는 방식으로 구현되나, 현재의 방식은 과도한 토큰 소모와 연산 비용을 초래한다는 비판을 받는다.