사고 예산
모델이 응답을 생성하기 위해 투입하는 추론 자원과 시간을 조절하는 설정값이다. 복잡한 문제에는 예산을 높여 정확도를 올리고, 단순한 작업에는 예산을 낮춰 토큰 소비량과 비용을 절감하는 방식으로 효율적인 운영을 가능하게 한다.