추론 문맥
모델이 최종 답변을 생성하기 전 단계에서 내부적으로 논리적 사고와 추론 과정을 거치는 메커니즘이다. 이 과정은 답변의 품질과 정확도를 획기적으로 높여주지만, 연산량이 매우 많아 하드웨어 성능이 제한적인 모바일 환경에서는 심각한 응답 지연을 초래하는 주요 원인이 된다.