잠재 추론
텍스트 토큰을 외부로 출력하지 않고 모델 내부의 은닉 상태(Hidden State) 내에서 추론 과정을 수행하는 방식이다. Chain-of-Thought처럼 가시적인 토큰을 생성하지 않아 메모리 사용량을 획기적으로 줄이면서도 복잡한 논리 연산이 가능하다.