토큰 스파이럴링
추론 모델이 정답에 도달하지 못하고 유사한 논리를 반복하거나 무의미하게 추론 체인을 늘리는 현상을 말한다. 이는 토큰 길이는 늘리지만 실제 정확도는 떨어뜨리는 주요 원인이 된다.
"길게 생각한다고 정답은 아니다" 구글이 밝힌 추론 모델의 비밀