숨겨진 자기수정(hidden-self-correction)이란 무엇인가요?

Question

Accepted Answer

대형 Reasoning Model(LRM)이 CoT에서 노출된 해를 verbalize하지 않고도 내부적으로 오류를 탐지하고 수정하여 최종 정답을 올바르게 도출하는 현상을 가리킨다. injected arithmetic error를 CoT 중간에 주입한 뒤에도 최종 답이 정답으로 회복되는 경향에서 확인된다.

hidden-self-correction

비슷한 개념