본문으로 건너뛰기
안락한 영역을 벗어나게 하는 넛지: RLVR를 위한 전략 주도형 탐색의 효율화 | AI Trends