본문으로 건너뛰기
LLM의 강화학습(RLVR)은 정말로 새로운 추론 능력을 만들어내는가? | AI Trends