본문으로 건너뛰기
멀티모달 Chain-of-Thought를 위한 토큰 수준 정책 최적화의 재고 | AI Trends