본문으로 건너뛰기
V0.5: 희소한 강화학습 롤아웃을 위한 사전 지식으로서의 범용 가치 모델 | AI Trends