본문으로 건너뛰기
정책 조건화가 강화학습 에이전트의 꼬리 위험(Tail-risk)을 23배 개선한다는 연구 결과 | AI Trends