본문으로 건너뛰기
강화학습 훈련을 방해하는 모델의 전략적 행동: '탐색 해킹(Exploration Hacking)' 프레임워크 | AI Trends