자율 정책 진화 (autonomous-policy-evolution) 용어 설명 | AI Trends
autonomous-policy-evolution
자율 정책 진화
중급
에이전트가 실행 가능한 정책 번들을 반복적으로 편집하고 유한한 에피소드 예산과 서버 피드백을 통해 성능을 향상시키는 평가 설정을 말한다. 본 논문 맥락에서는 에이전트가 workspace에 패치를 쓰고 서버가 롤아웃 요약과 궤적을 반환하는 루프가 핵심이다. 이 설정은 최종 점수뿐 아니라 정책 개선 궤적과 검증 선택을 통제된 방식으로 측정하는 데 중요하다.