본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

오프-폴리시 (off-policy) 용어 설명 | AI Trends

off-policy

오프-폴리시

중급

현재 학습 중인 정책이 아닌, 과거의 정책이나 다른 시스템(추론 엔진 등)에서 생성된 데이터를 사용하여 학습하는 방식이다. 데이터 효율은 높지만, 데이터 생성 시점과 학습 시점의 모델 차이로 인해 훈련 안정성이 떨어질 수 있는 위험이 있다.

비슷한 개념

off-policy-rl off-policy-learning off-policy-training on-policy-learning on-policy-optimization on-policy-training on-policy on-policy-distillation

← 용어 사전 전체 보기