본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

온폴리시 미세 조정 (on-policy-fine-tuning) 용어 설명 | AI Trends

on-policy-fine-tuning

온폴리시 미세 조정

고급

모델이 학습 중에 직접 생성한 데이터(궤적)를 바탕으로 다시 학습을 진행하여 오류를 수정하는 방식이다. 학습 시의 이상적인 상태와 실제 추론 시의 오차 누적 사이의 간극을 줄여 장기 예측의 안정성을 높인다.

비슷한 개념

on-policy-training online-finetuning on-policy-optimization on-policy-distillation on-policy-learning on-policy on-policy-inference on-policy-failure-trajectory

← 용어 사전 전체 보기