본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

다중 도메인 온폴리시 증류 (mopd) 용어 설명 | AI Trends

mopd

다중 도메인 온폴리시 증류

고급

동일한 초기 모델에서 파생된 우수한 중간 모델들을 교사로 삼아 토큰 단위로 지식을 전수하는 방식이다. 기존 시퀀스 단위 보상 방식보다 샘플 효율성이 뛰어나 학습 속도를 획기적으로 높인다.

비슷한 개념

opsd on-policy-cross-stage-distillation hindsight-guided-opd opd policy-distillation skill-distillation on-policy-distillation on-policy-self-distillation

← 용어 사전 전체 보기