본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
홈
트렌딩
검색
커뮤니티
프로필
On-Policy Self-Distillation 관련 AI 뉴스 | AI Trends
← 피드로 돌아가기
On-Policy Self-Distillation
Prompting (프롬프트 엔지니어링)
약 2개 아티클
관련 태그:
ATESD
Beta-policy controller
Reinforcement Learning from Verifiable Rewards
Variational Policy Distillation