본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
KL 발산 (kl-divergence) 용어 설명 | AI Trends
kl-divergence
KL 발산
고급
강화학습에서 새로운 정책이 기존 정책으로부터 너무 멀어지지 않도록 규제하여 학습의 안정성을 보장하는 지표로 활용된다.
비슷한 개념
kl-coefficient
kl-regularization
kld-metric
kld
entropy-regularization
reward-variance
reverse-kl-divergence
js-divergence
← 용어 사전 전체 보기