본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티

홈 트렌딩 검색 커뮤니티 프로필

리인포스 알고리즘 (reinforce) 용어 설명 | AI Trends

reinforce

리인포스 알고리즘

고급

강화학습에서 정책 경사(Policy Gradient)를 계산하는 가장 기본적인 알고리즘이다. 특정 행동의 결과로 얻은 보상이 크면 해당 행동의 발생 확률을 높이고, 보상이 작으면 낮추는 방식으로 모델을 학습시킨다.

비슷한 개념

reinforce-algorithm reward-function reward-system policy-optimization optimal-policy maxrl deep-reinforcement-learning in-context-reinforcement-learning

← 용어 사전 전체 보기