본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

ppo

근사 정책 최적화

중급

Proximal Policy Optimization의 약자로, 강화학습에서 널리 쓰이는 정책 최적화 알고리즘이다. 학습 과정의 안정성이 높고 구현이 비교적 쉬워 다양한 로봇 제어 작업의 기본 알고리즘으로 권장된다.

비슷한 개념

dd-ppo policy-learning surrogate-objective gae cispo pareto-front-policy-optimization policy-optimization approximate-dynamic-programming

← 용어 사전 전체 보기