본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
순환 PPO (recurrent-ppo) 용어 설명 | AI Trends
recurrent-ppo
순환 PPO
중급
PPO 알고리즘에 LSTM이나 GRU 같은 순환 신경망을 결합한 형태. 에이전트가 과거의 상태 정보를 기억하여 복잡한 환경에서 더 나은 의사결정을 내리도록 돕는다.
비슷한 개념
recurrent-neural-networks
rnn
recurrent-network
recurrent-neural-network
hybrid-rnn
rssm
memory-recall
bptt
← 용어 사전 전체 보기