gridworld
강화학습 알고리즘의 성능을 검증하기 위해 사용되는 격자 형태의 가상 환경이다. 에이전트의 위치, 이동 가능한 방향, 특정 위치에서의 보상과 페널티가 명확하게 정의되어 있어 파라미터 변화에 따른 에이전트의 행동 변화를 관찰하기에 적합하다.
강화학습 알고리즘의 성능을 검증하기 위해 사용되는 격자 형태의 가상 환경이다. 에이전트의 위치, 이동 가능한 방향, 특정 위치에서의 보상과 페널티가 명확하게 정의되어 있어 파라미터 변화에 따른 에이전트의 행동 변화를 관찰하기에 적합하다.