Gym 환경
OpenAI에서 제안한 강화학습 알고리즘 개발 및 비교를 위한 표준 인터페이스이다. 에이전트가 관찰(Observation)을 받고 행동(Action)을 수행하며 보상(Reward)을 얻는 일련의 과정을 표준화된 코드로 제공하여 연구 효율성을 높인다.