특권 비평가
학습 시에만 실제 경기에서는 알 수 없는 완벽한 정보(공의 정확한 물리 상태 등)에 접근할 수 있는 구성 요소입니다. 이를 통해 로봇의 정책망이 센서 데이터만으로도 공의 궤적을 더 정확히 예측하도록 가이드합니다.