제로샷 정책
학습 과정에서 한 번도 본 적 없는 새로운 환경이나 물체에 대해 추가적인 학습 없이 즉시 작업을 수행할 수 있는 제어 능력을 말한다. 모델의 일반화 성능을 보여주는 핵심 지표이다.