검증 가능한 환경
재사용 가능하고 실행 가능한 환경 객체로, latent 인스턴스 샘플링(샘플러), 참조 답 계산(오라클), 렌더링(프롬프트 생성), 채점(Scorer)의 네 가지 루틴을 포함하며, admitted 상태의 환경은 실행 경로가 고정된 참조를 통해 평가되어 solver 학습에 사용된다.