정책 메모리
배포 중 수집된 드문 실패 사례를 추상화된 정책으로 저장해 향후 입력에서 재사용하는 메모리 단위이다. 희박한 피드백 환경에서 일반화 가능성을 높이고, mixed-label 구역에서 경계 신호를 유지한다.