Bellman 역계수
일반화된 목표에서 Bellman 타깃이 per-step reward 차이를 얼마나 보존하는지 측정하는 계수로, κµ(σ)와 함께 학습 가능성의 핵심 지표가 된다.