소프트맥스 식별 사후 확률
여러 후보 중에서 정답을 찾을 확률을 소프트맥스 함수를 통해 계산한 값이다. 이 논문에서는 특정 행동의 결과로 나타난 미래 상태가 여러 가짜 미래들 사이에서 얼마나 명확하게 구분되는지를 측정하는 지표로 사용된다.