재실행 일관성
같은 프롬프트 P에 대해 모델 M을 다시 실행했을 때 동일한 추출된 답변 A가 나올 확률이다. 논문에서는 한 실행의 관찰된 답변 A에 대해 다른 실행들이 같은 답변을 내는 비율을 레이블로 사용해 회귀 타깃으로 학습시켰다.