실행 간 일관성
동일한 입력값과 프롬프트에 대해 AI 모델이 매번 얼마나 동일한 답변을 내놓는지를 측정하는 지표이다. 시스템의 신뢰성을 평가하는 핵심 요소로, 본문에서는 모델 B가 모델 A보다 높은 일관성을 보였다.