경로 F1 점수
모델이 최종 정답뿐만 아니라 그 정답에 도달하기까지의 추론 경로(단계별 조건 판단)를 얼마나 정확하게 따라갔는지 측정하는 지표입니다. 정밀도와 재현율의 조화 평균으로 계산됩니다.