결과 유효성
에이전트가 생성한 최종 결과물이 사용자의 요구사항을 충족하고 실제 실행 가능한 형태인지를 평가하는 지표로, 경로 계획에서는 도달 가능성이나 제약 조건 준수 여부 등을 포함한다.
LLM 경로 계획의 한계 발견: MobilityBench로 측정하는 실제 이동 시나리오