지연 시간 변동성
동일한 입력에 대해 LLM이 응답을 생성하는 데 걸리는 시간이 매번 달라지는 정도를 의미한다. 지연 시간의 분산이 크면 사용자 경험의 일관성이 떨어지므로, 배포 전 반복 실행을 통해 이 수치를 안정적으로 관리해야 한다.