토큰 출력당 시간
모델이 출력 토큰 하나를 생성하는 데 걸리는 평균 시간으로, 본 논문에서는 라우팅 비용 정규화 항목으로 사용되어 모델 간 지연을 비교하고 예산 제약을 직접 제어하는 주요 효율성 지표이다.