지연 시간 예산
사용자가 서비스를 이용할 때 허용할 수 있는 최대 응답 시간의 한계치를 의미한다. 실시간 상담이나 인터랙티브 서비스에서 모델의 지능보다 우선시되기도 하는 성능 지표이다.