실행 시간 여유분
정해진 시간 예산 내에서 특정 최적화(예: 커널 교체)를 통해 절약한 시간을 의미한다. 이 여유 시간을 더 많은 토큰 학습이나 복잡한 연산에 재투자함으로써 제한된 자원 내에서 모델의 최종 성능을 극대화할 수 있다.