분당 토큰 수
1분 동안 처리할 수 있는 최대 토큰의 양을 의미하며, 대규모 언어 모델 서비스의 처리량 제한(Quota)을 정의하는 표준 단위이다. 이 한도를 초과하면 서비스 요청이 거부되는 스로틀링(Throttling) 현상이 발생한다.