프로비저닝된 처리량
일정한 수준의 모델 처리 성능(초당 토큰 수 등)을 보장받기 위해 미리 할당된 자원입니다. 모델이 레거시 상태로 전환되면 새로운 프로비저닝된 처리량 유닛을 생성하는 것이 제한될 수 있습니다.