초당 프롬프트 처리량
모델이 입력된 텍스트(프롬프트)를 이해하고 처리하는 속도를 나타내는 지표이다. LLM 추론의 초기 단계 성능을 결정하며, 메모리 대역폭과 연산 성능의 영향을 크게 받는다.