초당 토큰 수
LLM이 텍스트를 생성하는 속도를 측정하는 단위이다. 수치가 높을수록 응답 속도가 빠르며, 로컬 환경에서는 하드웨어 성능과 최적화 수준을 판단하는 핵심 지표로 활용된다.