본문으로 건너뛰기
AI Trends
피드
트렌딩
콜로세움
공지
로그인
피드
트렌딩
콜로세움
공지
추론 처리량 (inference-throughput) 용어 설명 | AI Trends
inference-throughput
추론 처리량
중급
단위 시간당 처리할 수 있는 추론 데이터의 양으로, LLM에서는 초당 토큰 수로 측정한다.
비슷한 개념
throughput
tps
t-s
otps
token-per-second
pp-s
tok-sec
token-throughput
← 용어 사전 전체 보기