본문으로 건너뛰기

inference-capacity

추론 용량

입문

학습된 AI 모델이 실제 데이터를 입력받아 결과를 생성하는 데 필요한 계산 자원의 총량이다. 서비스 운영 규모와 동시 접속자 처리 능력을 결정하는 핵심 지표이다.