본문으로 건너뛰기

피드 트렌딩 커뮤니티 공지사항 기술 태그 AI 용어 사전 서비스 소개 문의 운영 정책 개인정보 처리방침

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI Trends·후원

피드 트렌딩 커뮤니티 공지

피드 트렌딩 커뮤니티 공지

추론 지연 시간 (inference-latency) 용어 설명 | AI Trends

inference-latency

추론 지연 시간

중급

AI 모델이 입력을 받아 결과를 생성하기까지 걸리는 시간을 의미한다. 실시간 대화형 서비스에서 사용자 경험을 결정짓는 핵심 지표로, 하드웨어 성능과 최적화에 따라 단축될 수 있다.

비슷한 개념

latency api-latency inference-efficiency inference-system inference-acceleration low-latency first-token-latency inference-capacity

← 용어 사전 전체 보기