본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

latency

지연 시간

입문

사용자의 요청이 발생한 시점부터 시스템이 응답을 완료할 때까지 걸리는 시간을 뜻한다. LLM 애플리케이션에서는 모델의 추론 시간과 API 통신 시간이 주요 요인이며, 이를 줄이는 것이 사용자 경험 향상에 핵심적이다.

비슷한 개념

api-latency latency-variance inference-latency streaming-latency serving-latency ttft time-to-token inference-efficiency

← 용어 사전 전체 보기