본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
첫 번째 토큰 지연 시간 (first-token-latency) 용어 설명 | AI Trends
first-token-latency
첫 번째 토큰 지연 시간
중급
모델이 입력을 받은 후 첫 번째 토큰을 생성하여 출력하기까지 걸리는 시간이다. 사용자 경험에서 응답의 즉각성을 결정하는 핵심 지표로 활용된다.
비슷한 개념
ttft
time-to-first-token
time-to-token
tpot
token-generation
prefill-latency
time-to-first-audio
api-latency
← 용어 사전 전체 보기