본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
복원 지연 시간 (decode-latency) 용어 설명 | AI Trends
decode-latency
복원 지연 시간
중급
압축된 데이터를 원래의 형태로 되돌리는 데 걸리는 시간이다. LLM 기반 압축에서는 모델 추론 시간이 이 지연 시간의 대부분을 차지하여 실시간 성능을 저해한다.
비슷한 개념
latency
lossy-compression
streaming-latency
latency-variance
autocompact
inference-latency
semantic-compression
compile-time-optimization
← 용어 사전 전체 보기