본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
멀티헤드 잠재 어텐션 (multi-head-latent-attention) 용어 설명 | AI Trends
multi-head-latent-attention
멀티헤드 잠재 어텐션
고급
KV 캐시를 잠재 벡터로 압축하여 추론 시 메모리 사용량을 획기적으로 줄이는 어텐션 메커니즘이다. 긴 멀티모달 시퀀스를 처리할 때 높은 효율성을 제공한다.
비슷한 개념
mla
mla-multi-head-latent-attention
mqa
kv-compaction
multi-head-attention
kv-quantization
kv-caching
kv-cache-compression
← 용어 사전 전체 보기