본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
멀티 헤드 잠재 어텐션 (mla) 용어 설명 | AI Trends
mla
멀티 헤드 잠재 어텐션
고급
KV 캐시 메모리 사용량을 줄이기 위해 키와 값 벡터를 저차원 잠재 공간으로 압축했다가 추론 시 복원하는 효율적인 어텐션 기법이다.
비슷한 개념
multi-head-latent-attention
mla-multi-head-latent-attention
mqa
kv-caching
kv-quantization
kv-compaction
mqa-gqa-mha
head-dimension
← 용어 사전 전체 보기