본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

grouped-query-attention

그룹 쿼리 어텐션

멀티 헤드 어텐션의 성능과 멀티 쿼리 어텐션의 효율성을 결합하여 메모리 대역폭을 절약하는 아키텍처이다. 데이터 이동량을 줄여 모바일 기기의 발열을 억제하고 안정적인 추론 성능을 보장한다.

비슷한 개념

gqa mqa Group-Query Attention mqa-gqa-mha multi-head-attention mla subquadratic-attention gated-multi-head-latent-attention

← 용어 사전 전체 보기