본문으로 건너뛰기

AI Trends

매일 업데이트되는 글로벌 소스의 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

둘러보기

피드 트렌딩 커뮤니티 공지사항 일자별 아카이브

탐색

기술 태그 AI 용어 사전

서비스

서비스 소개 문의

정책

운영 정책 개인정보 처리방침 이용약관

© 2026 AI Trends. All rights reserved.후원

피드 트렌딩 커뮤니티 탐색 보관함

홈 트렌딩 커뮤니티 보관함 프로필

flashattention

플래시 어텐션

중급

GPU의 메모리 계층 구조를 활용하여 어텐션 연산의 속도를 높이고 메모리 사용량을 줄이는 알고리즘이다. 중간 결과물을 HBM에 저장하지 않고 타일링 기법을 통해 SRAM 내에서 연산하여 메모리 대역폭 병목 현상을 해결한다.

비슷한 개념

flash-attention flash-attention-2 flash-attn block-tiling flash-attention-4 tiled-execution ring-attention flash-moe

← 용어 사전 전체 보기