본문으로 건너뛰기
MIT 연구진, LLM 메모리 병목 해결을 위한 50배 KV 캐시 압축 기술 'Attention Matching' 공개 | AI Trends