정적 랜덤 액세스 메모리
데이터를 유지하기 위해 리프레시가 필요 없는 고속 메모리로, 보통 칩 내부에 위치한다. DRAM보다 빠르지만 용량 대비 가격이 비싸며, Taalas 칩에서는 KV 캐시 저장용으로 쓰인다.
내 노트북에서 LLM 돌리기: Ollama와 LM Studio 완벽 가이드
GPU보다 10배 빠르고 저렴한 '하드와이어드' LLM 칩의 등장
70B 모델을 압도하는 20B의 반란, AI 추론 효율의 정점을 찍다