vram
그래픽 카드에 장착된 전용 메모리로, AI 모델의 가중치와 연산 데이터를 저장한다. 용량이 부족하면 시스템 메모리를 빌려 쓰게 되어 속도가 급격히 느려지거나 오류가 발생한다.
32GB VRAM 장벽을 깨다: AMD GPU에서 LTX-2.3 실행 성공
32GB VRAM으로 40GB 모델 돌리기? RTX 5090과 LTX 2.3의 만남
4.5GB VRAM으로 즐기는 강력한 3B 모델의 추론 능력
로컬 LLM 구동을 위한 최신 CUDA 성능 벤치마크 데이터 공개
4.5GB VRAM으로 구동하는 강력한 3B 추론 모델 Cicikuş v2