통합 메모리
CPU와 GPU가 동일한 메모리 공간을 공유하여 데이터를 주고받는 방식이다. 데이터 복사 과정을 생략하여 지연 시간을 줄이고, 대규모 LLM과 학습 데이터를 메모리 제약 없이 효율적으로 처리할 수 있게 돕는다.
M4 Max에서 초당 658토큰 달성, Apple Silicon 성능을 극한으로 끌어올린 MetalRT
내 AI 에이전트의 보금자리, Mac mini M4냐 클라우드 VPS냐?
Jetson에서 실시간 VLM 구동하기: Cosmos Reason 2B 배포 가이드
남극부터 하버드까지, 책상 위 슈퍼컴퓨터 DGX Spark의 활약
남극부터 하버드까지, 책상 위에서 2000억 파라미터 AI를 돌리는 방법