통합 메모리 아키텍처
CPU와 GPU가 동일한 메모리 공간을 공유하는 구조이다. 별도의 비디오 메모리(VRAM)로 데이터를 복사할 필요가 없어 지연 시간을 획기적으로 줄일 수 있다.
클라우드 없이 LLM 추론 1.8초 돌파, 베어메탈로 구현한 진정한 AI 주권