통합 메모리 아키텍처
CPU와 GPU가 동일한 메모리 풀을 공유하여 데이터 복사 과정 없이 자원에 접근하는 구조이다. 대규모 언어 모델 구동 시 데이터 전송 병목 현상을 줄여 성능을 극대화한다.