통합 메모리
CPU와 GPU가 동일한 메모리 공간을 공유하여 데이터를 주고받는 방식이다. 데이터 복사 과정을 생략하여 지연 시간을 줄이고, 대규모 LLM과 학습 데이터를 메모리 제약 없이 효율적으로 처리할 수 있게 돕는다.