분할 GPU 할당
하나의 물리적 GPU를 여러 개의 논리적 단위로 나누어 여러 작업이 동시에 사용할 수 있게 하는 기술입니다. 가벼운 실험이나 추론 작업 시 GPU 전체를 점유하지 않고 필요한 만큼(예: 0.5 GPU)만 할당함으로써 자원 활용도를 극대화하고 하드웨어 비용을 절감할 수 있습니다.