VRAM 기반 최적화
그래픽 카드의 비디오 램(VRAM) 용량에 맞춰 실행 가능한 최적의 LLM 크기를 결정하는 방식이다. 로컬 환경에서 모델을 구동할 때 메모리 부족으로 인한 성능 저하나 오류를 방지하기 위해 하드웨어 자원을 사전에 분석한다.