TensorRT 컴파일
NVIDIA의 TensorRT를 사용하여 딥러닝 모델을 특정 GPU 아키텍처에 최적화된 엔진으로 변환하는 과정입니다. FP16 양자화 등을 통해 정확도 손실을 최소화하면서 추론 속도를 수 배 향상시킬 수 있습니다.