추론 엔지니어링
학습된 모델을 서비스 환경에서 최적화하여 실행하는 기술이다. 지연 시간 단축과 비용 절감을 목표로 하며 하드웨어와 소프트웨어의 통합이 중요하다. AI 상용화 단계의 수익성을 결정짓는 핵심 영역이다.