추론 비용
학습된 AI 모델을 실제 사용자 요청에 따라 실행할 때 발생하는 컴퓨팅 자원 및 인프라 운영 비용이다. 모델의 크기가 커지고 구조가 복잡해질수록 요청당 처리 비용이 상승하여 대중적인 서비스 출시의 제약 요인이 된다.