병렬 추론
하나의 큰 작업을 여러 개로 나누어 다수의 소형 모델이 동시에 처리하게 하는 방식이다. 순차적 처리보다 속도가 빠르며, 저렴한 소형 모델을 여러 개 활용함으로써 전체적인 운영 비용을 낮출 수 있다.