스트리밍 모델
전체 입력이 완료될 때까지 기다리지 않고 데이터가 들어오는 즉시 순차적으로 처리하여 결과를 출력하는 방식이다. 실시간 대화형 AI 시스템에서 지연 시간을 최소화하기 위해 사용된다.