하이브리드 구성
RAG의 검색 능력과 대규모 컨텍스트 모델의 추론 능력을 결합한 아키텍처이다. 필요한 정보만 선별하여 모델에 입력함으로써 연산 효율성과 응답 정확도를 동시에 확보하는 전략이다.