임베딩 추론 엔진
텍스트나 이미지를 고차원 벡터로 변환하는 임베딩 모델을 실행하기 위한 전용 소프트웨어 스택이다. 모델 로딩, GPU 할당, 요청 큐잉 등을 관리하며 실시간 검색 및 추천 시스템의 핵심 성능을 좌우한다.