멀티모달 검색
텍스트뿐만 아니라 이미지, 오디오, 비디오 등 서로 다른 형태의 데이터를 동시에 이해하고 검색하는 기술이다. 사용자가 자연어로 질문하면 AI가 영상 속 특정 장면이나 소리를 분석하여 정확한 결과물을 찾아내는 메커니즘을 가진다.