멀티모달 표현 학습
텍스트, 이미지 등 서로 다른 형태의 데이터를 공통된 벡터 공간에 표현하여 AI가 통합적으로 이해하게 하는 기술이다. 이를 통해 텍스트 검색뿐만 아니라 이미지 기반 검색이 가능해진다.
텍스트 vs 이미지, 과학 논문 검색에서 승자는 누구일까?