멀티모달 표현 학습(multimodal-representation-learning)이란 무엇인가요?

Question

Accepted Answer

텍스트, 이미지 등 서로 다른 형태의 데이터를 공통된 벡터 공간에 표현하여 AI가 통합적으로 이해하게 하는 기술이다. 이를 통해 텍스트 검색뿐만 아니라 이미지 기반 검색이 가능해진다.

multimodal-representation-learning