교차 모달 정렬
이미지, 텍스트 등 서로 다른 형태의 데이터를 하나의 공통된 의미 공간에서 일치시키는 과정이다. 이를 통해 모델은 특정 단어와 이미지가 동일한 개념임을 이해하게 되며, 멀티모달 AI가 정보를 통합적으로 처리하는 기반이 된다.