임베딩 정렬
서로 다른 모달리티(텍스트, 이미지 등)나 언어의 벡터 표현을 하나의 공통된 의미 공간으로 일치시키는 과정이다. 이를 통해 모델은 텍스트로 배운 개념을 이미지에서도 동일하게 인식할 수 있게 된다.