멀티모달 어텐션
텍스트, 이미지 등 서로 다른 형태의 데이터 간 관계를 학습하기 위해 어텐션 메커니즘을 확장한 방식이다. 다양한 모달리티의 정보를 융합하여 복합적인 맥락을 파악하며, 정교한 조건부 생성의 핵심 기술로 활용된다.