멀티모달 강화학습
텍스트, 이미지, 음성 등 서로 다른 형태의 데이터를 동시에 입력받아 환경을 인식하고 최적의 행동을 결정하도록 모델을 학습시키는 강화학습 기법이다. 단일 모달리티보다 풍부한 정보를 활용하여 복잡한 실세계 과제 수행 능력을 높이는 데 필수적이다.