본문으로 건너뛰기

video-mllm

비디오 멀티모달 거대 언어 모델

중급

텍스트와 비디오 데이터를 동시에 처리하고 이해할 수 있는 거대 언어 모델이다. 영상의 프레임 간 관계를 파악하여 복잡한 질문에 답하거나 내용을 요약하는 능력을 갖추고 있다.