본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
시각적 질의응답 (vqa) 용어 설명 | AI Trends
vqa
시각적 질의응답
입문
이미지와 그에 대한 질문이 주어졌을 때 AI가 이미지를 이해하고 적절한 답변을 생성하는 태스크로, 멀티모달 모델의 성능 평가에 주로 사용됩니다.
비슷한 개념
visual-instruction-tuning
multimodal-ai
multimodal-search
multi-modal-ai
multimodal-perception
visual-reasoning
vlm
vision-language-pretraining
← 용어 사전 전체 보기