본문으로 건너뛰기
vqa-benchmarks
시각 질문응답 벤치마크
중급
이미지와 질의-응답 쌍을 포함하는 평가 세트로, 시각 이해와 텍스트 정렬 성능을 동시에 평가하며 ViQ의 멀티모달 정렬 능력을 검증하는 데 사용된다.
비슷한 개념
vqa
mmmu
visual-instruction-tuning
benchmark-dataset
vision-language-alignment
webeyes
multimodal-reasoning
vision-language-pretraining
← 용어 사전 전체 보기
AI Trends
피드
트렌딩
커뮤니티
로그인
홈
트렌딩
검색
커뮤니티
프로필