공간적 대응
서로 다른 시점에서 촬영된 두 이미지에서 동일한 지점이나 객체를 찾아내어 연결하는 능력이다. 모델이 사물의 위치와 공간적 구조를 얼마나 정확하게 파악하고 있는지를 측정하는 중요한 지표가 된다.
AI가 눈앞의 그림을 보지 않고 대답하는 이유: VLM의 한계