사진 측량 기반 3D 복원
여러 장의 2D 이미지에서 특징점을 추출하고 매칭하여 카메라의 위치와 장면의 3D 구조를 동시에 복원하는 기술이다. 전통적으로 복잡한 수학적 최적화 과정을 거치며, VGGT는 이를 단일 신경망 추론으로 대체하고자 한다.