객체 쿼리
트랜스포머 기반 탐지 모델에서 특정 객체의 위치와 범주 정보를 담기 위해 사용되는 학습 가능한 벡터로, 이미지 특징과 상호작용하며 최종 예측값을 도출합니다.
카메라 위치 정보 없이도 정확한 3D 객체 탐지, VGGT-Det로 mAP 8.6% 향상