Detail-condensing Queries
VFM의 중간 계층 특징에서 저수준의 재구성 정보를 추출하기 위해 학습 가능한 쿼리 토큰을 사용하는 핵심 구성 요소. Cross-attention으로Patch 토큰의 정보를 응축해 재구성과 생성에 보완 정보를 제공한다.