제로샷 객체 탐지
모델이 학습 과정에서 명시적으로 보지 못한 새로운 객체를 텍스트 프롬프트만으로 찾아내는 기술이다. 별도의 추가 학습 데이터 없이도 일반적인 지식을 활용해 객체의 위치를 식별할 수 있어 초기 데이터셋 구축 비용을 획기적으로 줄여준다.