본문으로 건너뛰기

grounding-dino

그라운딩 디노

중급

텍스트 쿼리를 입력받아 이미지 내에서 해당 객체의 위치를 찾아내는 개방형 어휘 객체 탐지 모델이다. 사용자가 '얼굴'이나 '번호판' 같은 자연어를 입력하면 이미지 내 관련 영역을 바운딩 박스로 식별하여 자동화된 마스킹의 기초 정보를 제공한다.