grounded-perception
AI가 시각적 질문에 답할 때 이미지 내 특정 좌표나 영역을 바운딩 박스로 명시하는 기술이다. 답변의 근거를 시각적으로 증명함으로써 사용자가 AI의 판단 과정을 검증하고 신뢰할 수 있게 한다.
20억 파라미터로 대형 모델급 OCR 성능을? Isaac 0.1 출시