본문으로 건너뛰기
MolmoPoint: Grounding Token을 통한 시각-언어 모델의 포인팅 성능 개선 | AI Trends