본문으로 건너뛰기

physics-region

물리 정보가 풍부한 영역

중급

로봇 조작 영상에서 조작기, 접촉면, 움직임이 큰 전경 픽셀들을 지칭한다. 이 논문에서는 포인트 트래킹과 초깃프레임 깊이 기반 가중치를 결합해 각 포인트의 물리 중요도를 계산하고, 평균 임계값으로 물리 마스크를 생성해 감독을 집중한다. 이 영역은 픽셀 수준 궤적 정렬과 토큰 간 관계 정렬의 감독 대상을 제한하는 데 핵심적이다.