시맨틱 수준 관계 정렬 (semantic-relational-alignment) 용어 설명 | AI Trends
semantic-relational-alignment
시맨틱 수준 관계 정렬
중급
동결된 비디오 이해 인코더(V-JEPA)의 토큰 간 유사도 행렬과 DiT 측의 토큰 유사도 행렬을 동일 해상도 토큰 집합에서 L1 손실로 정렬하는 기법이다. 물체와 그립퍼, 접촉 영역 등 지역들 간의 상호관계가 시간에 따라 일관되게 변화하도록 유도해 전역적 상호작용 오류를 개선한다. 픽셀 수준의 국소 제약과 보완적으로 작동한다.