객체 중심 학습
이미지나 비디오의 원시 픽셀 데이터를 객체 단위의 추상적인 표현(Slot)으로 분해하여 학습하는 방식이다. 모델이 감독 없이도 장면 내의 개별 물체를 식별하고 그 특성을 파악할 수 있게 하여 복잡한 장면 이해와 추론의 기초를 제공한다.