OmnimatteZero: 비디오에서 객체와 그림자를 실시간으로 제거하는 혁신적 AI | AI Trends

Two Minute PapersAI/ML

OmnimatteZero: 비디오에서 객체와 그림자를 실시간으로 제거하는 혁신적 AI

NVIDIA와 Adobe가 공동 개발한 OmnimatteZero는 추가 학습 없이 기존 Diffusion 모델을 활용하여 비디오 내 객체와 그림자, 반사광을 25 FPS의 실시간 속도로 완벽하게 제거한다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

OmnimatteZero는 Mean Temporal Attention 기법을 도입하여 별도의 학습 없이도 객체와 부수적 효과를 실시간으로 제거하며, 기존 기술 대비 압도적인 속도와 품질을 제공한다.

배경

비디오 편집에서 객체를 제거할 때 객체 자체뿐만 아니라 그로 인해 발생하는 그림자나 반사광 같은 이차 효과를 자연스럽게 처리하는 것은 매우 어려운 과제였다.

대상 독자

AI 연구자, 비디오 편집 전문가, 컴퓨터 비전 개발자

의미 / 영향

OmnimatteZero의 등장으로 고가의 비용이 들던 비디오 후반 작업 중 객체 제거 공정이 실시간 자동화될 가능성이 열렸다. 특히 학습 과정이 필요 없으므로 다양한 환경의 영상에 즉각 도입할 수 있으며, 모바일 기기에서의 실시간 영상 편집 앱 개발에도 큰 영향을 미칠 것이다.

챕터별 상세

00:00

OmnimatteZero의 주요 기능과 성능 시연

OmnimatteZero는 비디오에서 선택한 객체를 제거할 때 해당 객체가 남긴 그림자와 반사광까지 함께 지운다. 강아지가 뛰어가는 영상에서 강아지만 제거하는 것이 아니라 지면에 비친 그림자까지 완벽하게 복원했다. 고양이가 풀밭을 걸어갈 때 고양이를 제거하면 고양이 발에 눌렸던 풀의 움직임까지 자연스러운 배경으로 대체했다. 탁상시계의 깜빡이는 콜론 기호와 그로 인한 바닥 반사광을 동시에 제거하는 정교함을 보여주었다.

03:22

작동 원리: 직소 퍼즐과 시간적 어텐션

비디오를 여러 장의 직소 퍼즐이 쌓여 있는 더미로 간주하고 작동한다. 특정 프레임에서 객체를 제거하여 생긴 빈 구멍을 메우기 위해 새로운 그림을 그리는 대신, 이전이나 이후 프레임에서 해당 위치의 배경 정보를 찾아 복사해온다. 이 과정에서 Mean Temporal Attention이라는 수학적 기법을 사용하여 여러 프레임의 배경 조각들을 평균 내어 색상과 선이 완벽하게 일치하도록 조정했다. 이를 통해 별도의 AI 학습 과정 없이도 일관성 있는 배경 복원이 가능하다.

Mean Temporal Attention은 빈 공간을 자석처럼 설정하여 주변 프레임의 배경 정보만을 끌어당겨 평균화하는 방식이다.

05:30

기술적 한계와 향후 전망

여러 프레임의 정보를 평균 내어 사용하기 때문에 결과물이 원본보다 다소 흐릿해지는 경향이 있다. 카메라가 미세하게 흔들리거나 압축 알고리즘으로 인한 노이즈가 있을 경우 픽셀 정렬이 완벽하지 않아 선명도가 떨어진다. 하지만 이는 비디오의 깜빡임(Flickering) 현상을 방지하고 안정성을 확보하기 위한 트레이드오프 결과이다. 연구팀은 2025년 2월 중 소스 코드를 공개할 예정이며, 이는 비디오 편집 워크플로우를 혁신할 것으로 기대된다.

코드 예제

bash

ollama run deepseek-r1:671b

Ollama를 사용하여 DeepSeek-R1 671B 모델을 실행하는 명령어 예시

실무 Takeaway

비디오 인페인팅 시 객체와 연결된 그림자 및 반사광을 함께 제거해야 시각적 완성도가 높아진다.
Mean Temporal Attention을 활용하면 새로운 배경을 생성하지 않고도 기존 프레임 정보를 통해 실시간 복원이 가능하다.
별도의 파인튜닝 없이 기존 Diffusion 모델을 그대로 활용하는 Zero-shot 방식이 실무 적용에 유리하다.

언급된 리소스

DemoOmnimatteZero Project Page

GitHubOmnimatteZero GitHub Repository

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 02. 06.수집 2026. 02. 21.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.