InvAD: 디퓨전 모델을 활용한 복원 과정 없는 인버전 기반 이상 탐지 기술 | AI Trends

서울대학교 DSBA 연구실AI/ML조회 1회

InvAD: 디퓨전 모델을 활용한 복원 과정 없는 인버전 기반 이상 탐지 기술

기존 디퓨전 기반 이상 탐지의 복원 과정을 생략하고 잠재 공간에서의 DDIM Inversion과 이중 스코어링을 통해 정확도와 속도를 획기적으로 개선한 InvAD 프레임워크를 소개합니다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

InvAD는 복원(Reconstruction) 과정을 제거하고 잠재 공간에서의 DDIM Inversion 궤적을 분석함으로써 정확도와 추론 속도를 동시에 확보했다. 특히 단 3단계의 인버전만으로도 SOTA 성능을 달성하며 실시간 제조 공정 적용 가능성을 입증했다.

배경

기존의 디퓨전 기반 이상 탐지 모델은 이미지를 노이즈로 변환한 뒤 다시 복원하는 과정을 거치며, 이 과정에서 발생하는 노이즈 강도 설정의 딜레마와 높은 연산 비용이 한계로 지적되었다.

대상 독자

이상 탐지 연구자, 디퓨전 모델 실무 적용을 고민하는 AI 엔지니어

의미 / 영향

InvAD는 디퓨전 모델의 고질적인 문제인 느린 추론 속도를 해결하여 실제 제조 현장의 실시간 검사 라인에 디퓨전 기술을 적용할 수 있는 길을 열었다. 또한 기존 디퓨전 모델에 플러그 앤 플레이 방식으로 결합이 가능하여 범용적인 이상 탐지 프레임워크로 활용될 가치가 높다.

챕터별 상세

00:30

기존 디퓨전 기반 이상 탐지의 한계점

기존 방식은 원본 이미지에 노이즈를 추가한 뒤 이를 다시 복원하여 원본과의 차이(MSE)를 계산하는 Reconstruction 패러다임을 따른다. 이 과정에서 노이즈가 너무 약하면 이상치가 파괴되지 않아 복원 후에도 원본과 차이가 없고, 너무 강하면 정상 영역까지 변형되어 오탐지가 발생하는 노이즈 강도 딜레마가 발생한다. 또한 수십에서 수백 단계의 디노이징 과정을 반복해야 하므로 추론 속도가 매우 느려 실시간 검사 환경에 부적합하다.

02:09

InvAD의 핵심 아이디어: 복원 없는 인버전

InvAD는 복원 과정을 완전히 생략하고 이미지를 노이즈 방향으로 변환하는 Inversion 과정에만 집중한다. 정상 이미지는 학습된 가우시안 분포의 중심부(High-density)로 매핑되는 반면, 비정상 이미지는 분포의 변두리(Low-density)로 밀려나는 성질을 이용한다. 이를 통해 복원 없이도 도달한 지점의 밀도 차이만으로 이상 여부를 판단할 수 있어 연산량을 획기적으로 줄였다.

13:40

잠재 공간 활용과 DDIM Inversion 아키텍처

InvAD는 픽셀 공간이 아닌 사전 학습된 EfficientNet-B4 백본에서 추출한 특징 맵(Latent Space)에서 디퓨전을 수행한다. 픽셀 단위 노이즈에 강건하고 의미론적 정보를 활용할 수 있으며, 16x16 해상도의 특징 맵을 사용해 연산 효율을 극대화했다. 여기에 PF-ODE 기반의 결정론적 DDIM Inversion을 적용하여 단 3단계의 스텝만으로도 데이터와 노이즈 간의 안정적인 1:1 대응 궤적을 확보했다.

17:57

이중 스코어링 메커니즘: NLL과 Abs 결합

단순히 도달 지점의 확률 밀도(NLL)만 측정할 경우 고차원 공간에서 정상 샘플이 오히려 낮은 라이클리후드를 보이는 역점수 현상이 발생할 수 있다. 이를 보완하기 위해 특징 맵의 채널별 L2 Norm 차이를 계산하는 Abs 스코어를 결합했다. NLL은 전역적인 비전형성을 잡고 Abs는 국소적인 이상 부위를 포착하며 서로의 약점을 보완하여 하이퍼파라미터 튜닝 없이도 안정적인 성능을 유지한다.

23:44

실험 결과 및 성능 분석

MVTec AD 데이터셋에서 99.1%의 AUROC를 기록하며 기존 디퓨전 기반 SOTA 모델인 DiAD를 능가했다. 특히 추론 속도 면에서 88.1 FPS를 달성하여 기존 모델 대비 약 880배 빠른 성능을 보였으며, 이는 임베딩 기반의 빠른 모델들보다도 4배 이상 빠른 수치이다. 또한 의료 영상 데이터셋인 BMAD에서도 별도의 도메인 특화 수정 없이 87.2%의 성능을 기록하며 높은 범용성을 입증했다.

python

def calculate_anomaly_score(z_t, prior_dist):
    # NLL Score: Negative Log-Likelihood in latent space
    nll_score = -prior_dist.log_prob(z_t).sum(dim=1)
    
    # Abs Score: Norm-based Absolute difference
    norm_map = torch.norm(z_t, p=2, dim=1)
    abs_score = norm_map.max() - norm_map.min()
    
    # Combined Score
    final_score = nll_score + lambda_val * abs_score
    return final_score

InvAD에서 제안하는 NLL과 Abs 스코어를 결합한 이중 스코어링 로직 예시

실무 Takeaway

디퓨전 모델을 이상 탐지에 적용할 때 복원(Reconstruction) 과정을 제거하면 노이즈 강도 설정의 딜레마를 해결하고 속도를 획기적으로 높일 수 있다.
사전 학습된 백본의 특징 맵(Latent Space)에서 디퓨전을 수행하면 픽셀 단위의 미세 노이즈에 강건하면서도 의미론적인 결함을 더 잘 포착한다.
NLL과 Abs 스코어를 결합한 이중 스코어링 방식은 디퓨전 스텝 수에 상관없이 안정적인 성능을 제공하여 실무에서의 하이퍼파라미터 튜닝 부담을 줄여준다.

언급된 리소스

논문InvAD: Inversion-based Reconstruction-Free Anomaly Detection with Diffusion Models

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 03. 26.수집 2026. 03. 26.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.