핵심 요약
InvAD는 복원(Reconstruction) 과정을 제거하고 잠재 공간에서의 DDIM Inversion 궤적을 분석함으로써 정확도와 추론 속도를 동시에 확보했다. 특히 단 3단계의 인버전만으로도 SOTA 성능을 달성하며 실시간 제조 공정 적용 가능성을 입증했다.
배경
기존의 디퓨전 기반 이상 탐지 모델은 이미지를 노이즈로 변환한 뒤 다시 복원하는 과정을 거치며, 이 과정에서 발생하는 노이즈 강도 설정의 딜레마와 높은 연산 비용이 한계로 지적되었다.
대상 독자
이상 탐지 연구자, 디퓨전 모델 실무 적용을 고민하는 AI 엔지니어
의미 / 영향
InvAD는 디퓨전 모델의 고질적인 문제인 느린 추론 속도를 해결하여 실제 제조 현장의 실시간 검사 라인에 디퓨전 기술을 적용할 수 있는 길을 열었다. 또한 기존 디퓨전 모델에 플러그 앤 플레이 방식으로 결합이 가능하여 범용적인 이상 탐지 프레임워크로 활용될 가치가 높다.
챕터별 상세
기존 디퓨전 기반 이상 탐지의 한계점
InvAD의 핵심 아이디어: 복원 없는 인버전
잠재 공간 활용과 DDIM Inversion 아키텍처
이중 스코어링 메커니즘: NLL과 Abs 결합
실험 결과 및 성능 분석
def calculate_anomaly_score(z_t, prior_dist):
# NLL Score: Negative Log-Likelihood in latent space
nll_score = -prior_dist.log_prob(z_t).sum(dim=1)
# Abs Score: Norm-based Absolute difference
norm_map = torch.norm(z_t, p=2, dim=1)
abs_score = norm_map.max() - norm_map.min()
# Combined Score
final_score = nll_score + lambda_val * abs_score
return final_scoreInvAD에서 제안하는 NLL과 Abs 스코어를 결합한 이중 스코어링 로직 예시
실무 Takeaway
- 디퓨전 모델을 이상 탐지에 적용할 때 복원(Reconstruction) 과정을 제거하면 노이즈 강도 설정의 딜레마를 해결하고 속도를 획기적으로 높일 수 있다.
- 사전 학습된 백본의 특징 맵(Latent Space)에서 디퓨전을 수행하면 픽셀 단위의 미세 노이즈에 강건하면서도 의미론적인 결함을 더 잘 포착한다.
- NLL과 Abs 스코어를 결합한 이중 스코어링 방식은 디퓨전 스텝 수에 상관없이 안정적인 성능을 제공하여 실무에서의 하이퍼파라미터 튜닝 부담을 줄여준다.
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.