핵심 요약
생성형 AI로 제작된 이미지의 출처를 추적하기 위해 멀티비트 워터마킹 기술이 중요해지고 있다. 이 논문은 기존 방식보다 임베딩은 2배, 디코딩은 7.4배 빠르면서도 이미지 왜곡에 매우 강한 새로운 워터마킹 프레임워크를 제시한다.
왜 중요한가
생성형 AI로 제작된 이미지의 출처를 추적하기 위해 멀티비트 워터마킹 기술이 중요해지고 있다. 이 논문은 기존 방식보다 임베딩은 2배, 디코딩은 7.4배 빠르면서도 이미지 왜곡에 매우 강한 새로운 워터마킹 프레임워크를 제시한다.
관련 Figure

AI 모델이나 카메라로 생성된 이미지에 타임스탬프, IP 주소 등의 정보를 담은 멀티비트 메시지를 삽입하고, 배포 과정에서 발생하는 왜곡을 견디며 나중에 이를 정확히 검출 및 복원하는 과정을 보여준다.
멀티비트 이미지 워터마킹의 전체적인 워크플로우 다이어그램
핵심 기여
ADD(Add, Dot, Decode) 프레임워크 제안
메시지 비트와 학습된 워터마크의 선형 결합을 이미지에 더하고(Add), 내적(Dot) 연산만으로 메시지를 복원(Decode)하는 단순하고 효율적인 구조를 설계했다.
강력한 왜곡 내성 확보
가우시안 블러, JPEG 압축, 회전, 크롭 등 다양한 이미지 변형 환경에서도 디코딩 정확도 하락을 2% 이내로 방어하며 기존 SOTA 대비 압도적인 복원력을 입증했다.
이론적 정당성 입증
학습된 워터마크가 이미지 데이터의 저차원 부분 공간과 직교하며, 메시지 비트 간에도 상호 직교성을 갖게 됨을 수학적으로 증명하여 높은 식별력을 보장했다.
핵심 아이디어 이해하기
이미지 워터마킹은 원본 이미지의 시각적 품질을 해치지 않으면서도 숨겨진 정보를 안전하게 전달해야 한다. 기존의 딥러닝 기반 방식들은 복잡한 인코더-디코더 구조를 사용하여 연산 비용이 높고, 고용량 메시지를 담을 때 왜곡에 취약해지는 한계가 있었다.
ADD는 이미지가 고차원 공간 내의 특정 저차원 부분 공간(Subspace)에 집중되어 있다는 기하학적 특성을 이용한다. 워터마크 신호를 이 이미지 부분 공간과 수직인 방향으로 학습시키면, 이미지 자체의 신호와 워터마크 신호가 서로 간섭하지 않게 된다. 이는 마치 소음이 가득한 방에서 완전히 다른 주파수의 소리를 내어 정보를 전달하는 것과 같다.
결과적으로 워터마크가 삽입된 이미지와 학습된 워터마크 벡터를 내적(Dot Product)하면 이미지 성분은 0에 가깝게 사라지고 워터마크 성분만 남게 된다. 이 원리를 통해 복잡한 신경망 추론 없이 단순한 행렬 연산만으로도 48비트 이상의 대용량 정보를 매우 빠르고 정확하게 추출할 수 있다.
방법론
ADD의 학습 과정은 이미지 품질 유지, 식별력 확보, 왜곡 내성이라는 세 가지 목표를 동시에 최적화하는 손실 함수를 사용한다. 원본 이미지 x에 K-비트 메시지 m과 학습 대상인 워터마크 w의 선형 결합을 더해 워터마크 이미지 x̃ = x + Σ m_k w_k를 생성한다. 이때 워터마크의 크기를 제한하기 위해 L2 정규화 항(β Σ ||w_k||²)을 추가하여 시각적 품질을 보존한다.
디코딩 성능을 높이기 위해 마진 기반 손실 함수(Margin-based Loss) V를 도입한다. 메시지 비트 m_k와 워터마크 이미지의 내적 값 ⟨w_k, x̃'⟩이 주어질 때, m_k * ⟨w_k, x̃'⟩ 값을 계산하여 이 값이 클수록 손실이 줄어들도록 설계한다. 이는 모델이 각 비트를 명확하게 구분할 수 있는 방향으로 워터마크 벡터를 정렬하게 만든다.
실제 구현 시에는 고차원 픽셀 공간에서 직접 최적화하는 대신, 사전 학습된 특징 추출기(Feature Extractor) ψ를 사용하여 저차원 특징 공간에서 워터마크 맵 g_k를 학습한다. 학습이 완료되면 전체 데이터셋에 대한 평균 워터마크 벡터를 고정하여 배포 시 사용하며, 디코딩 시에는 단순히 수신된 이미지와 고정된 워터마크 벡터 간의 내적 부호를 확인하여 비트 값을 복원한다.
관련 Figure

워터마크 벡터 w_1:K를 학습하는 손실 함수 구조와 실제 배포 시 이미지에 더하고(Add) 내적(Dot)하여 복원하는 메커니즘을 시각화했다. 메시지 딕셔너리 D 유무에 따른 검출 통계량 차이도 명시되어 있다.
ADD 기법의 학습 및 배포 구조 상세도
주요 결과
MS-COCO 벤치마크에서 48비트 워터마킹을 수행한 결과, ADD는 왜곡이 없는 상태에서 100%의 디코딩 정확도를 기록했다. 가우시안 블러, JPEG 압축 등 9가지 왜곡 시나리오 평균 정확도는 99.4%로, 기존 최신 기법인 SSL(84.9%)이나 HiDDeN(82.5%)을 크게 앞질렀다.
연산 효율성 측면에서도 압도적인 성능을 보였다. NVIDIA A100 GPU 기준 이미지당 임베딩 시간은 0.76ms로 기존 방식 대비 2배 이상 빨랐으며, 특히 디코딩 시간은 0.19ms로 가장 빠른 기존 기법(1.41ms)보다 약 7.4배 빠른 속도를 달성했다.
또한 ImageNet, CIFAR-10 등 학습에 사용되지 않은 외부 데이터셋에서도 99.27% 이상의 비트 정확도를 유지하며 강력한 일반화 성능을 입증했다. 이는 ADD가 특정 데이터셋의 특성에 의존하지 않고 이미지 데이터의 보편적인 기하학적 구조를 잘 활용하고 있음을 보여준다.
관련 Figure

ADD는 35.72 dB의 PSNR을 기록하며 원본 이미지와 시각적으로 거의 차이가 없는 고품질 결과를 생성함을 보여준다. 타 기법(HiDDeN, SSL) 대비 우수하거나 대등한 시각적 충실도를 유지한다.
다양한 워터마킹 기법 간의 시각적 품질 및 PSNR 비교
기술 상세
ADD의 핵심 이론적 기여는 워터마크 벡터 w_k가 이미지 부분 공간 U의 직교 보공간(Orthogonal Complement) U⊥에 위치하게 된다는 점을 증명한 것이다. 이미지 데이터가 저차원 매니폴드 근처에 분포한다는 가정 하에, 최적화 과정에서 워터마크는 이미지 신호와 가장 덜 간섭하는 방향으로 수렴한다.
수학적으로 워터마크 벡터들 간의 상호 직교성(Mutual Orthogonality) ⟨w_k, w_j⟩ = 0 (k ≠ j)이 성립함을 보였다. 이는 각 메시지 비트가 독립적인 채널을 통해 전달됨을 의미하며, 비트 수가 늘어나도 상호 간섭 없이 높은 정확도를 유지할 수 있는 근거가 된다.
학습 시에는 힌지 손실(Hinge Loss) 또는 로지스틱 손실(Logistic Loss)을 선택적으로 사용할 수 있으며, 정규화 매개변수 β를 통해 이미지 품질(PSNR)과 디코딩 정확도 사이의 트레이드오프를 조절할 수 있다. 실험적으로 β=1000일 때 PSNR 32dB 이상과 99% 이상의 정확도를 동시에 확보할 수 있음을 확인했다.
관련 Figure

β 값이 커질수록 워터마크 강도가 약해져 이미지 품질(PSNR)은 좋아지지만 디코딩 정확도는 낮아지는 트레이드오프 관계를 보여준다. 최적의 운영 지점을 선택하는 근거를 제공한다.
정규화 파라미터 β에 따른 이미지 품질과 디코딩 정확도의 상관관계
한계점
본 연구는 이미지 도메인에 한정되어 있으며 비디오, 오디오, 텍스트 등 다른 모달리티로의 확장은 향후 과제로 남겨두고 있다. 또한 여러 개의 워터마킹 메커니즘이 동시에 적용되는 시나리오에 대한 중앙 집중식 할당 및 검증 방안은 다루지 않았다.
실무 활용
ADD는 매우 낮은 연산 비용으로 고용량 정보를 숨길 수 있어 실시간 이미지 생성 서비스나 대규모 콘텐츠 인증 시스템에 즉시 적용 가능하다.
- AI 이미지 생성 API(DALL-E 등)에서 사용자 ID, 타임스탬프, IP 주소를 실시간으로 삽입하여 오남용 추적
- 디지털 아티스트의 저작물에 보이지 않는 서명을 삽입하여 무단 도용 및 변조 확인
- 소셜 미디어 플랫폼에서 업로드되는 이미지의 출처를 자동으로 식별하고 딥페이크 여부 판별 보조
코드 공개 여부: 비공개
키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.