핵심 요약
브리태니커 백과사전과 사전 출판사 메리엄-웹스터가 OpenAI를 상대로 저작권 침해 소송을 제기했다. 소송의 핵심은 GPT-4가 이들의 방대한 지식 콘텐츠를 무단으로 학습하여 원문과 거의 동일한 내용을 출력한다는 점이다. 브리태니커 측은 OpenAI가 자사 웹사이트로의 트래픽을 유도하는 대신 직접적인 경쟁 답변을 생성하여 비즈니스 모델을 위협하고 있다고 주장한다. 이는 뉴욕타임스 소송 및 앤스로픽의 대규모 합의 사례와 맥을 같이 하는 AI 업계의 중대한 저작권 분쟁이다.
배경
생성형 AI의 기본 작동 원리, 저작권 및 공정 이용(Fair Use) 개념
대상 독자
AI 법률 및 정책 관계자, 콘텐츠 저작권자, LLM 서비스 기획자
의미 / 영향
이번 소송은 AI 모델의 학습 데이터 확보 방식에 대한 법적 기준을 강화할 것으로 보인다. 특히 '암기' 현상이 입증될 경우, AI 기업들은 데이터 라이선스 계약을 체결하거나 모델의 출력 방식을 대폭 수정해야 하는 압박을 받게 될 것이다.
섹션별 상세
브리태니커 백과사전과 사전 출판사 메리엄-웹스터는 OpenAI가 저작권이 있는 콘텐츠를 무단으로 사용하여 모델을 학습시켰다며 소송을 제기했다. 원고 측은 GPT-4가 자사의 콘텐츠를 '암기(Memorization)'하고 있으며, 사용자의 요청에 따라 상당 부분의 내용을 토씨 하나 틀리지 않고 그대로 출력할 수 있다고 주장한다.
소장에는 OpenAI 모델의 답변과 브리태니커의 원문을 나란히 비교한 사례들이 포함되어 있으며, 전체 문단이 단어 하나까지 일치하는 경우가 다수 발견되었다. 이는 단순한 정보 요약을 넘어 저작권이 있는 텍스트의 무단 복제에 해당한다는 것이 원고 측의 입장이다.
브리태니커는 OpenAI가 기존 검색 엔진과 달리 출처 웹사이트로 사용자를 연결하지 않고 직접 답변을 제공함으로써 웹 트래픽을 '잠식(Cannibalizing)'하고 있다고 비판했다. 이러한 행위가 원본 콘텐츠 제작자의 수익 모델을 직접적으로 위협하고 경쟁 관계를 형성한다고 강조했다.
이번 소송은 최근 AI 업계에서 잇따르는 저작권 분쟁의 연장선상에 있다. 뉴욕타임스가 OpenAI를 상대로 유사한 소송을 진행 중이며, 앤스로픽은 최근 저작권이 있는 도서를 학습에 사용한 혐의로 제기된 집단 소송에서 작가들에게 15억 달러를 지급하기로 합의한 바 있다.
실무 Takeaway
- AI 모델이 학습 데이터를 단순히 학습하는 것을 넘어 특정 문구를 그대로 출력하는 '암기(Memorization)' 현상이 저작권 소송의 핵심 쟁점으로 부상하고 있다.
- 생성형 AI가 정보를 요약하여 제공하는 방식이 기존 지식 서비스 제공자의 웹 트래픽을 감소시키는 '트래픽 잠식' 문제가 법적 분쟁의 주요 논거로 활용되고 있다.
- 앤스로픽의 15억 달러 합의 사례에서 보듯, AI 기업들은 학습 데이터의 저작권 문제 해결을 위해 막대한 비용을 지불해야 할 리스크에 직면해 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료