Anthropic, 알리바바 연루된 대규모 'Claude' 능력 탈취 시도 보고 — 2,880만여 교신 확인

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Anthropic은 자사 대형 언어모델 Claude의 핵심 기능을 불법적으로 추출하려는 대규모 자동화 캠페인을 포착했다고 보고했다. 공격자들은 수만 개의 사기 계정을 통해 반복 질의를 전송해 모델의 응답을 수집했고, 이 과정에서 에이전트식 추론·소프트웨어 엔지니어링·장기 과제 해결 능력 같은 고부가가치 기능을 표적화했다. 회사에 따르면 해당 활동은 4월 22일부터 6월 5일 사이 거의 25,000개의 사기 계정과 2,880만 회 이상의 교신을 수반했으며, Anthropic은 이 사실을 6월 10일 상원 청문회 전 의원들에게 제출한 서한에 포함했다. 이 사례는 모델 공개 시점과 지역별 접근 제한이 맞물릴 때 무단 추출 시도가 증가할 수 있음을 보여주며, API 제공자·운영자는 계정 관리·이상 탐지·기능별 접근 제어를 강화해야 할 필요성을 부각한다. 결과적으로 이 사건은 지적재산 보호와 안전 통제의 중요성을 재확인한다. 다만 기사 본문은 공격의 기술적 세부 구현(예: 자동화 스크립트 구조, 프롬프트 형태)보다는 발생 규모와 표적 능력에 초점을 맞추므로 방어 기술 설계에는 추가 기술 자료가 필요하다.

섹션별 상세

Anthropic은 자사 주요 모델 Claude의 핵심 역량을 불법적으로 추출하려는 자동화 캠페인이 관측된 점을 문제로 제기했다. 공격자들은 수천 개의 사기 계정을 통해 반복적으로 질의를 보내 모델의 반응을 수집했고, 이 과정에서 에이전트식 추론과 소프트웨어 엔지니어링·장기 계획 수행 같은 고부가가치 능력을 집중적으로 유도해 응답을 확보했다. 회사 측은 4월 22일부터 6월 5일 사이에 ‘Alibaba와 Alibaba Qwen과 연관된 운영자들이 거의 25,000개의 사기 계정을 통해 Claude와 2,880만 회 이상의 교신을 발생시켰다’고 제시한 수치를 근거로 들었다. 이러한 대규모 자동화 질의는 모델의 내부 동작을 대량으로 복제할 수 있어 지적재산과 안전 통제에 즉각적 위험을 초래한다.

이 사건은 Anthropic의 신형 모델 Mythos 공개와 이어진 해외 접근 제한 조치의 직후에 발생해 맥락적 중요성이 커졌다. Anthropic은 상원 청문회를 하루 앞두고 의원들에게 발송한 6월 10일자 서한에서 이번 캠페인을 '지금까지 측정한 것 중 가장 큰 불법적 능력 추출 시도'로 규정하며 기밀 증거를 제시했다고 보고했다. 해당 서한은 캠페인이 서비스 약관과 접근 제한을 반복적으로 위반해 모델의 고급 기능을 표적화했다고 지적하는 문단을 포함한다. 이 일련의 사실은 모델 공개·시장 제한·국가별 규제 환경이 결합될 때 권한 남용과 기술 유출 위험이 증대함을 의미한다.

실무 Takeaway

대량의 사기 계정과 자동화된 교신을 통해 모델의 고급 능력을 대규모로 추출할 수 있으므로 API 제공자는 계정 생성·사용 패턴 기반의 이상 징후 탐지와 다단계 인증을 강화해야 한다.
모델 공개와 지역별 접근 제한 조치가 병행될 때 악의적 재구성 시도가 집중될 수 있으니, 모델 운영자는 기능별 접근 제어와 민감 기능에 대한 별도 제한을 적용해야 한다.
공격 정황과 수치(예: 교신 횟수, 계정 수)를 문서화해 규제 기관 및 이해관계자와 공유하면 법적·정책적 대응 근거로 활용할 수 있다.

언급된 리소스

문서Mythos' release

문서Restriction from foreign markets (Fable/Mythos 관련 보도)

문서Anthropic claims Alibaba defied Trump to attack Claude and steal capabilities