Anthropic, 보안 취약점 자동 공격 위험으로 신규 AI 모델 공개 보류

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

Anthropic은 자율적으로 소프트웨어 취약점을 발견하고 공격할 수 있는 신규 모델 Claude Mythos Preview의 공개를 중단했다. 해당 모델은 수백만 번의 자동 테스트에서도 발견되지 않았던 OpenBSD와 FFmpeg의 오래된 보안 결함을 찾아내는 능력을 보였다. 이에 대응하여 Anthropic은 주요 빅테크 기업들과 함께 Project Glasswing을 출범하고 방어자들을 위한 지원금을 투입하기로 결정했다. 한편, 구글의 AI Overviews는 10%에 달하는 오답률을 기록하며 생성형 AI의 신뢰성 문제가 여전히 심각함을 드러냈다.

배경

생성형 AI의 기본 작동 원리, 소프트웨어 보안 취약점 및 제로데이 개념, 사이버 범죄의 일반적인 유형

대상 독자

사이버 보안 전문가, AI 정책 입안자, IT 인프라 관리자 및 일반 기술 관심층

의미 / 영향

AI가 인간이나 기존 도구가 발견하지 못한 보안 결함을 자율적으로 찾아내는 단계에 진입하면서, AI 개발사의 안전 가이드라인 준수가 더욱 중요해졌습니다. 이는 AI가 공격과 방어 양면에서 게임 체인저가 될 것임을 예고하며, 기술 기업 간의 보안 협력(Project Glasswing)이 필수적인 생존 전략이 될 것임을 시사합니다.

섹션별 상세

Anthropic은 운영체제와 브라우저의 심각한 취약점을 자율적으로 찾아내 악용할 수 있는 Claude Mythos Preview 모델을 공개하지 않기로 결정했다. 이 모델은 기존 자동화 도구가 500만 번의 실행 동안 놓쳤던 OpenBSD의 27년 된 결함과 FFmpeg의 16년 된 버그를 포함해 수천 개의 제로데이 취약점을 발견했다. Anthropic은 공격자가 유사한 도구를 개발하기 전에 방어 체계를 강화하기 위해 Apple, Google 등과 Project Glasswing을 시작했다. 이는 고성능 AI가 사이버 보안 생태계에 미칠 수 있는 실존적 위협을 선제적으로 차단하려는 조치이다.

FBI의 2025년 보고서에 따르면 미국 내 사이버 범죄 피해액이 전년 대비 26% 증가한 210억 달러로 역대 최고치를 기록했다. 특히 AI를 악용한 음성 복제, 딥페이크 영상, 위조 문서 사기가 처음으로 통계에 포함되어 약 8억 9,300만 달러의 손실을 입혔다. 60세 이상의 고령층이 77억 달러의 피해를 입으며 가장 큰 타격을 받았고, 암호화폐 관련 범죄는 110억 달러 이상의 손실을 기록했다. 이는 AI 기술의 발전이 범죄의 정교함과 규모를 급격히 확장시키고 있음을 시사한다.

뉴욕타임즈는 문체 분석을 근거로 영국 암호학자 아담 백(Adam Back)이 비트코인 창시자인 사토시 나카모토일 가능성이 높다는 조사 결과를 발표했다. 분석 결과 아담 백 특유의 'proof-of-work' 하이픈 표기법과 러시아 통화 WebMoney 언급 등이 사토시의 이메일 패턴과 일치하는 것으로 나타났다. 하지만 아담 백 본인은 이를 강력히 부인하고 있으며, 암호화폐 커뮤니티 역시 문체 분석만으로는 확정적 증거가 될 수 없다는 회의적인 반응을 보이고 있다. 이는 비트코인 기원에 대한 논쟁이 기술적 분석을 넘어 인문학적 분석 영역으로 확장되고 있음을 보여준다.

구글의 AI Overviews 기능이 약 10%의 확률로 잘못된 정보를 제공하고 있다는 분석 결과가 뉴욕타임즈를 통해 공개됐다. Oumi와 SimpleQA 평가 도구를 사용한 조사에서 Gemini 3 업데이트 이후 정확도가 85%에서 91%로 향상되었으나, 여전히 수천만 건의 오답이 매일 생성되고 있다. 구글 검색의 거대한 규모를 고려할 때 9%의 오류율은 분당 수십만 건의 거짓 정보가 유포되는 결과를 초래한다. 이는 검색 엔진에 통합된 생성형 AI가 정보의 정확성 측면에서 아직 신뢰할 수 있는 수준에 도달하지 못했음을 입증한다.

실무 Takeaway

AI 모델이 자율적으로 제로데이 취약점을 발견할 수 있는 수준에 도달함에 따라, 기업은 AI 기반 보안 진단 도구를 선제적으로 도입하여 방어 체계를 구축해야 한다.
AI를 활용한 보이스 피싱 및 딥페이크 사기가 급증하고 있으므로, 조직 내 보안 교육에 AI 기반 사회공학적 공격 대응 시나리오를 반드시 포함해야 한다.
구글 AI Overviews의 오답률이 10%에 달하므로, 중요한 의사결정에 AI 생성 답변을 사용할 때는 반드시 원천 소스를 교차 검증하는 프로세스가 필요하다.

언급된 리소스

문서10 Ways Teams Move Faster with Slackbot

논문GLM-5.1: Towards Long-Horizon Tasks