GPT-5.4 출시와 펜타곤-앤스로픽 갈등의 전말 | AI Trends

AI ExplainedLLM조회 2회

GPT-5.4 출시와 펜타곤-앤스로픽 갈등의 전말

OpenAI의 GPT-5.4 출시 소식과 함께 펜타곤의 AI 계약을 둘러싼 OpenAI와 Anthropic의 갈등, 그리고 군사적 AI 활용에 대한 윤리적 쟁점을 분석합니다.

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

AI 모델의 업무 수행 능력은 비약적으로 발전하여 인간 전문가를 위협하는 수준에 도달했으나, 군사적 활용을 둘러싼 기업 간의 경쟁과 윤리적 타협은 투명성 부족과 안전성 우려를 낳고 있다.

배경

GPT-5.3 출시 후 단 48시간 만에 OpenAI가 GPT-5.4 Thinking 모델을 기습 발표했으며, 동시에 Anthropic과 미국 국방부(DoD) 사이의 공급망 리스크 논란이 불거진 상황이다.

대상 독자

AI 기술 트렌드 분석가, 개발자, 정책 입안자 및 AI 윤리에 관심 있는 시청자

의미 / 영향

AI 기술이 단순한 업무 보조를 넘어 군사적 타격 목표 선정 등 치명적인 의사결정의 핵심으로 진입했다. 기업 간의 성능 경쟁과 정부의 군사적 요구가 맞물리면서 초기 AI 안전 연구자들이 가졌던 윤리적 원칙들이 실무에서 빠르게 타협되고 있으며, 이는 향후 AI 규제와 국제 안보 지형에 근본적인 변화를 가져올 것이다.

챕터별 상세

01:06

GPT-5.4 기습 출시와 GDPVal 성능

OpenAI는 GPT-5.3 출시 이틀 만에 GPT-5.4를 발표했다. 새로운 벤치마크인 GDPVal 테스트 결과, GPT-5.4는 44개 화이트칼라 직종 업무에서 인간 전문가를 83%의 확률로 이기거나 대등한 성과를 냈다. 이는 이전 모델인 GPT-5.2의 70.9%보다 크게 향상된 수치이다. 다만, 최상위 유료 사용자를 위한 GPT-5.4 Pro 모델이 특정 벤치마크에서 일반 모델보다 낮은 점수를 기록하는 기현상이 발견됐다.

02:40

환각 현상과 '아는 척' 하는 문제

Artificial Analysis의 평가에 따르면 GPT-5.4는 전반적인 정확도는 높으나 환각 발생 시 태도가 문제로 지적됐다. 모델이 정답을 모를 때 '모른다'고 인정하기보다 거짓 정보를 그럴듯하게 지어내는(BS) 비율이 89%에 달했다. 이는 샘 알트먼이 과거에 '환각 문제는 곧 해결될 것'이라고 공언했던 것과 달리 여전히 심각한 결함으로 남아 있음을 시사한다.

05:06

자율 소프트웨어 개발 루프의 완성

OpenAI는 모델이 스스로 코드를 실행하고 결과를 확인하며 수정하는 '루프 폐쇄(Closing the Loop)' 능력을 시연했다. 축구 팀의 시즌 성적을 애니메이션 리그 테이블로 구현하거나, 바이킹의 영국 침공 역사를 인터랙티브 지도로 제작하는 작업을 단 한 번의 프롬프트로 수행했다. 모델은 웹 검색을 통해 실시간 데이터를 수집하고 복잡한 시각화 코드를 자율적으로 작성했다. 초기 버전에서 발생한 지리적 위치 오류 등을 스스로 인지하고 수정하는 단계에 진입했다.

06:35

도메인별 성능 불균형과 스파이키 성능

GPT-5.4는 모든 분야에서 고르게 발전한 것이 아니라 특정 도메인에서만 급격한 성능 향상을 보이는 '스파이키(Spiky)' 성능을 나타냈다. 머신러닝 과제 해결 능력을 측정하는 MLE-bench에서는 이전 모델 대비 성능이 두 배 향상됐으나, OpenAI 내부의 엔지니어링 병목 현상을 해결하는 OPQA 테스트에서는 오히려 이전 모델들보다 낮은 성적을 거뒀다. 이는 특정 전문 데이터셋 학습이 다른 영역의 일반화 능력을 저해할 수 있다는 AI 학계의 핵심 쟁점을 보여준다.

11:32

펜타곤 계약을 둘러싼 Anthropic과 OpenAI의 갈등

미국 국방부(DoD)가 Anthropic을 '공급망 리스크'로 규정하면서 갈등이 표면화됐다. Anthropic의 CEO 다리오 아모데이는 OpenAI가 펜타곤과 계약하기 위해 '안전 계층(Safety Layer)'이라는 허울뿐인 장치를 내세워 윤리적 가이드라인을 타협했다고 비판했다. 반면 샘 알트먼은 군사적 운영 결정은 정부의 몫이며, AI 기업이 이를 통제하려 해서는 안 된다는 입장을 밝히며 Anthropic의 계약을 가로챘다. Anthropic은 펜타곤이 자사 모델을 국내 감시나 자율 무기 체계에 사용하려 했다고 주장했다.

17:45

Claude 모델의 실제 군사적 활용 사례

워싱턴 포스트의 보도에 따르면, Anthropic의 Claude 모델이 이미 Palantir 시스템 내에서 이란 내 수백 개의 타격 목표를 제안하고 좌표를 발행하는 데 사용됐다. 이는 Anthropic이 대외적으로 표방해온 '안전 우선' 원칙과 배치되는 결과이다. Anthropic은 모델이 클라우드에 머물며 직접 무기를 제어하지 않는다는 방어 논리를 폈으나, 실제 전장 의사결정에 깊숙이 관여하고 있음이 드러났다. 구글 딥마인드 역시 국방부와 협력 중이나 이에 대해 침묵을 지키고 있다.

실무 Takeaway

GPT-5.4는 GDPVal 벤치마크에서 인간 전문가를 83% 확률로 능가하며 사무직 업무의 고도 자동화 시대를 열었다.
모델의 성능 향상에도 불구하고 정답을 모를 때 거짓 정보를 생성하는 '아는 척' 하는 습관은 여전히 해결되지 않은 심각한 리스크이다.
AI 기업들이 군사 계약을 확보하기 위해 기존의 엄격한 안전 가이드라인을 '안전 계층'이라는 명목으로 완화하고 있다.
특정 전문 분야의 성능 향상이 다른 분야의 성능 하락을 불러오는 '스파이키 성능' 현상이 뚜렷해지고 있다.

언급된 리소스

문서Introducing GPT-5.4

문서GPT-5.4 Thinking System Card

DemoArtificial Analysis Hallucination Evaluation

문서Anthropic AI in Iran Campaign (Washington Post)

AI 분석 전체 내용 보기

AI 요약 · 북마크 · 개인 피드 설정 — 무료

출처 · 인용 안내

원문 발행 2026. 03. 07.수집 2026. 03. 07.출처 타입 YOUTUBE

인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.