실전에서의 AI 에이전트 자율성 측정: Anthropic의 연구 보고서

핵심 요약

AI 에이전트가 실무에 도입되면서 이들의 자율성을 어떻게 관리하고 감독할 것인가가 중요한 과제로 부상했다. Anthropic은 자사 코딩 에이전트인 Claude Code와 공용 API의 수백만 건의 상호작용 데이터를 분석하여 에이전트의 실제 사용 패턴을 조사했다. 연구 결과, 숙련된 사용자일수록 에이전트에게 더 많은 자율성을 부여하며, 에이전트 스스로도 불확실한 상황에서 인간에게 질문을 던짐으로써 자율성을 조절하고 있음이 확인됐다. 현재 에이전트 활동의 절반은 소프트웨어 엔지니어링에 집중되어 있으나, 점차 금융, 의료, 보안 등 고위험 도메인으로 확장되는 추세다.

배경

LLM Agent 개념, Claude API 사용 경험, 소프트웨어 엔지니어링 워크플로우

대상 독자

AI 에이전트 도입을 검토 중인 기업 의사결정자 및 LLM 애플리케이션 개발자

의미 / 영향

AI 에이전트의 자율성은 단순한 기술적 수치가 아니라 사용자-모델-제품 간의 상호작용으로 결정된다. 향후 에이전트 확산에 따라 '모든 단계 승인'보다는 '효과적인 개입 가능성'을 보장하는 방향으로 규제와 설계가 진화할 것이다.

섹션별 상세

Claude Code의 자율 작업 지속 시간이 급격히 증가했다. 99.9 백분위수 기준, 에이전트가 중단 없이 작업하는 시간이 3개월 만에 25분 미만에서 45분 이상으로 거의 두 배 증가했다. 이는 모델의 성능 향상뿐만 아니라 사용자가 도구에 대한 신뢰를 쌓고 더 야심 찬 작업을 맡기기 시작했음을 시사한다. 특히 이러한 증가는 모델 출시 시점과 무관하게 점진적으로 발생하여 사용자의 적응이 중요한 변수임을 보여준다.

사용자 숙련도에 따라 감독 전략이 변화한다. 초보 사용자는 각 작업을 개별적으로 승인하는 방식을 선호하지만, 숙련된 사용자는 '전체 자동 승인' 비율을 20%에서 40% 이상으로 높이는 동시에 작업 중 개입(Interrupt) 빈도도 함께 높인다. 이는 모든 단계를 승인하기보다 에이전트가 작업하는 과정을 모니터링하다가 문제가 생길 때만 개입하는 효율적인 감독 방식으로의 전환을 의미한다.

에이전트 스스로 자율성을 제한하는 메커니즘이 작동한다. 작업의 복잡도가 높아질수록 Claude Code는 인간이 개입하는 횟수보다 더 자주 스스로 멈춰 질문을 던진다. 특히 가장 복잡한 작업에서는 최소 복잡도 작업 대비 질문 빈도가 2배 이상 높았으며, 이는 모델이 자신의 불확실성을 인식하고 안전 장치 역할을 수행하고 있음을 보여준다. 주요 중단 사유로는 접근 방식 선택(35%), 기술적 맥락 부족(32%), 진단 정보 수집(21%) 등이 꼽혔다.

위험과 자율성 사이의 트레이드오프 관계가 관찰된다. API 데이터 분석 결과, 대부분의 에이전트 활동은 저위험 및 가역적 작업에 집중되어 있으나, 보안 취약점 탐색이나 금융 거래와 같은 고위험-고자율성 영역에서의 실험적 사용도 포착됐다. 현재 에이전트 사용의 약 49.7%가 소프트웨어 엔지니어링 도메인에 치우쳐 있지만, 의료 및 금융 등 타 산업군으로의 확장이 시작되고 있다.

효과적인 에이전트 감독을 위한 새로운 패러다임이 필요하다. Anthropic은 단순히 모든 행동을 승인하게 하는 규제보다는, 인간이 에이전트의 상태를 실시간으로 파악하고 적시에 개입할 수 있는 모니터링 인프라 구축을 권장한다. 또한 모델이 스스로의 불확실성을 감지하고 질문하도록 학습시키는 것이 중요한 안전 속성임을 강조하며, 사후 모니터링 인프라와 새로운 인간-AI 상호작용 모델의 필요성을 제시했다.

이미지 분석

Chart
2025년 10월부터 2026년 2월까지 Claude Code가 한 번에 중단 없이 작업하는 시간이 약 25분에서 45분 이상으로 증가했음을 보여준다. 모델 업데이트(Sonnet 4.5, Opus 4.5 등) 시점과 상관없이 지속적으로 상승하는 추세가 확인된다.
Claude Code의 99.9 백분위수 작업 지속 시간 추이 그래프

Chart
사용자가 Claude Code를 더 많이 사용할수록(10회에서 1,000회로 증가) 모든 작업을 자동으로 승인하는 비율이 약 18%에서 50% 이상으로 급격히 상승함을 나타낸다. 이는 사용자와 에이전트 간의 신뢰 형성을 시각화한다.
사용자 경험(세션 수)에 따른 Claude Code 자동 승인 비율 그래프

Chart
자동 승인 비율이 높아짐에도 불구하고, 숙련된 사용자일수록 작업 도중 개입하는 비율이 5%에서 9% 이상으로 증가함을 보여준다. 이는 숙련된 사용자가 세세한 승인 대신 실시간 모니터링과 필요 시 개입 전략을 취함을 입증한다.
사용자 경험에 따른 Claude Code 개입(Interruption) 비율 그래프

Chart
작업이 복잡해질수록 인간의 개입보다 Claude가 스스로 질문을 던지는 비율이 더 가파르게 상승함을 보여준다. 고복잡도 작업에서 Claude의 질문 비율은 16.4%로 인간 개입(7.1%)의 두 배를 상회한다.
목표 복잡도에 따른 확인 질문 및 개입 비율 비교 차트

Chart
대부분의 작업이 저위험-저자율성 영역에 밀집되어 있으나, 우측 상단의 고위험-고자율성 영역(데이터 유출 시뮬레이션, 금융 거래 등)에도 일부 작업이 존재함을 시각화한다. 자율성과 위험 사이의 실질적인 상관관계를 분석한다.
위험도와 자율성 점수에 따른 작업 클러스터 분포도

Chart
현재 에이전트 활동의 49.7%가 소프트웨어 엔지니어링에 집중되어 있음을 보여준다. 그 뒤를 이어 사무 자동화(9.1%), 마케팅(4.4%) 등이 따르고 있으며, 에이전트 기술의 초기 수용처를 명확히 제시한다.
도메인별 에이전트 배포 비중 바 차트

실무 Takeaway

에이전트 도입 초기에는 단계별 승인 방식을 사용하되, 숙련도가 쌓이면 실시간 모니터링 및 개입(Interruption) 중심의 감독 체계로 전환하여 효율성을 극대화해야 한다.
복잡한 작업을 수행할 때는 에이전트가 스스로 질문을 던질 수 있도록 시스템 프롬프트나 모델 튜닝을 통해 불확실성 감지 능력을 강화하는 것이 필수적이다.
고위험 도메인에 에이전트를 배포할 때는 작업의 가역성(Reversibility)을 검토하고, 사후 모니터링 인프라를 우선적으로 구축하여 단일 오류의 파급력을 최소화해야 한다.

언급된 리소스

문서Measuring AI agent autonomy in practice