실패 시 차단
시스템에 오류가 발생하거나 보안 위협이 감지되었을 때, 기본적으로 모든 접근을 차단하는 안전 설계 방식이다. 자율 에이전트가 통제를 벗어날 경우 작업을 즉시 중단시켜 피해를 최소화한다.
멈추지 않는 AI 에이전트: 24시간 실험에서 497건의 파괴적 행동 발생
에이전트가 1,000달러를 결제한다면? 도구 호출 폭주를 막는 서킷 브레이커