역량 임계치
AI 모델이 특정 위험 수준의 능력을 갖추었는지를 판단하기 위해 설정한 성능의 경계선이다. Anthropic과 같은 기업은 모델이 이 임계치를 넘어서는 위험한 능력을 보일 경우 공개를 제한하거나 추가적인 안전 장치를 마련한다.