위협 모델
시스템에 발생할 수 있는 잠재적 공격이나 위험 요소를 정의하고 식별하는 프레임워크이다. AI 안전에서는 특정 아키텍처가 초래할 수 있는 파멸적 시나리오를 구체화하는 데 쓰인다.