위험 평가
AI 모델이 사이버 범죄, 생화학 위협 등 사회적 위험을 초래할 가능성을 사전에 테스트하고 측정하는 과정이다. 영국의 AI 안전 연구소(AISI)는 Anthropic의 최신 모델인 Claude Mythos Preview에 대한 위험 평가 결과를 발표했다.