시드셋
AI 시스템의 윤리적 정렬을 테스트하기 위해 MIT에서 개발한 자동화 프레임워크이다. 정량적 성능 지표와 주관적 윤리 가치를 계층적으로 분리하여 평가하며, LLM을 활용해 인간의 선호도를 대리 측정함으로써 효율적인 시나리오 검증을 가능하게 한다.