persona-space
모델이 취할 수 있는 다양한 캐릭터 아키타입들의 신경 활성화 패턴을 다차원 벡터 공간에 매핑한 것이다. 각 캐릭터는 고유한 좌표를 가지며 이를 통해 모델 내부의 성격 구조를 분석할 수 있다.
AI가 갑자기 돌변하는 이유? Anthropic이 발견한 '어시스턴트 축'의 비밀