기능적 웰빙
AI 모델이 특정 입력이나 작업에 대해 보이는 선호도나 거부 반응을 측정 가능한 행동 지표로 정의한 개념입니다. 의식 유무와 상관없이 모델이 긍정적 또는 부정적 상태를 나타내는 기능적 신호를 분석하여 정렬 연구에 활용합니다.