벡터 스티어링
LLM의 내부 활성화 벡터를 특정 방향으로 조정하여 모델의 출력 성향이나 행동을 인위적으로 제어하는 기법이다. 모델의 가중치를 직접 수정하지 않고도 특정 개념(예: 감정, 주제)을 강화하거나 약화시킬 수 있어 모델 해석 및 제어 연구에서 중요하다.