활성화 조작
모델 추론 과정에서 뉴런의 활성화 값을 직접 수정하여 출력에 영향을 주는 기법. Steering의 핵심 원리로, 특정 개념에 대응하는 활성화 패턴을 찾아 이를 증폭하거나 억제한다.