활성화
신경망의 각 레이어에서 입력 데이터가 처리된 후 다음 레이어로 전달되는 중간 출력값이다. LLM Steering에서는 특정 레이어의 활성화 값에 Steering 벡터를 더함으로써 모델의 최종 판단을 물리적으로 편향시킨다. 어떤 레이어에서 활성화가 가장 활발하게 일어나는지 분석하는 것이 Steering의 효율성을 결정하는 핵심 요소이다.