포워드 훅
추론 중 특정 Transformer 레이어의 forward 경로에 후킹 함수를 등록해 그 레이어의 hidden state를 읽거나 수정하는 기법이다. 본문에서는 PyTorch 전방 훅과 C++ 커널 연동으로 각 레이어에서 katkı를 계산하고 선택적으로 쓰는 방식으로 구현되었다.