LoRA 가중치 차분
원본 모델과 LoRA로 파인튜닝된 모델 간의 가중치 행렬 차이를 계산하는 방식이다. 이를 통해 모델의 어떤 부분이 수정되었는지 역추적하여 백도어 트리거와 관련된 파라미터 변화를 식별할 수 있다.