회로 속성 차이 (Circuit Attribution Divergence (CAD)) 용어 설명 | AI Trends
Circuit Attribution Divergence (CAD)
회로 속성 차이
중급
원래의 forget 회로에 대한 EAP-IG attribution 맵을 unlearned 모델 θ′에서 재실행하여 두 맵 간 상대적 차이를 측정하는 계측. CAD가 높으면 회로가 붕괴되었음을 나타내고, CAD가 0에 가까우면 인퍼런스-타임 리다이렉션과 같이 회로가 유지되었음을 시사한다.