어블리터레이션(abliteration)이란 무엇인가요?

Question

Accepted Answer

모델 내부의 특정 활성화 방향을 수학적으로 식별하여 제거하거나 억제하는 기법이다. 모델의 재학습 없이도 성격이나 답변 스타일을 변경할 수 있다.

abliteration