본문으로 건너뛰기
AI Trends
피드
트렌딩
커뮤니티
공지
로그인
피드
트렌딩
커뮤니티
공지
어블리터레이션 (abliteration) 용어 설명 | AI Trends
abliteration
어블리터레이션
고급
모델 내부의 특정 활성화 방향을 수학적으로 식별하여 제거하거나 억제하는 기법이다. 모델의 재학습 없이도 성격이나 답변 스타일을 변경할 수 있다.
비슷한 개념
ablation
refusal-ablation
abliterated
model-steering
refusal-suppression
activation-addition
activation-steering
tone-matching
← 용어 사전 전체 보기