어블리터레이션
모델 내부의 특정 활성화 방향을 수학적으로 식별하여 제거하거나 억제하는 기법이다. 모델의 재학습 없이도 성격이나 답변 스타일을 변경할 수 있다.
OpenAI의 철저한 검열도 뚫렸다 새로운 ARA 기법의 충격적 성능
8GB 그래픽카드로 35B 모델을? RTX 3060 Ti의 놀라운 MoE 구동 성능
모델의 거부 본능을 정밀 제거하는 OBLITERATUS 오픈소스 공개
거부율 3% 달성, 모델 지능은 그대로? 혁신적 정렬 해제 기술