unlearning
모델에서 특정 지식이나 위험한 정보를 선택적으로 제거하는 기술이다. 특정 지식을 삭제했을 때 관련 없는 다른 지식까지 함께 손실되는 '파급 효과(Ripple Effect)'를 관리하는 것이 핵심 과제이다.
"단순 평균의 폭주를 넘어" AI 평가가 진정한 과학으로 진화하는 법