본문으로 건너뛰기

benign-over-refusal

선의의 과잉 거절

중급

모델이 지나치게 보수적으로 학습되어 해롭지 않은 정상적인 요청조차 안전상의 이유로 거절하는 현상이다. 사용자 경험을 저해하는 주요 요인 중 하나다.