안전 분지
LLM의 가중치에 무작위 섭동을 가했을 때 특정 임계값까지는 안전 가드레일이 유지되다가 이를 넘어서면 급격히 안전성이 붕괴되는 현상이다. 모델의 파라미터 공간 내에서 안전성이 유지되는 영역을 시각화하여 파인튜닝 시의 위험도를 측정하는 데 사용된다.