본문으로 건너뛰기

피드 트렌딩 콜로세움

피드 트렌딩 콜로세움

AI Trends

매일 300개 이상의 글로벌 소스에서 AI/ML 뉴스를 수집하고 한국어로 요약합니다.

AI 트렌딩 기술 태그 커뮤니티 개인정보 처리방침

활성화 캡핑 (activation-capping) | AI Trends 용어 사전 | AI Trends

활성화 캡핑

activation-capping

중급

특정 신경 활성화 값이 미리 정해진 안전 범위를 넘지 않도록 제한하는 기법이다. 모델이 어시스턴트 축에서 너무 멀어지는 것을 물리적으로 차단하여 비정상적인 행동을 방지한다.

특정 신경 활성화 값이 미리 정해진 안전 범위를 넘지 않도록 제한하는 기법이다. 모델이 어시스턴트 축에서 너무 멀어지는 것을 물리적으로 차단하여 비정상적인 행동을 방지한다.

관련 아티클 1건

AI가 갑자기 돌변하는 이유? Anthropic이 발견한 '어시스턴트 축'의 비밀

← 용어 사전 전체 보기