학습된 가중치
Trained Weights는 모델의 파라미터 집합으로, 학습 데이터·라벨링·보상 신호에 의해 형성된 확률 분포를 내재화한다. 입력 토큰이 들어오면 가중치가 활성화 패턴을 만들어 다음 토큰 분포를 출력하고, 이 분포가 모델의 '신념'과 응답 경향을 결정한다. 본문은 가중치 수준의 편향이 논리적 반박으로는 바뀌지 않는 핵심 원인으로 제시된다.