Holder 평균
토큰별 로그-확률 비율 ri,t(θ)의 가중치를 p에 따라 평균( Hölder mean )으로 조합하는 확장된 집합 연산. p를 통해 토큰 간 기여 분포를 제어하고, 학습 시그널의 집중도와 분산을 조절한다.