lp-노름
벡터의 크기를 측정하는 일반화된 방법으로, 각 요소의 절댓값에 p승을 하여 합산한 후 1/p승을 취한 값이다. p의 값에 따라 원형, 사각형 등 다양한 기하학적 형태를 정의하며 최적화 문제에서 규제 방식으로 자주 활용된다.
어텐션 메커니즘의 비밀: 미러 디센트로 토큰 선택 성능 극대화