kolmogorov-arnold-superposition-theorem
모든 다변수 연속 함수를 단변수 함수들의 덧셈과 합성으로 표현할 수 있다는 수학적 정리이다. 신경망이 복잡한 다변수 함수를 근사할 수 있는 이론적 근거 중 하나로 활용된다.
트랜스포머가 고차원 데이터에서도 효율적인 이유, 수학적으로 증명됐다