kan
기존 신경망의 다층 퍼셉트론(MLP) 구조를 대체하기 위해 제안된 모델이다. 노드가 아닌 엣지에 학습 가능한 활성화 함수를 배치하여 파라미터 효율성과 해석 가능성을 높였다.
7B 모델에서 트랜스포머를 이겼다? 차세대 AI 아키텍처의 스케일링 가능성