MLP 뉴런
Transformer 아키텍처의 Feed-Forward Network(FFN) 계층 내부에 존재하는 개별 연산 단위이다. 특정 입력 패턴을 감지하는 벡터(Key)와 그에 대응하는 출력 벡터(Value)의 쌍으로 작동하며, 모델 내에서 지식을 저장하고 인출하는 메모리 역할을 수행한다.