피드포워드 네트워크
어텐션 계층 이후에 위치하여 각 토큰의 표현을 독립적으로 처리하는 신경망 계층이다. 모델이 학습 과정에서 습득한 사실적 지식을 저장하고 인출하는 저장소 역할을 하며, fc1(gate_up_proj)과 fc2(gate_down_proj) 같은 완전 연결 계층으로 구성된다.