행렬 곱셈
두 텐서 간의 행렬 곱셈을 수행하는 연산으로 신경망의 선형 레이어와 어텐션 메커니즘의 물리적 구현을 담당한다. 단순한 요소별 곱셈과 달리 행과 열의 조합을 통해 새로운 특징 공간으로 데이터를 투영하는 역할을 한다. 대규모 모델에서 가장 연산 집약적인 부분 중 하나로 효율적인 구현이 필수적이다.