dot-product
두 벡터의 성분별 곱의 합을 구하는 연산이며, 확률 분포와 가치 벡터를 곱해 기대값을 구하는 과정을 단순화한다. 강화학습 수식을 행렬 연산으로 변환할 때 핵심적인 역할을 한다.
"Q, K는 알겠는데 V는 왜 필요한가요?" 어텐션의 본질을 묻다
복잡한 시그마 기호 대신 벡터 내적으로 이해하는 벨만 방정식
복잡한 벨만 방정식을 4개의 벡터 내적으로 단순화하기