플래시 어텐션 4
최신 GPU 아키텍처인 Hopper 및 Blackwell에 최적화된 고성능 어텐션 알고리즘이다. 메모리 접근을 최소화하고 연산 유닛의 활용도를 극대화하여 대규모 언어 모델의 학습 및 추론 속도를 획기적으로 높인다.