8비트 부동 소수점 정밀도
데이터를 8비트로 표현하여 메모리 사용량을 줄이고 연산 속도를 높이는 수치 표현 방식이다. FlashAttention-3부터 본격적으로 도입되어 최신 하드웨어에서의 성능을 최적화한다.