트리톤 어텐션
OpenAI의 Triton 프로그래밍 언어로 작성된 어텐션 구현체이다. FlashAttention이 특정 하드웨어나 아키텍처를 아직 지원하지 않을 때 유연한 대안으로 사용되며 하드웨어 가속을 활용한다.