플렉스 어텐션
사용자가 CUDA 코드 작성 없이 파이썬으로 커스텀 어텐션 변형을 구현할 수 있게 해주는 PyTorch API이다. 점수 수정(score_mod)과 마스크 수정(mask_mod) 함수를 통해 ALiBi나 슬라이딩 윈도우 같은 복잡한 패턴을 효율적으로 처리한다.