적시 인스턴스화
실행 시점에 필요한 파라미터나 로직에 맞춰 최적화된 기계어 코드를 즉석에서 생성하고 실행하는 방식이다. FlexAttention에서는 사용자의 Python 함수를 기반으로 최적화된 FlashAttention-4 커널을 실시간으로 생성한다.