Liger 커널
LLM의 핵심 연산을 융합하여 GPU 메모리 사용량을 줄이고 처리량을 높이는 Triton 기반의 최적화된 커널 구현체입니다. 표준 연산보다 메모리 효율이 뛰어나 대규모 모델 학습 시 병목을 완화합니다.