연산량 절감
모델이 추론을 수행할 때 필요한 부동 소수점 연산(FLOPs) 횟수를 줄이는 것을 의미한다. HydraLM은 긴 문맥 상황에서 약 99.8%의 연산량을 절감하여 효율성을 극대화했다.