mamba2
기존 트랜스포머의 어텐션 메커니즘을 대체하거나 보완하는 상태 공간 모델(SSM)의 발전된 형태이다. 긴 시퀀스 처리에서 선형적인 복잡도를 유지하여 효율적인 추론을 가능하게 한다.
NVIDIA부터 DeepSeek까지, 2025년을 화려하게 장식한 오픈 모델 총정리