mamba
상태 공간 모델(SSM)을 기반으로 한 새로운 신경망 구조로, 시퀀스 길이에 따라 연산량이 선형적으로 증가하여 기존 Transformer의 제곱 비례 문제를 해결한 기술이다.
NVIDIA의 새로운 3B 추론 모델, Together AI에서 에이전트 성능 극대화