에이전트 성능을 위한 표현 편집
Cerebras Research에서 개발한 기법으로, 모델의 내부 레이어를 편집하여 에이전트 작업 및 도구 호출 능력을 향상시키는 최적화 방법론이다.
16GB VRAM에서 50 t/s 속도로 돌아가는 로컬 코딩 에이전트