8비트 부동소수점 학습
기존 16비트나 32비트 대신 8비트 정밀도를 사용하여 학습 속도를 높이고 메모리 사용량을 줄이는 기법이다. 대규모 모델 학습 시 하드웨어 효율을 극대화하는 최신 최적화 기술이다.
코딩 에이전트의 새로운 표준 '컨텍스트 그래프'와 3B로 80B 성능 내는 Qwen3 공개