트랜스포머 혼합 구조
하나의 공통된 신경망 뼈대(Backbone) 위에 언어 생성, 행동 생성 등 각 작업에 특화된 전문가(Expert) 모듈을 얹은 구조이다. 효율적인 멀티태스크 학습과 추론을 가능하게 한다.