커널 레벨 튜닝
GPU 연산의 가장 밑단인 커널 수준에서 코드를 최적화하는 작업입니다. 추론 속도를 극대화하기 위해 메모리 접근과 연산 순서를 직접 제어하며, 프론티어 AI 연구소에서 요구하는 핵심 기술 역량입니다.