핵심 요약
양자 컴퓨터를 이용한 분자 에너지 계산 시 발생하는 막대한 연산 비용 문제를 해결하기 위해 고안됐다. 기존의 거대한 인공지능 모델 구조를 효율적인 수학적 함수 형태로 대체하여, 훨씬 적은 메모리와 계산량으로도 정밀한 화학적 정확도를 달성할 수 있음을 입증했다.
왜 중요한가
양자 컴퓨터를 이용한 분자 에너지 계산 시 발생하는 막대한 연산 비용 문제를 해결하기 위해 고안됐다. 기존의 거대한 인공지능 모델 구조를 효율적인 수학적 함수 형태로 대체하여, 훨씬 적은 메모리와 계산량으로도 정밀한 화학적 정확도를 달성할 수 있음을 입증했다.
핵심 기여
GQKAE 프레임워크 제안
기존의 생성형 양자 고유값 해결사(GQE)에 콜모고로프-아놀드 네트워크(KAN) 구조를 통합하여 파라미터 효율성을 극대화한 새로운 아키텍처를 설계했다.
HQKANsformer 백본 개발
Transformer의 무거운 Feed-Forward Network(FFN)를 하이브리드 양자 영감 KAN(HQKAN) 모듈로 교체하여 모델 크기를 약 66% 축소했다.
DARUAN 활성화 함수 도입
단일 큐비트 데이터 재업로드 회로를 기반으로 한 DARUAN을 사용하여 적은 파라미터로도 복잡한 비선형 매핑을 가능하게 했다.
다양한 분자 시스템 검증
H4, N2, LiH, C2H6, H2O 등 다양한 분자 시스템에서 기존 GPT 기반 모델과 대등한 정확도를 유지하면서도 연산 속도와 메모리 효율을 크게 개선했다.
핵심 아이디어 이해하기
기존의 생성형 양자 고유값 해결사는 분자의 바닥 상태를 찾기 위해 Transformer 구조를 사용한다. Transformer 내부의 Self-Attention은 토큰 간의 관계를 잘 파악하지만, 이후 이어지는 Feed-Forward Network(FFN)는 수많은 파라미터를 가진 밀집 행렬 연산을 수행하므로 분자 구조가 복잡해질수록 메모리 점유율과 연산량이 급격히 증가하는 한계가 있다.
이 논문은 FFN의 고정된 활성화 함수 대신, 학습 가능한 단변량 함수들의 조합으로 복잡한 함수를 표현하는 콜모고로프-아놀드 정리(Kolmogorov-Arnold Theorem)를 도입한다. 특히 양자 회로의 원리를 모방한 DARUAN(DatA Re-Uploading ActivatioN)을 활성화 함수로 사용하여, 아주 적은 수의 파라미터만으로도 매우 복잡한 비선형 관계를 정교하게 근사할 수 있도록 설계했다.
결과적으로 모델의 뼈대는 유지하되 내부 연산 장치를 고효율 부품으로 교체한 것과 같은 효과를 낸다. 이는 대규모 언어 모델(LLM) 기술을 양자 화학 분야에 적용할 때 발생하는 하드웨어 자원 부족 문제를 해결할 수 있는 실질적인 경로를 제시한다.
관련 Figure

모델이 회로 샘플을 생성하고, 고전 컴퓨터에서 대각화를 통해 에너지를 평가한 뒤 GRPO 손실 함수로 파라미터를 업데이트하는 전체 루프를 설명한다. 생성형 모델과 양자 화학 계산의 결합 방식을 한눈에 보여준다.
HQKANsformer 기반의 GQKAE 전체 프레임워크 개요
방법론
GQKAE는 자기회귀(Autoregressive) 방식으로 양자 회로를 구성하는 연산자 시퀀스를 생성한다. 전체 구조는 HQKANsformer라 불리는 변형된 Transformer 백본을 중심으로 하며, QSCI(Quantum-Selected Configuration Interaction) 파이프라인을 통해 생성된 회로의 품질을 평가하고 보상을 제공한다.
핵심 모듈인 HQKAN은 입력 벡터 x가 주어질 때 이를 저차원 잠재 공간 z로 투영한 후, QKAN 레이어를 통과시킨다. QKAN의 각 에지는 DARUAN 모듈로 구현되며, 이는 단일 큐비트 회로에서 데이터를 반복적으로 업로드하여 푸리에 급수 형태의 복잡한 출력을 만들어낸다. [입력값 x → 양자 게이트 회전각으로 변환 → 측정값 산출 → 비선형 출력 의미]
학습은 GRPO(Group Relative Policy Optimization) 알고리즘을 사용한다. 한 번에 여러 개의 회로 시퀀스를 샘플링하고, 각 회로가 예측한 에너지 값의 상대적 우수성을 바탕으로 정책 네트워크의 가중치를 갱신한다. [샘플링된 회로들 → QSCI 에너지 계산 → 배치 내 평균 대비 점수화 → 확률 분포 조정 의미]
관련 Figure

고전적인 인코더와 디코더 사이에 양자 영감을 받은 QKAN 레이어를 배치하여 비선형 변환을 수행하는 구조를 보여준다. 이 구조가 기존의 무거운 FFN을 대체하여 파라미터 효율성을 높이는 핵심 요소다.
HQKAN(Hybrid QKAN)의 인코더-프로세서-디코더 아키텍처 다이어그램
주요 결과
H4, N2, LiH 등 강한 상관관계가 있는 시스템에서 GQKAE는 기존 GPT 기반 GQE보다 더 낮은 최종 에너지 오차를 기록하며 우수한 수렴 성능을 보였다. 특히 LiH와 H2O 시스템에서는 초기 학습 단계에서 더 가파른 하강 곡선을 그리며 최적의 게이트 시퀀스를 빠르게 찾아냈다.
파라미터 효율성 측면에서 GQKAE는 약 1,450만 개의 파라미터만 사용하여 기존 모델(약 4,270만 개) 대비 66%의 파라미터 절감을 달성했다. 이에 따라 런타임 메모리 사용량도 162MB에서 55MB 수준으로 대폭 감소했다.
실제 연산 시간(Wall-time) 분석 결과, 테스트된 모든 분자 시스템에서 6.8%에서 16.7% 사이의 속도 향상을 확인했다. 이는 모델의 경량화가 단순히 크기를 줄이는 것에 그치지 않고 실제 추론 및 학습 가속화로 이어짐을 증명한다.
관련 Figure

복잡한 전자 구조를 가진 N2 시스템에서 GQKAE가 기존 GQE보다 더 빠르고 낮은 오차로 수렴함을 보여준다. 이는 QKAN의 비선형 표현력이 강한 상관관계 시스템에서 유리함을 입증한다.
N2 분자의 결합 길이에 따른 에너지 오차 수렴 곡선
기술 상세
GQKAE의 아키텍처는 Transformer의 표준 FFN 블록을 HQKAN(Hybrid Quantum-inspired KAN)으로 대체한 구조다. HQKAN은 인코더-QKAN 프로세서-디코더의 샌드위치 구조를 취하며, QKAN 내부의 에지 함수는 DARUAN(DatA Re-Uploading ActivatioN)으로 정의된다. DARUAN은 단일 큐비트 유니터리 연산과 측정 연산의 조합으로 비선형성을 확보한다.
수학적으로 QKAN 레이어는 입력 벡터의 각 요소에 대해 학습 가능한 단변량 함수를 적용하고 이를 합산하는 방식을 취한다. 이는 다층 퍼셉트론(MLP)이 고정된 활성화 함수와 가중치 행렬 곱에 의존하는 것과 대조적이며, 근사 이론상 더 적은 노드로도 높은 표현력을 가질 수 있게 한다.
학습 전략으로는 DeepSeek-Math에서 제안된 GRPO를 채택하여, 가치 함수(Value Function) 네트워크 없이도 그룹 내 상대적 보상을 통해 안정적인 정책 학습이 가능하도록 했다. 또한 cuQuantum 기반의 FlashQKAN을 사용하여 텐서 수축 경로를 최적화함으로써 GPU 처리량을 극대화했다.
한계점
현재 GQKAE 프레임워크에서는 회로 시퀀스의 길이(L)를 사용자가 수동으로 지정해야 한다. 분자 구조에 따라 최적의 L이 달라질 수 있으므로, 이를 자동으로 결정하는 메커니즘이 아직 부족하다.
실무 활용
고성능 컴퓨팅(HPC) 자원이 제한적인 환경에서 정밀한 양자 화학 시뮬레이션을 수행해야 하는 연구 및 산업 현장에 즉시 적용 가능하다.
- 신소재 및 약물 설계를 위한 분자 바닥 상태 에너지 정밀 추정
- 제한된 메모리의 GPU 클러스터에서 대규모 분자 시스템 시뮬레이션
- 양자-고전 하이브리드 알고리즘의 고전 측 연산 부하 최적화
코드 공개 여부: 공개
코드 저장소 보기키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.