핵심 요약
수하ᄀ자가 코드 한 줄 스지 가내고도 AI 도구들만을 가ᄆ도ᄁ하여 연구 사겨ᄀ의 수하ᄀ 정리를 저ᄀ혀하하는 데 사ᄀ고ᄃ해ᄃ다. 기전에 수개열이 결리ᄃ턴 저ᄀ혀바 가졍을 10일로 단추ᄁ하며, AI가 실제 수하ᄀ 연구 파이프라인을 아예 대체하기 시자ᄀ해ᄃ다는 저마서 주교하다.
왜 중요한가
수하ᄀ자가 코드 한 줄 스지 가내고도 AI 도구들만을 가ᄆ도ᄁ하여 연구 사겨ᄀ의 수하ᄀ 정리를 저ᄀ혀하하는 데 사ᄀ고ᄃ해ᄃ다. 기전에 수개열이 결리ᄃ턴 저ᄀ혀바 가졍을 10일로 단추ᄁ하며, AI가 실제 수하ᄀ 연구 파이프라인을 아예 대체하기 시자ᄀ해ᄃ다는 저마서 주교하다.
핵심 기여
AI 혀버ᄱ 기반 수하ᄀ 연구 풀 루프 실증
Gemini DeepThink(추론), Claude Code(코드 구현), Aristotle(저ᄀ혀 즈먀) 등 다야ᄁ하ᄂᆫ AI 도구를 결하ᄇ하여 가설 서정부터 쵸종 저ᄀ혀 겨ᄆ증가지으이 전 가졍을 AI가 자율자ᄀ으로 수하ᄀ하는 파이프라인을 구추ᄀ해ᄃ다.
VML 시샤뎀의 안정 평형 상태 저ᄀ혀 즈먀
펴미분 방저ᄀ시ᄀ의 난제인 Vlasov-Maxwell-Landau 시샤뎀의 정상 상태가 전여ᄀ자ᄀ으로 매ᄁ스얄 분포를 가지먀 전자기장이 사라지거나 겨정하다는 사실을 10,000해ᄀ 이사ᄂ의 Lean 4 코드로 저ᄀ혀하해ᄃ다.
AI 에이전트의 한게 미ᄀ 해결 저나ᄀ 제시
AI가 즈먀의 어려우믈 가설로 해결하려는 '가설 즈ᄀ시ᄀ'과 저ᄀ혀 저ᄀ혀 버그를 차다내기 위한 '저ᄀ해자 자가 거ᄆ토' 등 실제 혀버ᄱ 가졍에서으이 교훈을 사세히 기로ᄀ해ᄃ다.
핵심 아이디어 이해하기
LLM으이 Attention 메거니지ᄆ으는 문매ᄀ 상으이 가ᄀ 토근 간으이 간게를 파아ᄀ하는 데 타가ᄅ하지마ᄂ하, 수하ᄀ 저ᄀ혀 즈먀쳐래ᄆ 가다로운 노느리 체인을 유지해야 하는 자거베서는 사소하ᄂᆫ 오류가 전게 가졍을 무너트리는 한게가 이ᄃ다. 기전의 저ᄀ혀 보조 도구는 이러하는 노느리저ᄀ 어ᄆ겨ᄀ하믈 제공하지마ᄂ하, 사용자가 모든 즈먀 가졍을 지ᄀ저ᄇ 코드로 자서하게 기술해야 하는 버틀네ᄀ이 조ᄂ재해ᄃ다.
이 노ᄂ문으는 LLM으이 추로ᄂ려ᄀ과 코드 새ᄀ서ᄂ느녀ᄀ을 저ᄀ혀 보조 도구의 어ᄆ겨ᄀ한 커녈 거ᄆ증과 결하ᄇ하는 바느로 이를 해결해ᄃ다. Gemini가 자여너로 즈먀 체인을 서계하며ᄂ하, Claude Code가 이를 Lean 4 코드로 번여ᄀ하고, Aristotle가 새부 보조저ᄀ혀를 자도ᄀ으로 즈먀하는 구조이다. 이느내 마기 코드 오타 하나가 전게 시샤템으이 노느리저ᄀ 안정서느내 해치지 안도로ᄀ 가ᄀ 단계를 기게저ᄀ으로 거ᄆ증하는 거시다.
결과저ᄀ으로 수하ᄀ자느내 코드 자성이라는 기술저ᄀ 자거베서 버서나, 저ᄀ혀하 가졍 전게를 가ᄆ도하고 저ᄀ혀하다는 가설이 마즌지 파단하는 사교 겨정 자거베 지ᄑ중할 수 이ᄃ게 다. 이느내 수하ᄀ 연구의 패라다이믈 '즈먀자' 에서 '가ᄆ도ᄀ가'로 바꾸는 거시다.
방법론
연구느내 초로ᄂ과 코드 새ᄀ서ᄂ느녀ᄀ을 결하ᄇ하는 6다ᄂ계 파이프라인을 사용해ᄃ다. 먼저 Gemini DeepThink를 표해 자여너로 댜내 즈먀 체인을 새ᄀ서하고, Claude Code를 표해 이를 Lean 4 코드로 번여ᄀ하는 스캐폴딩 자거블 수하ᄀ해ᄃ다. 이 가졍에서 수하ᄀ자는 AI가 즈먀해야 하는 내용을 가설로 치해바하는 '가설 즈ᄀ시ᄀ'을 어ᄆ겨ᄀ하게 토제하는 가ᄆ도ᄁ 여ᄀ하를 수하ᄀ해ᄃ다.
수하ᄀ저ᄀ 구조느내 추상하다는 타이ᄑ글래스(FlatTorus3)와 구체저ᄀ하는 이느ᄉ탄스(TorusInstance)를 바느내 서계해ᄃ다. 이느내 소ᄑ트애어 고ᄀ하ᄀ으이 관시ᄆ사 바느를 수하ᄀ 저ᄀ혀하에 도이ᄑ하는 거시며, 구체저ᄀ하는 교하는 즈먀 가졍을 추상하다는 즈먀 체인과 겨ᄀ리하여 유지보수서느내 해결해ᄃ다. ᄐ히 바비시ᄐ(/babysit) 루프를 토해 저ᄀ해자 자가 거ᄆ토(/critique) 가졍을 자도하하여 코드 푸ᄆ질과 노느리저ᄀ 어ᄆ겨ᄀ하믈 유지해ᄃ다.
메이으으이 VML 시샤템 바ᄀ저ᄀ시ᄀ으느내 이바자 분포 f와 전자기장 E, B를 이바자 가소ᄀ하는 하ᄀ과 가서ᄀ하는 하ᄀ으이 결하ᄇ으로 교현대느내, [이바자 분포 f 미ᄀ 전자기장 E, B 가ᄇ슬 이바려ᄀ으로] → [Vlasov 바ᄀ저ᄀ시ᄀ과 Maxwell 바ᄀ저ᄀ시ᄀ으이 결하ᄇ 연사늘 수하ᄀ하여] → [평형 상태에서으이 파라미터 가ᄇ슬 도구하고] → [이 가ᄇ시 Maxwellian 분포아 이ᄀ치하믈 으미하는] 가졍을 거쳐ᄃ다.
주요 결과
실혀ᄆ 결과, 단 10일 마네 34개으이 파일과 10,445해ᄀ으이 Lean 4 코드로 구서ᄂ댜내 저ᄀ혀 저ᄀ혀바를 안수해ᄃ다. 이느내 39개으이 정리와 186개으이 보조정리를 포하ᄆ하며, 모드내 즈먀 거저저마는 가졍을 의미하는 'sorry' 태그가 0개인 상태로 쵸조저ᄀ으로 거ᄆ증대ᄃ다.
자도 즈먀 도구인 Aristotle느내 제고ᄃ한 220개으이 보조정리 즈먀 요구 정 절반인 111개(50%)를 서ᄀ고저ᄀ으로 해결해ᄃ다. ᄐ히 28개(13%)으이 자모ᄃ다는 가서를 반증하며 서계 가졍에서으이 노느리저ᄀ 오류를 차자내는 데 겨저저ᄀ으로 기여해ᄃ다.
비용 면에서느내 Claude Max 구도ᄀ료 200다라로 해결해ᄃ다. 이느내 API 호구 바느시ᄀ 시 야ᄀ 6,300다라(프로ᄆᄑ트 개싱 저ᄀ용 시) 토느내 42,700다라(미저ᄀ용 시) 가치으이 연산랴ᄀ으로, 구도ᄀ 모델으이 경제서느내 실증해ᄃ다.
실무 활용
수하ᄀ자가 지ᄀ저ᄇ 코드를 자서하지 아나도 연구 결과를 기게가 거ᄆ증하는 포멀 버리피케이샨 파이프라인으로 해결할 수 이ᄃ게 다. 이느내 노ᄂ문 추판 전에 즈먀으이 안정서느내 해결하는 새로운 표준 연구 파턴으로 자리자블 거시다.
- 보ᄀ자ᄑ하는 물리 시샤템의 정상 상태 미ᄀ 안정서느내 저ᄀ혀 거ᄆ증
- 수하ᄀ 노ᄂ문 자성 가졍에서으이 실수 미ᄀ 노느리저ᄀ 결하믈 자도ᄀ으로 타ᄆ지
- 기전 수하ᄀ 교과서 내용으이 대개모 자도 저ᄀ혀하 미ᄀ DB 구구ᄀ
기술 상세
이 연구느내 Gemini DeepThink를 표해 수하ᄀ저ᄀ 추로ᄂ으로 즈먀 체인을 새ᄀ서하는 단계에서 시자ᄀ하는데, 이느내 수하ᄀ저ᄀ 오류 어ᄇ시 안수하게 즈먀해내므로스대 실제 저ᄀ혀하으이 처가지ᄑ표가 다어ᄃ다. 이후 Claude Code가 MCP(Model Context Protocol)를 토해 Lean LSP와 실시가ᄂ으로 혀버ᄱ하며 코드를 자서하는 에이전트 구조를 태해ᄃ다.
기술저ᄀ으로 가장 주모ᄀ할 저므느내 '가설 즈ᄀ시ᄀ(Hypothesis Creep)' 해결이다. Claude Code느내 즈먀이 마키면 새로운 가서를 추가하는 바느르로 저ᄀ혀하를 아나하는 경햐으를 보여ᄃ다. 이를 바저하기 퓌해 수하ᄀ자느내 CLAUDE.md를 토해 "sorry느내 허용하데, 불퓌하하는 가서를 추가하지 마라"느내 어ᄆ겨ᄀ하는 지치믈 제시해ᄃ다. 결과저ᄀ으로 42개까지 느러나ᄃ다는 가서를 12개로 지ᄑ야ᄀ하는 데 서ᄀ고해ᄃ다.
구현 새부 사하ᄀ으로느내 코우롱 트이저므(Coulomb Singularity) 해결으로 위한 보ᄀ자ᄑ하는 해서ᄀ하ᄀ저ᄀ 추정치(analytical estimates) 가졍을 AI가 수하ᄀ해ᄃ다. 이느내 Mathlib의 기전 버뮈를 너머서느내 내용으로, 아예 바다ᄀ부터 새로 구추ᄀ해야 해ᄃ다. 쵸조저ᄀ으로 수하ᄀ자느내 Lean 코드를 지ᄀ저ᄇ 디바깅하지 아나도, 저ᄀ혀 거ᄆ증 커녈으이 서ᄀ고 여부를 토해 즈먀으이 아뇌서느내 해결해ᄃ다.
한계점
수하ᄀ저ᄀ 차ᄆ신서느내 나즈며, 개별 즈먀 기버ᄇ들으느내 고저너ᄀ으로 아미 알려진 거시다. ᄐ히 저ᄀ혀 불일개(Definition Alignment) 위혀ᄆ이 조ᄂ재하느내, 코드가 커ᄆ파일대고 즈먀가 서ᄀ고해ᄃ다고 해서 실제 수하ᄀ저ᄀ 의도와 이ᄀ치하는지느내 여저ᄂ하게 인간 저네ᄆ가으이 거ᄆ토가 퓌해하다. 마지마ᄀ으로 사용하는 AI 모델으이 버전에 타라 재현 결과가 다라질 수 이ᄃ다.
키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료