RedDragon: 불완전한 코드 실행을 위한 LLM 기반 인프라 및 가상 머신

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

RedDragon은 레거시 코드나 의존성이 누락된 불완전한 소스 코드를 분석하고 실행하기 위한 실험적 인프라이다. 15개 언어를 지원하는 Tree-sitter 프론트엔드와 LLM 기반 보정 기능을 결합하여 모든 코드를 31개의 연산코드로 구성된 범용 중간 표현(IR)으로 변환한다. 변환된 코드는 결정론적 VM에서 실행되며, 누락된 외부 호출이나 의존성은 LLM 오라클이 추론하여 실행 흐름을 유지한다. 이를 통해 정적 분석과 동적 실행의 경계를 허물고 다국어 코드에 대한 깊이 있는 통찰을 제공한다.

배경

Python 3.10+, Poetry, Tree-sitter 기초 지식, LLM API 키 (선택 사항)

대상 독자

정적 분석 도구 개발자 및 LLM 기반 코드 에이전트 연구자

의미 / 영향

LLM을 컴파일러 프론트엔드와 런타임 오라클로 활용함으로써 불완전한 코드의 분석 가능성을 획기적으로 높였다. 이는 향후 자율형 코딩 에이전트가 복잡한 레거시 시스템을 이해하고 수정하는 데 핵심적인 기술이 될 것이다.

섹션별 상세

RedDragon은 15개 언어에 대해 Tree-sitter 기반의 결정론적 프론트엔드를 제공하며, 구문 오류 발생 시 LLM이 파손된 조각만 수정하여 재파싱하는 보정 루프를 지원한다.

python

def factorial(n):
    if n < 2:
        return 1
    return n * factorial(n - 1)

RedDragon이 분석 및 실행할 수 있는 표준 Python 팩토리얼 함수 예시

bash

poetry run python interpreter.py myfile.py -f llm -v

LLM 프론트엔드 모드를 활성화하여 상세 로그와 함께 파일을 실행하는 CLI 명령어

모든 소스 코드는 31개의 연산코드를 가진 3-주소 코드(Three-address code) 형태의 범용 IR로 평탄화되어 저장되며, 소스 위치 추적 기능을 통해 원본 코드와의 연결성을 유지한다.

VM은 상속, 메서드 오버로딩, 속성 접근자 등 고도화된 객체 지향 기능을 실행하며, 미해결된 외부 호출을 만날 경우 LLM 오라클이 그럴듯한 상태 변화를 생성하여 실행 중단을 방지한다.

python

from interpreter import lower_source, run

source = """
def add(a, b):
    return a + b
"""

ir = lower_source(source, lang="python")
result = run(ir, inputs={"a": 10, "b": 5})

RedDragon의 프로그래밍 방식 API를 사용하여 소스를 IR로 변환하고 실행하는 예시

타입 시스템은 프론트엔드 추출, 정적 추론, 런타임 강제 변환의 3단계로 구성되며, 고정점 알고리즘을 사용하여 제네릭과 인터페이스 계층을 포함한 복잡한 타입 전파를 수행한다.

Rev-Eng TUI와 시각화 도구를 통해 소스 코드, AST, IR, CFG, VM 상태를 실시간으로 동기화하여 확인하며 단계별 실행 재현 및 데이터 흐름 분석 결과를 추적할 수 있다.

실무 Takeaway

의존성이 누락된 레거시 코드를 분석할 때 LLM 보정 프론트엔드를 활성화하여 구문 오류를 자동 수정하고 분석 가능한 IR을 생성한다.
다국어 프로젝트에서 공통 IR과 데이터 흐름 분석 기능을 활용하여 언어에 무관한 보안 취약점 및 로직 분석 파이프라인을 구축한다.
실행 중 중단되는 외부 호출 구간에 LLM 오라클을 배치하여 전체 프로그램의 실행 경로를 시뮬레이션하고 잠재적 오류를 조기에 발견한다.

언급된 리소스

GitHubRedDragon GitHub Repository

문서VM Design Document

문서Type System Design Document