생성형 AI를 이용한 교통안전 데이터 접근성 확대: 공간적 자연어 질의를 위한 스키마 기반 프레임워크

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

NL 인터페이스와 GIS 기반 운송안전 데이터의 신뢰 가능하고 재현 가능한 상호작용이 필요하다. 제안된 스키마-기반 실행과 규칙 기반 검증 레이어는 해석 단계와 실행 단계 사이의 경계를 명확히 하여 재현성 및 감사추적성을 보장하고 공공부문 AI 거버넌스를 강화한다. 또한 현장의 학교·시의회·주민 단체 등 다양한 이해관계자들이 비전문적으로도 안전 데이터를 활용할 수 있도록 한다.

왜 중요한가

핵심 기여

Semantic-frame 기반 NL 질의 처리

자연어 질의를 분석해 의도와 typed slots를 포함하는 semantic frame으로 표현하고, 이를 실행 엔진으로 넘겨 실행 가능하게 만든다.

Validation and Repair Layer를 통한 스키마 준수 확보

스키마 registry와 매핑 규칙을 통해 엔티티/필드/관계의 정합성을 검사하고, 값의 정규화 및 앵커 해상도를 수행하여 실행 준비를 마친다.

Typed DAG 실행 엔진으로의 컴파일

검증된 시맨틱 프레임을 typed DAG 형태의 분석 연산 그래프로 컴파일하고 PostGIS 데이터베이스에서 실행한다.

결과의 재현성과 감사가능성 확보

언어모델 의존을 배제한 결정론적 실행으로 동일 입력과 데이터 상태에서 항상 동일 출력이 나오며, 실행 그래프와 프레임이 인스펙터블 로그로 남는다.

Massachusetts 데이터셋을 활용한 실험

80개의 NL 질의를 9개 그룹으로 구성해 평가했고, 29%의 queries에서 검증 레이어의 수정이 필요했으며, 평균 실행시간은 18.6초이고 최대 178.8초까지 소요되었다.

핵심 아이디어 이해하기

단계 1: 언어 모델은 NL 질의를 해석해 의도와 슬롯으로 구성된 초기의 비정형 시맨틱 프레임을 생성한다. 단계 2: Validation & Repair Layer가 프레임을 스키마에 맞춰 정규화하고 지리적 앵커를 확인한다. 단계 3: 정제된 프레임은 Typed DAG로 컴파일되어 PostGIS 데이터베이스에 결정론적으로 실행된다. 단계 4: 실행 결과는 맵/표로 산출되며, 모든 처리는 재현 가능하고 감사 가능하다. 이 구조는 NL 해석의 유연성과 실행의 엄밀성 사이에 경계를 두어 공공 부문에서의 신뢰성과 거버넌스를 뒷받침한다. 초기 아이디어의 출발점은 일반 NL 질의가 GIS 스키마의 요구사항을 충족하지 못하는 문제이며, 이 문제를 프레임-기반 해석과 규칙 기반 보정으로 해결한다. 기존의 비구조적 코드 생성/에이전트 실행 방식과 달리, 해석과 실행을 분리하여 공개된 데이터 스키마와 일치하는 실행 경로를 보장한다. 결과적으로 현장 적용에서의 재현성과 비교 가능성이 크게 향상되며, 지역 사회·지자체의 데이터 활용 장벽을 낮춘다.

방법론

전체 접근 방식: NL 쿼리를 semantic frame으로 해석하고, Validation & Repair Layer를 거쳐 실행 가능한 그래프로 컴파일한 뒤 PostGIS에서 실행한다. 2) 핵심 메커니즘: six 엔티티 타입(Crash, Road, School, BusStop, Crosswalk, Town)과 각 엔티티의 필드를 정의하고, spatial_constraints, attribute_constraints, ranking으로 구성된 시맨틱 프레임 포맷을 사용한다. 3) 수학적/알고리즘적 기반: 프레임은 그래프 의존성으로 표현되며, 그래프 컴파일러는 데이터 의존성과 DAG의 비순환성을 검사한다. 4) 구현 세부사항: NL 해석은 Gemini 2.5 Flash 및 GPT-4o를 선택적으로 사용하며, 지리 Anchors는 geocoding/lookup으로 해결한다. 5) 학습/실험적 설정: Massachusetts 주 교통안전 데이터베이스를 기반으로 80개의 질의를 평가했고, 질의군(G1–G9)으로 구성하여 생산성을 측정했다. 6) 비교/차별점: NL 해석을 독립된 레이어로 두고, 실행은 스키마에 맞춰 결정론적으로 수행하여 재현성과 감사 가능성을 확보한다.

주요 결과

주요 벤치마크는 80개 NL 질의에서 모든 질의가 실행에 성공했고, 검증 프레임이 ground-truth와 일치했다. 9개 그룹의 평균 실행 시간은 18.6초였고, 최대 실행 시간은 178.8초(G7)였다. 검증 및 보정으로 23건(80건 중 29%)의 프레임이 수정되었으며, 그중 22건은 값 정규화(예: pedestrian↔Collision with pedestrian, 1km↔1000 m)로 인한 수정이었다. 추론 시간은 LLM 해석에 2–3초가 소요되며, 데이터베이스 연산이 나머지 시간을 차지한다. 그룹별 평균 시간은 G1 2.6초, G2 14.7초, G3 11.4초, G4 12.1초, G5 12.7초, G6 10.8초, G7 61.7초, G8 40.0초, G9 9.3초이다.

기술 상세

시스템 아키텍처: NL 해석기(LLM) → semantic frame 생성 → Validation & Repair Layer → Typed DAG 컴파일 → PostGIS 질의 실행 → 맵/표/리포트 생성. 2) 수학/알고리즘: 프레임 구성 요소(targets, references, spatial_constraints, attribute_constraints, ranking)로 질의를 표현하고, 그래프 간선은 데이터 의존성을 나타낸다. 3) Prior work 대비 차별점: 실행에 앞서 엄격한 스키마 규격 검증과 정규화를 통해 비결정론적 Non-deterministic 출력을 차단하고, 실행 경로를 완전히 재현 가능하게 만든다. 4) 구현 및 세부사항: six 엔티티 타입과 기본 필드를 PostGIS 스키마에 매핑하고, 앵커 해상도 및 위치-공간 관계를 규칙 기반으로 보정한다. 5) 한계 및 거버넌스: 프레임 기반 실행은 재현성과 감사 가능성을 확보하지만, 질의의 모호성은 여전히 프롬프트 설계와 데이터 품질에 따라 달라진다. 6) 데이터/실험: 매사추세츠 주 안전 데이터베이스를 활용하며 crashes, roads, schools, busStops, crosswalks, towns의 6개 엔티티 타입을 다룬다.

한계점

NL 표현의 모호성으로 인한 의도 오해 가능성; 데이터 품질 및 스키마 격차에 따른 한계; 실행 로그의 해석과 기관별 관행에 따른 의사결정 차이

실무 활용

지역사회 구성원과 공공기관이 GIS 지식 없이도 교통안전 데이터를 탐색·분석할 수 있도록 NL 인터페이스를 제공한다.

Localized safety diagnosis: 학교/정류장 주변의 보행자 충돌 위험 분석
Comparative screening: 도시 간 비교를 통한 HSIP/대체 프로그램 우선순위 선정
corridor prioritization: 특정 구간의 안전 개선 우선순위 도출
정책 자료 준비: 자금 신청 및 커뮤니티 캠페인을 위한 근거 자료 작성

코드 공개 여부: 공개

코드 저장소 보기

키워드

LLM (대형 언어 모델)natural language interface (자연어 인터페이스)PostGISsemantic framesschema-groundeddeterministic executiontransportation safety

용어 해설

Semantic Frame: — 자연어 질의를 실행 가능한 분석 프레이밍으로 해석하기 위해 구성된 구조화된 표현으로, 대상 엔티티, 공간 관계, 속성 제약, 랭킹 등을 포함하는 프레임이다.
Validation and Repair Layer: — LLM이 생성한 시맨틱 프레임을 스키마 규격에 맞추어 검증하고 정규화하는 규칙 기반 처리 계층으로, 앵커 해상도와 구조 수정도 수행한다.
Typed Directed Acyclic Graph: — 질문의 실행 흐름을 노드(데이터 로딩, 필터링, 매칭, 랭킹 등)와 간선(데이터 의존성)으로 표현한 결정론적 실행 그래프이다.
Schema-grounded Execution: — 언어 해석을 실행 가능 데이터 흐름으로 제한하고, 규칙 기반 검증으로 스키마 일치를 보장하는 실행 원리이다.