Langfuse를 활용한 자가 개선형 AI 고객 지원 에이전트 구축 가이드

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

핵심 요약

단순한 LLM 프로토타입을 넘어 실제 운영 환경에서 발생하는 환각, 지연 시간, 불분명한 답변 문제를 해결하기 위해 관측성 도구인 Langfuse를 도입한다. 'FuseCommerce'라는 가상의 기술 소매점 지원 에이전트를 구축하며, 의도 분류와 시맨틱 검색을 결합한 에이전트 워크플로우를 구현한다. Langfuse의 트레이싱 기능을 통해 에이전트의 사고 과정을 시각화하고, 사용자 피드백 루프를 구축하여 시스템을 지속적으로 개선하는 구조를 갖춘다. 최종적으로 대시보드를 통해 비용, 지연 시간, 정확도를 모니터링하는 방법을 익힌다.

배경

Python 3.10 이상, Langfuse Cloud 계정, Google Cloud Gemini API 액세스 권한

대상 독자

LLM 애플리케이션을 프로덕션 환경에 배포하고 성능을 모니터링하려는 개발자 및 AI 엔지니어

의미 / 영향

LLM의 블랙박스 특성을 해결하기 위해 관측성 도구가 필수적임을 시사하며, 특히 복잡한 에이전트 구조에서 각 단계별 추적이 성능 최적화와 사용자 신뢰 확보의 핵심임을 보여준다.

섹션별 상세

Langfuse는 LLM 애플리케이션의 디버깅, 분석 및 개발을 지원하는 오픈소스 플랫폼으로, 실행 경로를 추적하는 Tracing, 실시간 지연 시간과 비용을 모니터링하는 Metrics, 사용자 피드백을 수집하는 Evaluation 기능을 제공한다.

Langfuse의 주요 기능인 Tracing, Metrics, Evaluation, Dataset Management를 설명하는 다이어그램이다. — DiagramLangfuse가 LLM 애플리케이션 개발 주기에서 어떤 역할을 하는지 보여준다. 디버깅을 위한 트레이스부터 비용 모니터링, 사용자 피드백 수집, 로컬 테스트용 데이터셋 관리까지의 흐름을 시각화하고 있다.

FuseCommerce 에이전트는 사용자의 질문 의도를 분석하는 인지적 라우팅과 벡터 임베딩을 활용해 개념적 연관성을 파악하는 시맨틱 메모리를 핵심 구성 요소로 설계됐다.

python

def semantic_search(query):
    # Create a vector representation of the query
    query_embedding = genai.embed_content(
        model="models/text-embedding-004",
        content=query
    )["embedding"]

    # Using math, find the nearest meanings to the query
    similarities = cosine_similarity([query_embedding], product_vectors)
    return get_top_matches(similarities)

Google Gemini의 임베딩 모델과 코사인 유사도를 활용하여 시맨틱 검색을 구현하는 예시

시맨틱 검색 엔진은 Google Gemini의 text-embedding-004 모델을 사용하여 제품 정보를 벡터화하고, 코사인 유사도 계산을 통해 키워드가 일치하지 않아도 의미적으로 유사한 제품을 찾아낸다.

python

@langfuse.observe(as_type="generation")
def classify_user_intent(user_input):
    prompt = f"""
    Use the following user input to classify the user's intent into one of the three categories:
    1. PRODUCT_SEARCH
    2. ORDER_STATUS
    3. GENERAL_CHAT
    Input: {user_input}
    """
    # Call Gemini model here...
    intent = "PRODUCT_SEARCH" # Placeholder
    return intent

Langfuse 데코레이터를 사용하여 LLM의 의도 분류 과정을 자동으로 트레이싱하는 예시

@langfuse.observe 데코레이터를 사용하여 의도 분류 및 검색 과정을 자동으로 캡처하며, update_current_trace 메서드로 세션 ID와 같은 메타데이터를 태깅하여 사용자별 대화 맥락을 유지한다.

python

@langfuse.observe() # Root Trace
def handle_customer_user_input(user_input, session_id):
    # Tag the session
    langfuse.update_current_trace(session_id=session_id)
    # Think
    intent = get_classified_intent(user_input)
    # Act based on classified intent
    if intent == "PRODUCT_SEARCH":
        context = use_semantic_search(user_input)
    # ... (중략)
    response = generate_ai_response(context, intent)
    return response

전체 에이전트 워크플로우를 루트 트레이스로 설정하고 세션 ID를 태깅하는 예시

에이전트가 사용자의 질문을 받고 의도를 분류하는 과정을 보여주는 실행 화면이다. — Screenshot사용자가 게임 시스템 액세서리에 대해 질문했을 때, 에이전트가 내부적으로 '사용자 의도 분류(Classifying User Intent)' 단계를 거치고 있음을 시각적으로 표시하여 투명성을 제공하는 모습을 보여준다.

Streamlit 기반 UI에 좋아요/싫어요 버튼을 구현하고 lf_client.score 함수를 연결하여, 특정 답변에 대한 사용자 만족도를 Langfuse 대시보드에서 실시간으로 확인할 수 있는 피드백 루프를 완성한다.

python

if col1.button("👍"):
    lf_client.score(trace_id=trace_id, name="user-satisfaction", value=1)
if col2.button("👎"):
    lf_client.score(trace_id=trace_id, name="user-satisfaction", value=0)

사용자의 피드백을 특정 트레이스 ID와 연결하여 Langfuse로 전송하는 예시

Streamlit으로 구현된 FuseCommerce AI 지원 에이전트의 초기 대시보드 화면이다. — Screenshot사용자 인터페이스의 구성을 보여준다. 왼쪽 사이드바에는 세션 통계와 최근 트레이스 정보가 표시되며, 중앙에는 Langfuse 기반의 관측성을 강조하는 문구가 포함되어 있다.

특정 대화 세션에 대한 Langfuse 트레이스 ID와 상세 보기 링크가 포함된 UI 요소이다. — Screenshot개별 대화가 고유한 트레이스 ID로 관리되고 있음을 보여준다. 'View in Langfuse' 링크를 통해 개발자가 즉시 해당 요청의 상세 실행 경로를 분석할 수 있는 구조를 확인시켜 준다.

Langfuse 대시보드를 통해 평균 지연 시간, 의도 분류 정확도, 세션당 비용 등을 시각화함으로써 운영 중인 에이전트의 성능 병목 지점을 파악하고 프롬프트나 검색 로직을 최적화할 수 있다.

실무 Takeaway

운영 환경의 LLM 시스템에서는 @langfuse.observe와 같은 데코레이터를 활용해 복잡한 에이전트의 사고 단계를 가시화해야 디버깅 효율을 극대화할 수 있다.
단순 키워드 매칭 대신 벡터 임베딩 기반의 시맨틱 검색을 구현하면 사용자가 동의어나 추상적인 표현을 사용하더라도 정확한 정보를 제공할 수 있다.
사용자 피드백을 개별 트레이스 ID와 연결하여 수집하면 어떤 프롬프트나 검색 결과가 부정적인 경험을 유발했는지 즉각적으로 분석하고 개선할 수 있다.

언급된 리소스

문서Langfuse Cloud

Langfuse를 활용한 자가 개선형 AI 고객 지원 에이전트 구축 가이드

핵심 요약

배경

대상 독자

의미 / 영향

섹션별 상세

실무 Takeaway

언급된 리소스

관련 토론

댓글

관련 피드

관련 토론

댓글

관련 피드