로컬 우선 AI 에이전트 Selene 업데이트: SWE-bench Lite 61% 달성 및 신규 기능 추가

핵심 요약

로컬 우선 AI 에이전트 Selene의 개발자가 SWE-bench Lite 성능 결과와 함께 음성 파이프라인, Docling 통합, 브라우저 도구 등 대규모 업데이트를 공유했다.

배경

개발자가 직접 제작한 로컬 우선 AI 에이전트 앱 Selene(구 Seline)의 한 달간의 업데이트 내역을 공유하기 위해 작성되었다. 특히 앱 자체가 스스로 코드를 수정하는 에이전틱 코딩 방식으로 개발되고 있음을 강조했다.

의미 / 영향

Selene의 사례는 에이전틱 코딩이 단순한 실험을 넘어 실제 제품의 유지보수와 기능 확장을 스스로 수행할 수 있는 수준에 도달했음을 보여준다. 특히 로컬 환경과 다양한 오픈소스 라이브러리의 조합이 상용 솔루션에 의존하지 않는 독립적인 AI 개발 워크플로우를 가능하게 한다.

커뮤니티 반응

작성자가 직접 개발한 도구의 성능과 자가 개발 방식에 대해 긍정적인 반응이 있으며, 특히 로컬 우선 접근 방식에 대한 관심이 확인됐다.

실용적 조언

복잡한 문서 레이아웃 처리가 필요할 때 IBM에서 공개한 Docling 라이브러리를 활용하면 효과적이다.
에이전트의 웹 상호작용 기능을 구현할 때 browser-use와 같은 경량 멀티 액션 도구를 검토해볼 가치가 있다.

언급된 도구

Selene추천

로컬 우선 AI 에이전트 및 코딩 도구

Docling추천

문서 파싱 및 구조화 라이브러리

browser-use추천

AI 에이전트용 웹 브라우징 자동화 도구

섹션별 상세

SWE-bench Lite 테스트 결과, 별도의 튜닝 없이 Opus-4-6을 사용하여 61%의 해결률을 기록했다. 전체 과정에 약 15-16시간이 소요되었으며, API 사용량 제한으로 인해 작업이 중단되는 상황에서도 초기 테스트로서 고무적인 성과를 거두었다.

Selene은 현재 '자기 개발(Self-developing)' 단계에 진입하여, 개발자가 아키텍처를 설계하면 에이전트가 실제 구현 작업을 원활하게 처리하고 있다. 개발자는 더 이상 Codex나 Claude Code 같은 외부 도구를 사용하지 않고 Selene만으로 모든 개발 업무를 수행 중이다.

새로운 기능으로 전체 음성 파이프라인과 오버레이 모드가 추가되어, 앱을 직접 열지 않고도 스크린샷 첨부 및 TTS 채팅이 가능해졌다. 또한 크롬 브라우저와 유사한 탭 뷰 모드를 도입하여 여러 세션을 동시에 관리할 수 있는 편의성을 높였다.

문서 처리 능력을 강화하기 위해 IBM의 Docling 라이브러리를 통합했으며, 웹 브라우징을 위한 가벼운 멀티 액션 도구인 browser-use를 추가했다. 이를 통해 일상적인 웹 테스트와 정보 수집 작업을 자동화하고 있다.

실무 Takeaway

Selene은 Opus-4-6 기반으로 SWE-bench Lite에서 61%의 성공률을 달성하며 실질적인 소프트웨어 엔지니어링 능력을 입증했다.
Docling과 browser-use 도구를 통합하여 문서 분석 및 웹 자동화 기능을 대폭 강화하고 로컬 환경에서의 활용도를 높였다.
로컬 우선(Local-first) 원칙을 유지하면서 음성 인터페이스와 탭 기반 UI를 통해 사용자 경험을 개선했다.

언급된 리소스

GitHubSelene GitHub Repository

핵심 요약

로컬 우선 AI 에이전트 Selene의 개발자가 SWE-bench Lite 성능 결과와 함께 음성 파이프라인, Docling 통합, 브라우저 도구 등 대규모 업데이트를 공유했다.

배경

의미 / 영향

커뮤니티 반응

작성자가 직접 개발한 도구의 성능과 자가 개발 방식에 대해 긍정적인 반응이 있으며, 특히 로컬 우선 접근 방식에 대한 관심이 확인됐다.

실용적 조언

복잡한 문서 레이아웃 처리가 필요할 때 IBM에서 공개한 Docling 라이브러리를 활용하면 효과적이다.
에이전트의 웹 상호작용 기능을 구현할 때 browser-use와 같은 경량 멀티 액션 도구를 검토해볼 가치가 있다.

언급된 도구

Selene추천

로컬 우선 AI 에이전트 및 코딩 도구

Docling추천

문서 파싱 및 구조화 라이브러리

browser-use추천

AI 에이전트용 웹 브라우징 자동화 도구

섹션별 상세

실무 Takeaway

Selene은 Opus-4-6 기반으로 SWE-bench Lite에서 61%의 성공률을 달성하며 실질적인 소프트웨어 엔지니어링 능력을 입증했다.
Docling과 browser-use 도구를 통합하여 문서 분석 및 웹 자동화 기능을 대폭 강화하고 로컬 환경에서의 활용도를 높였다.
로컬 우선(Local-first) 원칙을 유지하면서 음성 인터페이스와 탭 기반 UI를 통해 사용자 경험을 개선했다.

언급된 리소스

GitHubSelene GitHub Repository

로컬 우선 AI 에이전트 Selene 업데이트: SWE-bench Lite 61% 달성 및 신규 기능 추가

핵심 요약

배경

의미 / 영향

커뮤니티 반응

실용적 조언

언급된 도구

섹션별 상세

실무 Takeaway

언급된 리소스

로컬 우선 AI 에이전트 Selene 업데이트: SWE-bench Lite 61% 달성 및 신규 기능 추가

핵심 요약

배경

의미 / 영향

커뮤니티 반응

실용적 조언

언급된 도구

섹션별 상세

실무 Takeaway

언급된 리소스

관련 피드

관련 토론

댓글

관련 피드

관련 토론

댓글