AI 에이전트가 스스로 취약점을 찾아낸다? Claude Code로 구현한 자동 레드팀 실험
Claude Code를 활용해 웹사이트의 취약점을 자동으로 탐색하고 공격 전략을 최적화하는 자율형 레드팀 에이전트 시스템을 구축하고 테스트한다.
총 100건
Claude Code를 활용해 웹사이트의 취약점을 자동으로 탐색하고 공격 전략을 최적화하는 자율형 레드팀 에이전트 시스템을 구축하고 테스트한다.
기존 LLM 수학 증명 벤치마크는 경진대회용 수학 문제에 치중되어 실제 소프트웨어 공학적 검증 능력을 평가하기 어렵다. 이 논문은 실제 산업 현장에서 사용되는 AWS의 암호화 어셈블리 코드를 대상으로 LLM이 기계가 확인 가능한 증명을 생성할 수 있는지 평가하는 최초의 벤치마크를 제시하여 AI의 실무적 추론 능력을 측정한다.
AI 에이전트가 코드 리뷰에 활발히 도입되고 있지만, 실제 개발 현장에서의 실효성과 인간 리뷰어와의 차이점에 대한 데이터는 부족했다. 이 논문은 대규모 GitHub 데이터를 통해 AI 에이전트가 기술적 결함은 잘 찾아내지만, 프로젝트의 맥락 이해와 지식 전달 측면에서는 여전히 인간의 개입이 필수적임을 입증한다.
앤드류 응 교수가 비전공자를 위해 AI의 핵심 개념인 ANI와 AGI를 구분하고, 산업 전반에 미칠 경제적 영향력과 체계적인 학습 로드맵을 제시합니다.
LangChain이 Google Cloud Next 2026에서 LangSmith 신기능과 GKE 기반 보안 샌드박스 기술을 공개하고 Marketplace 출시를 통한 기업 도입 편의성을 강화했다.
OpenAI의 대규모 채용과 HSBC의 감원 소식, Meta의 내부 AI 에이전트 도입 사례를 통해 AI가 기업 운영과 정치적 규제 쟁점에 미치는 영향을 분석합니다.
LLM들이 적대적인 다회차 토론에서 논리를 유지하고 반박하는 능력을 Bradley-Terry 레이팅으로 측정하는 새로운 벤치마크 시스템이다.
Nitro는 Roboflow와 Lovable을 결합한 컴퓨터 비전 파이프라인을 통해 분생포자 계수 작업을 자동화하고 월 600시간의 노동력을 절감했다.
버니 샌더스 의원이 AI의 프라이버시 위협을 폭로하려 시도한 영상이 오히려 사용자의 의견에 무조건 동조하는 AI의 '아첨(Sycophancy)' 특성을 기술적으로 증명했다.
칼로리 추적 AI 앱 Amy의 개발자가 4개월간 MRR 2,000달러를 달성하며 사용자 피드백과 Posthog 분석을 통해 리텐션을 2배 개선한 과정을 공유합니다.
구글이 Pixel 10의 100x 줌과 AI 기능을 홍보하기 위해 공개한 광고들이 사진 조작 권장 및 스토커 같은 연출로 인해 비판을 받고 있다.
LUMINA는 LLM 기반 병목 분석을 통해 기존 방식보다 17.5배 높은 효율로 A100을 능가하는 최적의 GPU 아키텍처를 설계한다.
AI 비디오 생성 시 발생하는 프레임 간 시각적·공간적 불일치인 시간적 드리프트의 원인을 분석하고, 이를 해결하기 위한 아키텍처 개선, 시퀀스 단위 평가 지표, 고품질 데이터 어노테이션 전략을 제시한다.
Databricks가 코드 RAG 시스템 성능 최적화를 위해 Naive, 언어 인식, AST 기반의 세 가지 청킹 전략을 MLflow로 비교 평가한 결과와 인사이트를 공유한다.
MIT의 디미트리스 베르치마스 교수가 제54회 킬리언 강연에서 AI와 운영 연구(OR)를 결합해 의료, 교육, 물류 시스템을 최적화하고 인류의 삶을 개선한 성과를 공유했다.
LangChain은 LangSmith Fleet을 통해 사용자 대리 권한을 사용하는 'Assistants'와 고정 자격 증명을 사용하는 'Claws'라는 두 가지 에이전트 권한 모델을 제시한다.
Artificial Genius는 Amazon SageMaker와 Nova를 활용해 입력은 확률적이지만 출력은 결정론적인 하이브리드 아키텍처를 구축하여 규제 산업의 LLM 환각 문제를 해결했다.
AWS CDK와 Amazon Bedrock AgentCore를 활용하여 보안 검증, 대화 메모리 유지, 비동기 처리를 구현한 Slack용 AI 에이전트 통합 아키텍처를 구축한다.
Littlebird는 사용자의 화면을 텍스트로 캡처하여 개인화된 맥락을 구축하고 회의 요약 및 루틴 자동화를 지원하는 AI 생산성 도구이다.
Agent Zero와 Ollama를 활용하여 데이터 유출 걱정 없이 로컬 환경에서 사진 분석 및 복잡한 작업을 수행하는 자율형 AI 에이전트 구축 방법을 다룹니다.
Claude Code와 nlm CLI를 결합하여 NotebookLM의 자료 분석부터 오디오 생성, 보고서 작성까지 전 과정을 자연어로 자동화하는 실전 튜토리얼이다.
Antigravity IDE에서 단일 프롬프트 대신 작업 분할, 모델 라우팅, 병렬 에이전트를 결합한 클러스터 방식을 통해 복잡한 개발 작업을 효율적으로 완수하는 최적화 전략을 제시한다.
Superhuman의 CEO Shishir Mehrotra가 Grammarly의 'Expert Review' 기능을 둘러싼 AI 명의 도용 논란과 창작자 보상 모델에 대해 논의한다.
Educato App은 전 세계 1만 개 이상의 전문직 시험을 위해 AI 기반 맞춤형 학습 계획, 실시간 질의응답, 성적 예측 기능을 제공하는 모바일 교육 플랫폼이다.
Contral은 AI 에이전트의 코딩 보조와 실시간 교육 기능을 결합하여 개발자가 프로젝트를 구축하며 실질적인 기술을 습득하도록 돕는 IDE이다.
Sovereign Veto-layer 아키텍처를 통해 고비용 모델의 호출을 최적화하여 GPT-5 대비 빠른 응답성과 60% 낮은 비용을 달성한 Gongju 프로젝트의 벤치마크 결과이다.
SQLite와 로컬 임베딩을 활용하여 AI 에이전트의 지식과 스킬을 관리하고, MCP를 통해 효율적으로 컨텍스트를 주입하는 로컬 우선 오픈소스 프로젝트 skill-depot을 소개한다.
구글 Gemma 모델의 정서적 불안정성 진단과 DPO를 통한 해결책, DeepMind의 새로운 AGI 평가 체계, AI 사이버 공격의 스케일링 법칙, 그리고 중국의 전자전 특화 모델 MERLIN을 다룹니다.
Sakana AI가 3종의 LLM 앙상블과 노벨티 서치 기술을 활용해 110만 건의 SNS 데이터에서 국가 주도의 정교한 정보 공작 내러티브를 추출하고 가설을 검증했다.
동물 복지를 위한 AI 활용 논의부터 백악관의 규제 완화 정책, 펜타곤의 Palantir AI 도입 등 AI 산업 전반의 주요 뉴스를 다룹니다.
관측 데이터에서 혼란 변수를 통제하여 무작위 실험과 유사한 효과를 내는 성향 점수 매칭(PSM)의 이론과 Python 구현 방법을 다룹니다.
현대 컴퓨팅 시스템에서 DRAM의 효율성은 전체 성능과 에너지 소비에 직결되지만, 기존의 강화학습 기반 컨트롤러는 의사결정 과정이 불투명한 '블랙박스'라는 한계가 있었다. ReLMXEL은 보상 분해 기법을 통해 성능 최적화와 동시에 왜 특정 설정이 선택되었는지에 대한 기술적 근거를 제공함으로써 시스템 설계의 신뢰성과 투명성을 동시에 확보했다.
3D 모델에 질감을 입히는 작업은 수작업이 많이 필요하지만, 이 논문은 비디오 생성 AI를 활용해 이를 자동화한다. 특히 기존 모델들이 놓치던 기하학적 일관성을 확보하여, 생성된 비디오만으로도 실제 3D 렌더링 수준의 고품질 자산을 만들 수 있게 한다.
초음파 영상은 노이즈가 많고 경계가 불분명하여 숙련된 전문가의 수동 작업이 필수적이지만, 라벨링 비용이 매우 높다는 한계가 있다. 이 논문은 아주 적은 양의 정답 데이터만으로도 고성능 분할 모델을 학습시키는 기술을 제안하여, 의료 현장의 진단 효율성을 높이고 의료진의 업무 부담을 획기적으로 줄일 수 있는 길을 열었다.
LLM의 발전으로 인간과 AI가 쓴 글을 구분하기 어려워지면서 학계와 사법 분야에서 오판의 위험이 커지고 있다. 이 논문은 불투명한 상용 도구 대신 투명한 신경망 구조를 제안하여 다국어 및 특정 도메인 환경에서도 안정적인 탐지 성능을 입증했다.
LLM을 강화학습으로 훈련할 때 추론 엔진의 설정 차이나 데이터 수집 시점의 차이로 인해 훈련이 갑자기 붕괴되는 현상이 잦다. 이 논문은 모델의 각 층에 학습 가능한 미세한 소음을 섞는 간단한 방법으로 훈련 과정을 매끄럽게 만들어, 복잡한 수학 문제나 도구 사용 시나리오에서 훨씬 안정적인 성능 향상을 이끌어냈다.
기존의 3D 재구성 기술은 물체의 고유 색상과 주변 조명 효과를 완벽히 분리하지 못해 새로운 환경에 배치할 때 부자연스러운 한계가 있었습니다. ReLi3D는 다중 뷰 제약 조건을 활용해 조명과 재질을 획기적으로 분리하며, 1초 미만의 속도로 어떤 조명에서도 자연스럽게 어울리는 전문가급 3D 에셋을 생성합니다.
기존 이미지 변조 탐지는 대략적인 물체 영역만 표시하여 실제 수정된 픽셀과 일치하지 않는 문제가 있었습니다. 이 연구는 픽셀 단위의 정밀한 탐지와 변조의 의미론적 이해를 결합한 PIXAR 벤치마크를 통해, 생성형 AI로 정교하게 조작된 이미지를 더 정확하게 식별할 수 있는 새로운 표준을 제시합니다.
LLM이 학습 데이터에 내재된 문화적 편향을 어떻게 투영하는지 노래 가사라는 독특한 도메인을 통해 분석했다. 특정 인종을 기본값으로 설정하거나 문화적 맥락을 오해하는 양상을 수치화하여 모델의 공정성 평가에 새로운 지표를 제시했다.
스트리밍 비디오는 이론적으로 무한한 길이를 가지기 때문에 모든 시각 토큰을 처리하면 메모리 부족(OOM)이나 과거 정보를 잊어버리는 문제가 발생한다. CurveStream은 영상의 의미가 급변하는 '곡률' 지점을 포착해 중요한 장면만 고화질로 남기고 나머지는 압축함으로써, 적은 메모리로도 긴 영상의 핵심 맥락을 정확히 유지한다.
대형 언어 모델(LLM)은 뛰어난 지능을 가졌지만, 학습 데이터가 부족한 소수 언어에서는 성능이 급격히 떨어지는 고질적인 문제를 안고 있다. 이 논문은 이미 수백 개의 언어를 잘 이해하는 번역 모델을 LLM의 '입'과 '귀'로 활용하여, 모델 전체를 다시 학습시키지 않고도 전 세계 다양한 언어를 자유자재로 다룰 수 있게 만드는 획기적인 구조를 통해 이 문제를 해결한다.
기존 SLAM 시스템은 주변이 멈춰있다고 가정하여 움직이는 물체가 있으면 위치 추적에 실패하는 경우가 많았다. DROID-W는 별도의 물체 인식 모델 없이도 픽셀별 불확실성을 스스로 계산해, 복잡한 도심이나 사람이 많은 곳에서도 정확하게 지도와 위치를 파악하는 기술을 선보였다.
대부분의 시각 언어 모델(VLM)이 비전 트랜스포머(ViT)에 의존하는 상황에서, 상태 공간 모델(SSM)이 더 효율적이고 정교한 시각 인코더가 될 수 있음을 입증했다. 특히 객체의 위치를 찾는 Localization 작업에서 압도적인 성능을 보여주며, 모델의 크기나 사전 학습 정확도가 VLM의 최종 성능과 항상 일치하지 않는다는 중요한 통찰을 제공한다.
기존 AI 스케치 모델은 전체 그림을 한 번에 그려내어 특정 부분만 수정하거나 생성 과정을 세밀하게 제어하기 어려웠다. 이 논문은 그림을 의미 있는 단위로 나누어 순차적으로 그리는 VLM 에이전트를 제안하여, 사용자가 생성 과정에 개입하고 국소적인 편집을 가능하게 하는 새로운 인터랙티브 드로잉 패러다임을 제시한다.
데이터 과학의 자동화가 가속화되고 있지만, 특정 산업 도메인의 복잡한 문제를 해결하는 데 있어 AI의 한계를 명확히 짚어줍니다. 단순한 코드 생성을 넘어 도메인 지식 결합과 전략적 의사결정에서 인간의 역할이 왜 여전히 필수적인지 증명하며, 미래의 AI가 나아가야 할 방향으로 완전 자동화가 아닌 인간-AI 협업을 제시합니다.
기존의 이산 확산 모델은 고품질 결과를 얻기 위해 수백 번의 반복 계산이 필요하여 비용이 매우 높았습니다. 이 논문은 연속형 확산 모델에서 성공적이었던 모멘트 매칭 기법을 이산 영역으로 확장하여, 아주 적은 단계만으로도 원래 모델보다 더 나은 품질의 이미지와 텍스트를 생성하는 효율적인 D-MMD 알고리즘을 제시하여 생성 AI의 실용성을 크게 높였습니다.
1인칭 영상은 카메라의 급격한 움직임과 복잡한 손 동작 때문에 AI가 생성하기 매우 까다로운 영역이다. EgoForge는 최소한의 정적인 입력만으로도 물리적으로 타당하고 사용자의 의도를 정확히 따르는 영상을 만들어냄으로써, 가상 현실(VR) 교육이나 로봇의 행동 학습을 위한 고품질 데이터를 저비용으로 생성할 수 있는 길을 열었다.
기존 LLM은 겉으로 보이는 텍스트를 통해서만 생각하지만, 루프형 모델은 내부에서 여러 번 되풀이하며 속으로 생각한다. 이 논문은 루프형 모델이 내부 연산 과정에서 직접 보상을 받아 더 효율적으로 추론하도록 만드는 새로운 학습법을 제시하여, 적은 연산으로도 복잡한 문제를 풀 수 있게 한다.
긴 비디오에서 질문에 답하기 위해 필요한 핵심 장면을 찾는 과정은 매우 비싸거나 부정확했다. HiMu는 복잡한 질문을 논리 트리로 분해해 가벼운 전문가 모델들로 처리함으로써, 연산량을 10배 줄이면서도 최신 AI 에이전트보다 높은 정확도를 달성했다.
기존 3D 생성 기술은 고품질 3D 데이터 부족으로 인해 표현의 다양성과 물리적 일관성 확보에 어려움을 겪어왔다. 이 논문은 이미 방대한 시각 지식을 학습한 2D 파운데이션 모델을 멀티 에이전트 체계로 엮어, 추가 학습 없이도 사실적이고 탐색 가능한 3D 환경을 구축하는 혁신적인 방법론을 제시한다.
생성형 추천 모델이 기존 ID 기반 모델보다 뛰어난 이유가 단순히 '똑똑해서'가 아니라 '잘게 쪼개서 암기하기 때문'임을 밝혀냈다. 이를 통해 추천 시스템의 성능을 높이기 위해 어떤 방식으로 아이템을 토큰화하고 모델을 조합해야 하는지에 대한 실질적인 설계 지침을 제공한다.
긴 문서를 처리할 때 발생하는 연산 병목 현상을 해결하기 위해, 별도의 추가 학습 없이도 중요한 정보만 골라내는 기술이다. 기존 방식과 달리 문장의 구조를 유지하면서 핵심 내용을 압축하여, 속도는 높이면서도 답변의 정확도는 유지하는 것이 특징이다.
실무에서 마주하는 복잡하고 구조가 깨진 엑셀 데이터를 AI가 스스로 분석하고 시각화까지 수행하는 기술적 토대를 마련했습니다. 단순한 데이터 추출을 넘어 다단계 추론과 실행 경험을 통해 스스로 분석 전략을 수정하며 정확도를 높이는 에이전트 구조를 제시합니다.
LLM이 복잡한 문제를 풀 때 사용하는 '생각의 사슬(CoT)'은 정확도를 높이지만 추론 비용을 크게 증가시킵니다. 이 논문은 단순히 글자 수를 줄이는 대신, 정보 이론을 활용해 불필요한 중언부언만 골라내어 삭제함으로써 성능 저하 없이 운영 효율성을 극대화하는 새로운 표준을 제시합니다.
복잡한 웹 탐색처럼 단계가 많은 작업에서 AI 에이전트가 길을 잃는 문제를 해결하기 위해 작업을 작은 중간 목표로 나누는 방식을 제안한다. 이를 통해 Gemma3-12B와 같은 오픈 모델이 GPT-4o와 같은 거대 상용 모델보다 더 높은 성능을 낼 수 있음을 증명하여 효율적인 에이전트 학습의 새로운 방향을 제시한다.
기존의 자기 개선 AI는 개선 방식이 사람이 만든 고정된 규칙에 갇혀 있었으나, 이 논문은 개선 메커니즘 자체를 AI가 스스로 수정할 수 있는 '하이퍼에이전트' 개념을 도입했습니다. 이를 통해 코딩뿐만 아니라 논문 리뷰, 로봇 제어 등 다양한 분야에서 AI가 스스로 성능을 높이는 '자기 가속화'의 실질적인 가능성을 입증했습니다.
기존의 재귀적 언어 모델은 AI가 자유롭게 코드를 짜서 문제를 풀게 했으나, 이 과정에서 오류가 잦고 속도가 느린 한계가 있었다. 이 논문은 수학적 원리인 람다 대수를 도입해 AI의 행동을 정해진 규칙 안에 가둠으로써, 훨씬 더 정확하고 빠르게 수만 단어 이상의 긴 문서를 분석할 수 있는 길을 열었다.
여러 사람이 등장하는 비디오를 생성할 때 특정 인물에게 정확한 옷이나 소품을 입히는 것은 매우 어렵습니다. 이 논문은 인물의 신원과 속성을 명시적으로 연결하는 기술을 통해, 복잡한 장면에서도 각 인물의 특징이 뒤섞이지 않고 일관되게 유지되는 고품질 비디오 생성을 가능하게 합니다.
기존의 3D 장면 생성 기술은 개별 가구의 배치는 잘 수행하지만, 방 전체의 분위기나 가구 간의 스타일을 통일하는 데 한계가 있었다. FlowScene은 가구 간의 관계를 그래프로 연결하고 정보를 서로 주고받으며 생성하는 방식을 도입하여, 마치 전문 디자이너가 꾸민 것처럼 조화롭고 일관된 스타일의 3D 공간을 고속으로 자동 생성한다.
기존 AI는 정보가 부족할 때 환각을 일으키거나 단순히 모른다고 답하는 데 그쳤으나, 이 논문은 AI가 스스로 정보를 얻기 위해 사용자에게 행동을 요청하는 능동성을 제안한다. 이는 AI가 수동적 도구를 넘어 협력적 파트너로 진화하는 데 필수적인 연구 방향을 제시한다.
기존 Vision-Language Model(VLM)이 위성 이미지의 미세한 공간 정보를 처리하지 못하는 한계를 해결한다. 픽셀 수준의 마스킹과 텍스트 추론을 결합하여 면적 계산이나 거리 측정 같은 정밀한 지리 공간 분석을 가능하게 함으로써 지구 관측 분야의 자동화 수준을 높인다.
기존의 고성능 비디오 생성 모델은 연산량이 너무 많아 실시간 활용이 어려웠고, 효율적인 모델은 영상의 품질이나 움직임이 부자연스러운 문제가 있었다. Astrolabe는 적은 메모리로도 사람의 선호도를 반영할 수 있는 새로운 강화학습 프레임워크를 제시하여, 저사양 환경에서도 장편 고품질 영상을 생성할 수 있게 한다.
기존 시각-언어 모델은 복잡한 단계별 추론 시 중간 단계의 작은 실수가 최종 결과의 큰 오류로 이어지는 한계가 있었습니다. 이 논문은 시각적 증거를 단계별로 확인하도록 강제하는 멀티홉 데이터를 합성하여 모델의 추론 정확도와 일반화 능력을 획기적으로 개선했습니다.
제프 베이조스의 대규모 AI 제조 펀드 조성과 아마존의 Trainium 칩 전략, 엔비디아의 시장 경쟁 심화 및 워드프레스의 AI 에이전트 도입을 다룹니다.
엔비디아의 젠슨 황 CEO가 렉스 프리드먼 팟캐스트에서 AGI 달성을 선언했으나, 이후 AI 에이전트의 한계를 언급하며 발언의 수위를 조절했다.
Tightbeam은 컨테이너 내부의 AI 에이전트가 API 키 없이도 유닉스 소켓을 통해 LLM과 MCP 도구를 안전하게 사용할 수 있도록 중계하는 보안 프록시이다.
LLM 특유의 정형화된 말투의 원인인 10가지 안티 패턴을 식별하고, 이를 교정하여 저자의 진정성을 담아내는 협업 편집 프로세스를 제안한다.
애플이 6월 8일부터 12일까지 WWDC 2026을 개최하며, 구글 제미나이 통합과 시리 고도화 등 본격적인 AI 기술 혁신을 선보일 예정이다.
Llama 3.1-8B와 생성형 경매 알고리즘을 활용하여 LLM 답변 내에 맥락에 맞는 광고를 자연스럽게 통합하는 광고 지원 API 시스템이다.
일론 머스크의 대규모 칩 공장 건설 계획과 메타의 내부 AI 에이전트 도입, ChatGPT 광고의 저조한 성과 등 최신 AI 및 IT 업계 동향을 다룹니다.
Reco는 Amazon Bedrock의 Anthropic Claude와 프롬프트 캐싱을 활용하여 복잡한 보안 경보 JSON을 인간이 읽기 쉬운 내러티브로 변환함으로써 사고 대응 시간을 63% 단축했다.
Sleuther는 Ollama를 사용하여 Oh My Zsh 터미널에서 발생하는 명령어 오류의 원인을 로컬에서 분석하고 안전한 해결 명령어를 제안하는 도구입니다.
10가지 주요 프롬프트 엔지니어링 기법의 작동 원리, 장단점 및 최적의 사용 사례를 비교 분석한 기술 가이드이다.
앤스로픽이 AI의 군사적 오용을 거부하자 미 국방부가 이를 '공급망 위험'으로 지정한 것에 대해 엘리자베스 워런 의원이 보복성 조치라며 강하게 비판했다.
OpenClaw 프레임워크와 Claude를 활용해 130개 이상의 일상 업무를 자동화하고 10만 달러 규모의 협상까지 수행한 AI 에이전트 Aurelion의 구축 및 운영 사례를 다룹니다.
OpenAI가 샘 알트먼이 투자한 핵융합 스타트업 Helion으로부터 2030년까지 5GW 규모의 전력을 공급받기 위한 초기 협상을 진행 중이다.
다큐멘터리 감독 발레리 비치는 생성형 AI의 인종차별적 결과물이 단순한 데이터 오염이 아닌, 우생학에 기반한 통계학적 뿌리에서 기인했음을 추적한다.
Ghidra와 LLM(Qwen 2.5)을 MCP로 연결하여 멀웨어의 C2 통신, 지속성 메커니즘, 안티 디버깅 기법을 자동으로 식별하는 과정을 다룹니다.
DataSieve 2.0은 인터넷 연결 없이 기기 로컬에서 다양한 문서 파일로부터 이메일, 날짜, URL 등 구조화된 데이터를 빠르게 추출하고 내보내는 도구이다.
Lindy는 iMessage와 SMS를 통해 이메일 관리, 일정 조정, 회의록 작성을 지원하는 텍스트 중심의 개인용 AI 업무 비서 서비스이다.
신호 처리 이론을 기반으로 프롬프트를 6개 영역의 JSON 구조로 설계한 sinc-prompt가 기존 기법보다 구체성은 높고 토큰 사용량은 46% 적음을 입증했다.
여러 Codex CLI 세션의 토큰 사용량과 플랜 제한을 통합하여 실시간으로 모니터링할 수 있는 오픈소스 대시보드 도구인 TokenMeter를 소개한다.
LightOn의 전문가들이 멀티 벡터 표현과 Late Interaction 기술을 통해 검색 정확도를 혁신하고, ColBERT-Zero와 PyLate를 활용한 효율적인 구현 방법을 공유합니다.
AI가 생성하는 코드량이 폭증하는 시대에 사용자 행동을 모방하여 버그를 잡아내는 AI 기반 소프트웨어 검증 플랫폼 모멘틱의 성장 스토리와 미래 비전이다.
강화학습 에이전트의 학습 능력 저하인 가소성 손실을 해결하기 위해 쌍둥이 네트워크와 주기적 리셋을 결합하여 안정성과 데이터 효율성을 동시에 확보하는 AltNet 프레임워크를 제안합니다.
len은 자연어 의도, 구조적 모델, 생성 계약의 3단계 계층을 통해 LLM의 코드 생성 과정을 체계적으로 관리하고 검증하는 메타 프로그래밍 언어이다.
Gemini의 이미지 인식 능력과 IMDb 데이터를 결합하여 mpv 재생 중 배우 정보를 오버레이로 표시하는 시스템을 실험했으나, LLM의 ID 매핑 오류라는 한계를 발견했다.
OpenClaw 에이전트의 배포, 모니터링, 확장을 지원하며 자가 치유 기능과 zero-SSH 운영을 제공하는 Mac용 관리 도구이다.
Fastlane은 바이럴 영상을 비즈니스 맞춤형 숏폼 콘텐츠로 리믹스하고 틱톡, 인스타그램, 유튜브에 자동 예약 게시하는 AI 기반 마케팅 엔진이다.