AI는 정말 의식을 가질 수 있을까? 범심론자가 말하는 LLM의 한계
철학자 필립 고프가 의식을 우주의 근본 속성으로 보는 범심론적 관점에서 LLM의 의식 가능성에 대한 회의적 견해와 진화론적 미스터리를 논의한다.
총 63건
철학자 필립 고프가 의식을 우주의 근본 속성으로 보는 범심론적 관점에서 LLM의 의식 가능성에 대한 회의적 견해와 진화론적 미스터리를 논의한다.
PyTorch가 상위 PR 이벤트를 하위 저장소 CI로 자동 연계하고 결과를 HUD에 통합하는 Cross-Repository CI Relay를 도입했다.
물체 인식만으로는 충분하지 않으며 어포던스, 접촉 영역, 물체 상태 같은 객체 수준 레이블이 섬세한 조작 학습에 필수적이다.
Sara AI는 Hinglish 페르소나로 사기범을 오래 유인하면서 Hindsight 벡터 메모리와 CascadeFlow 관측 파이프라인으로 실시간으로 구조화된 인텔을 추출·저장하는 허니팟 시스템이다.
NVIDIA 연구진은 ENPIRE라는 하니스 프레임워크로 로봇이 자동으로 실험·평가·리셋·정책 개선을 반복하게 하여 일부 조작 과제에서 99% 성공률을 달성했다.
개인 건강 지표의 한계와 인도에서 사람과 코끼리 충돌을 줄이기 위해 배치된 카메라·적외선 드론 기반 AI 경보 시스템, 그리고 Mythos 5의 제한적 공개가 요지를 이룬다.
ai-values의 퀴즈에서 15개 모델의 응답을 무상태 세션과 반복 샘플링으로 수집해 모델별 윤리·정책 선호의 차이를 데이터로 공개했다.
터미널 스크린샷에 Claude 기반 호출의 시간별 토큰 사용량, 캐시 지표, 그리고 누적 1.0B 토큰에 대한 총비용 $844.15가 표 형식으로 기록되어 있다.
작성자가 DeepFakeBench의 네 모델과 Hugging Face 모델을 포함한 딥페이크 탐지 강건성 비교용 인터랙티브 플랫폼과 관련 백서를 공개했다.
Deep Agents Code는 LangChain 생태계와 연동되는 프로그래머블 터미널 코딩 에이전트로 원격 샌드박스, 서브에이전트, 지속 메모리와 LangSmith 추적을 지원한다.
Vector RAG는 문서를 분할해 임베딩 기반 유사도 검색을 사용하고 GraphRAG는 엔티티와 관계 기반 구조를 만들어 서로 다른 검색 요구를 충족한다.
LLM Arena에서 동일 프롬프트로 GLM5.2 Max와 Claude Sonnet 4.6을 비교하여 토큰당 입력·캐시·출력 비용이 표에 나타났고 GLM5.2는 입력 $1.40, 출력 $4.40을 기록했다.
강화학습(RL)과 결정론적 규칙을 결합하여 클라우드 ETL 파이프라인의 장애를 실시간으로 감지하고 자동으로 복구하는 지능형 에이전트 시스템을 소개한다.
SOTA 비전 모델을 묶은 FastAPI 서비스 useknockout이 Modal에서 무료로 배포되며 데모, SDK, 깃허브 레포를 함께 공개했다.
ESP32-S3와 전자종이 디스플레이를 활용해 로컬 120B 모델과 연동되는 텍스트 기반 AI 핸드헬드 기기 Vault의 설계와 구현 과정을 다룬다.
LangChain 기반의 foreman이 LangGraph 등에서 LLM 호출 없이 35개 신호로 크루 헬스를 측정하는 콜백을 오픈소스로 제공한다.
Bash4LLM은 Bash·curl·jq만으로 LLM API 요청과 스트리밍 출력, 파일 단위 처리, 세션 메타데이터 저장을 수행하는 단일 파일 유틸리티이다.
작성자가 Hindsight 메모리와 역할별 에이전트를 결합해 조직처럼 기억하고 합성하는 멀티에이전트 의사결정 시스템을 공개했다.
MACCHA는 로컬 CLI 에이전트에 공유되는 3계층 영구 메모리와 파일 기반 작업 파이프라인 및 기계적 보안 규칙을 제공하는 오픈소스 프로젝트이다.
NVIDIA의 Grace Blackwell GB10 칩을 탑재하여 손바닥 크기에서 1 PetaFLOP 성능을 구현한 개인용 AI 슈퍼컴퓨터 DGX Spark이다.
Vanilla JavaScript 약 250줄로 순전파·역전파·SGD/Momentum/Adam을 직접 구현하고 캔버스에 학습 과정을 실시간 시각화하며 수치 그래디언트 검증에서 ~2e-10 정밀도를 확인한 데모이다.
로깅, 접근제어, 데이터 처리, 보안 테스트, 런타임 보호, 사고대응의 28개 실무 항목을 제시해 엔터프라이즈 보안 심사 요구사항의 우선순위를 안내한다.
AI 도구를 활용하여 코드 리뷰의 일관성을 높이고 기술 부채를 줄이는 동시에 개발 속도를 가속화하는 협업 워크플로우를 다룬다.
프롬프트 인젝션 공격이 텍스트 기반 지시의 취약성을 악용하여 90개 이상 조직에서 자격증명과 암호화폐 탈취를 초래했고 공격량이 전년 대비 89% 증가했다는 보고와 이를 재현·수집한 공개 게임형 데이터셋이 소개되었다.
작성자는 RAG 시스템에서 검색 결과가 약할 때 모델이 부족한 맥락을 스스로 채워 자신감 있는 오답을 반환한 실제 사고를 공유하고, 근거 검증과 무지 표시에 기반한 대응을 권고한다.
결정론적 마이크로서비스 인프라의 한계를 극복하고 확률적 LLM 기반 자율 에이전트를 안정적으로 운영하기 위한 제어 평면 아키텍처와 시스템 엔지니어링 패턴을 제시한다.
에이전트 간의 합성을 통해 소형 모델로도 복잡한 업무를 수행하고 신뢰성을 높이는 새로운 AI 아키텍처 설계 방식을 제안한다.
프론티어 모델의 높은 비용 문제를 해결하기 위해 실제 운영 데이터를 활용한 성능 평가를 통해 소형 로컬 모델로 전환하는 실전 프레임워크를 제시한다.
git2llm은 GitHub 커밋·PR·이슈를 병렬 크롤링해 병합커밋·봇·WIP를 제거하고 MinHash LSH로 근사 중복을 걸러 Alpaca/ShareGPT 형식의 파인튜닝 데이터를 출력한다.
네이버 nFront RUM은 추가 설정 없이 실시간 사용자 경험 데이터를 수집하고 AI 기반 분석 리포트를 제공하는 통합 모니터링 솔루션이다.
프로덕션 환경에서 발생하는 자율 에이전트의 비결정적 실패를 해결하기 위해 모든 실행 궤적을 기록하고 결정론적으로 재생하는 Record and Replay 아키텍처 패턴을 제안한다.
평가 주도 개발 루프와 멀티 에이전트 오케스트레이션을 통해 AI 에이전트를 자율적으로 구축하고 최적화하는 Mutagent의 시스템을 소개한다.
대규모 코드베이스에서 AST 기반 로컬 검색 레이어를 구축하여 AI 코딩 도구의 토큰 사용량을 94% 절감하고 정확도를 높인 실전 사례이다.
그래프 기반 상관관계와 적응형 리스크 모델링을 결합하여 여러 기업 시스템에 걸친 숨겨진 금융 부정 패턴을 탐지하는 AI 프레임워크를 제시한다.
웹캠으로 캡처한 얼굴을 인식해 Firebase 실시간 데이터베이스에 출석을 자동 기록하는 Python 기반 학습용 프로젝트이다.
로컬 PDF를 추출해 Turkish-aware 정규화를 적용한 BM25 인덱스로 검색하고 FastAPI로 제공하는 오프라인 터키어 질의응답 시스템이다.
Higharc의 Vaidas Razgaitis가 최신 ML 연구를 실제 제품 기능으로 신속하게 전환하기 위한 세 가지 실무적 접근법을 공유한다.
동적이고 상호 연결된 데이터셋에서 GraphRAG의 연산 병목을 해결하기 위해 캐시 메커니즘을 확장한 ECAG 기술을 적용했다.
클라우드 비용을 절감하고 성능을 극대화하는 로컬 우선 문서 처리 및 PostgreSQL 기반 RAG 시스템 구축 전략을 다룹니다.
ComfyUI용 이미지 메타데이터 확장에서 비동기 캐시 API에 맞춰 capture.py의 래퍼가 get_local 우선 처리와 비동기 결과 종료를 하도록 패치되었고, Windows 절대 경로 링크 표기와 재시작·검증 절차가 권고되었다.
39개의 프롬프트와 약 90달러 토큰 비용으로 Opus 4.6과 muranyi-3를 활용해 3인칭 3D 판타지 게임 베이스를 AI로 생성한 초기 작업물이다.
복잡한 코드베이스에서 AI 코딩 어시스턴트의 성능을 극대화하기 위한 3단계 명세 기반 개발 방법론과 Kiro 활용법을 소개한다.
Google Research의 TurboQuant를 통해 AI 에이전트의 임베딩과 KV 캐시를 3~4비트로 압축하여 품질 저하 없이 메모리를 5배 절감하는 방법을 다룹니다.
코딩 에이전트의 시각적 이해력 한계를 극복하기 위해 복잡한 전용 도구 대신 HTML을 활용하는 효율적인 접근 방식을 제안합니다.
전통적인 소프트웨어 개발 조직이 AI 에이전트 중심의 자율 엔지니어링 체계로 전환하기 위해 필요한 설계, 프로세스 및 엔터프라이즈 대응 전략을 제시한다.
CAIA는 프롬프트를 분석해 적합한 로컬 모델로 동적 라우팅하여 속도·비용·품질 균형을 맞추는 오픈소스 프레임워크이다.
Python CLI 에이전트가 Hindsight 벡터 메모리와 cascadeflow 모델 라우팅을 결합해 세션 간 대화를 지속 저장하고 Groq 모델 호출의 비용을 통제한다.
FaceFlash는 PCA+ITQ로 ArcFace 임베딩을 64바이트 바이너리로 압축하고 AVX-512로 스캔해 1M 얼굴을 61MB로 인덱싱하며 Recall@1 100%를 보고했다.
수많은 도구를 가진 에이전트의 성능 저하를 막기 위해 필요한 도구만 실시간으로 주입하는 시맨틱 툴 라우터 패턴과 그 성능 지표를 다룬다.
브라우저 에이전트의 실패 원인을 모델 성능이 아닌 인터페이스 구조에서 찾고 이를 해결하기 위한 새로운 런타임 설계 방향을 제시한다.
빌더 에이전트가 프로덕트 에이전트의 코드를 수정하고 평가 실패를 자동 복구하는 시스템 중심의 에이전트 구축 방법론을 다룹니다.
오픈소스 도구 Docling을 사용하여 비정형 문서를 RAG 및 AI 학습에 적합한 JSON/Markdown 구조로 변환하는 실전 기술을 다룹니다.
랜덤 다단계 산술 과제에서 소형 모델들은 confidence로 정답을 구분하지 못했으나 일부 frontier 모델은 높은 AUROC와 근사적 보정성을 보였다.
작성자는 신용카드 등록 없이 자동으로 무료 할당이 보충되는 영구 무료 LLM API 37곳을 직접 검증해 GitHub 리포지토리에 정리했다.
TensorSharp은 동일 조건에서 prefill 속도와 첫 토큰 응답 시간에서 llama.cpp보다 우수한 성능을 보이며 네이티브 .NET 환경에서 지연 최적화를 지향한다.
LangGraph StateGraph와 asyncio.Queue, HMAC-SHA256, SQLite를 조합해 클리닉용 프로덕션 챗봇을 구현하고 구현 패턴을 깃허브에 공개했다.
클로드의 '에이전트 스킬' 개념을 정의하고, 반복적인 작업을 재사용 가능한 모듈로 변환하는 4단계 프레임워크를 통해 실무 에이전트 구축 방법을 제시한다.