ResNet50 기반 신경종양 AI 진단 1600건 검증
PyTorch와 ResNet50 기반 파이프라인으로 뇌 MRI 1,600건에서 95% 정확도를 달성하고 Hugging Face에 실시간 배포했다.
총 30건
PyTorch와 ResNet50 기반 파이프라인으로 뇌 MRI 1,600건에서 95% 정확도를 달성하고 Hugging Face에 실시간 배포했다.
병렬 팬아웃 검색, Cohere 신경 재랭커, VLM 기반 LlamaParse, 부모-자식 청킹을 결합해 인도 정부 문서의 병합 셀·교차 개정 문제를 해결했다.
유휴 타임아웃을 포아송 도착 모델로 수식화하면 R_gpu와 λP_cold를 비교해 타임아웃을 결정하는 것이 합리적임을 보였다.
Argus는 사전 컴파일된 결정론적 워크플로를 중간 엔진에서 관리하고 LLM은 선택된 액션만 실행해 예측 가능하고 토큰 효율적인 출력을 만든다.
Claude Code를 이용해 SQLite를 파일 단위로 C에서 Zig로 점진 이식하고 광범위한 테스트 게이트로 무결성을 보장했다.
NagaTranslate는 상용 LLM API와 파인튜닝된 VITS·Whisper를 결합해 Nagamese 등 저자원 나가어의 번역과 음성처리를 구현한 프로젝트이다.
작성자가 공개한 FreedomAI.Chat은 219T 파라미터의 하이브리드 dense‑MoE Transformer로 대규모 분산 인프라와 256K 토큰 컨텍스트를 목표로 학습되었다.
Mistikguard는 LLM 기반 애플리케이션의 메모리 위조를 줄이기 위해 출처 추적, 쓰기 게이트, 수정 톰스톤, 선택적 접지 감사를 제공하는 경량 Python 라이브러리다.
레이어 차원에 초점을 맞춘 교육용 신경망 구현 코드가 GitHub에 공개되어 학습 원리를 직접 확인할 수 있다.
작성자는 공유 메모리와 웨어러블 동기화 데이터를 활용해 질문을 적합한 전문 에이전트로 라우팅하고 n-of-1 실험으로 지표 변화를 추적하는 개인용 AI 건강 시스템을 만들었다.
메모리 포이즈닝을 재현한 실험에서 상호검증 기반 지속성 게이트는 단일 출처 공격을 차단했으나 시빌 위조와 절차적 페이로드에는 취약했다.
OpenClaw의 커스텀 미션 컨트롤, Discord 연동, 멀티 에이전트 프레임워크 설정을 통해 업무 생산성을 극대화하는 방법이다.
Florence-2를 TensorRT로 DeepStream에 임베드해 런타임 과제 전환과 RTSP·Kafka 출력이 가능한 컨테이너화된 실시간 파이프라인을 구현했다.
Qwen3:4B를 베이스로 Unsloth로 메모리 효율을 확보하여 RTX 5070에서 Fine-tuning하고 Open-CoT-Reasoning-Mini로 Chain-of-Thought 능력을 강화한 구현 사례이다.
정부 규제와 기업 이익이 얽힌 AI 접근성 변화와 오픈소스 모델의 존립 위기 및 글로벌 기술 경쟁 구도를 분석합니다.
작성자는 다중 에이전트 세션의 토큰 비용을 줄이기 위해 팬아웃 작업을 저비용 모델로 옮기고 드라이버는 고성능 모델로 유지할 것을 권장한다.
원문은 VM·샌드박스에 에이전트를 직접 배포하는 방식과 세 구성요소로 분리해 각각 서비스로 운영하는 방식을 비교하며 Anthropic의 Claude Managed Agent 사례로 분리 방식의 복원성을 설명한다.
프론티어 모델의 정부 규제 기반 출시 흐름과 기업의 AI ROI 집중 및 인프라 투자 재점화를 다룹니다.
Gemma 2 9B을 NVIDIA L4에서 vLLM으로 운영한 실전 벤치에서 FP8 양자화는 초기 프리필에서 최대 58%의 TTFT 페널티를 기록했으나 전체 디코딩 지연은 줄었고 KV 캐시 활용도는 92.7%에 달했다.
작성자는 외부에서 검증 가능한 평가 수단과 성공당 비용 최적화가 에이전트 루프 성패를 가른다고 사례와 수치로 입증했다.
OpenAI의 5.6 발표 내용은 Terra가 5.5 수준을 절반 비용으로 제공한다는 주장과 Sol의 Mythos급 성능 주장이 아직 설득력이 부족하다는 핵심을 담고 있다.
QLoRA로 Claude Opus 4.7의 Chain-of-Thought 추적을 증류해 abliterated Gemma-4-12B-it의 추론 성능을 회복한 모델과 lm-evaluation-harness 결과를 공개했다.
사전 수학 지식 없이 학습한 4M 파라미터 seq2seq 모델이 기호 수학 변환에서 약 98.6% 정확도를 기록했다.
호스트 모델의 무통보 버전 교체가 분류 정확도를 94%에서 91%로 낮춘 사례에서 고정 회귀 테스트와 모델 아이디 로깅으로 문제를 탐지·상관시키고 프롬프트 수정으로 복구한 경험담이다.
C++ 런타임 커널이 Transformer의 상위 20개 레이어에 bfloat16 정밀도 이하 값(katki)을 더해 출력 행동을 바꾸었고 그 효과가 로그와 재현 가능한 절차로 제시됐다.
DeepSeek 웹 채팅 세션을 자동 로그인해 로컬 OpenAI 호환 엔드포인트로 제공하는 비공식 래퍼를 공개했다.
단일 OpenAI 호환 게이트웨이를 통해 필요 시 여러 최전선 모델을 병렬 호출하고 난이도 기반 게이팅으로 평균 비용을 낮춘 운영 경험과 N+1 과금 문제에 대한 질의이다.
Picotron은 GPU 특정 의존성을 제거하고 PyTorch 기반에서 FP16/BF16로 동작하며 FlashAttention-2를 런타임에 선택해 사용할 수 있는 경량 LLM 사전학습 프레임워크이다.