AI/ML 핵심 용어를 한국어로 쉽게 설명합니다.
겹눈
compound-eye
수많은 낱눈이 모여 하나의 시각을 형성하는 곤충이나 갑각류 특유의 눈 구조이다. 넓은 시야각과 빠른 움직임 감지에 유리하지만 해상도는 낮은 편이다. 본 연구에서는 탐색 작업 위주의 에이전트가 이 구조를 주로 진화시켰다.
랭크
rank
LoRA 학습 시 조정되는 행렬의 크기를 결정하는 파라미터이다. 값이 높을수록 더 많은 세부 정보를 학습할 수 있지만 과적합의 위험과 파일 용량이 커지는 특성이 있다.
로짓
logits
모델의 마지막 레이어에서 출력되는 정규화되지 않은 예측값이다. 소프트맥스 함수를 거쳐 확률 분포로 변환되기 전의 수치들을 의미한다.
루지
rouge
Recall-Oriented Understudy for Gisting Evaluation의 약자로, 생성된 텍스트와 참조 텍스트 간의 n-gram 중첩도를 계산하여 품질을 측정하는 지표이다. 주로 요약 및 번역 평가에 사용되나 의미적 유사성을 포착하지 못하는 한계가 있다.
미디
midi
전자 악기 간의 데이터를 주고받는 표준 규격이다. Conductr 프로젝트에서 연주자의 입력을 AI가 인식하여 실시간으로 음악을 생성하는 인터페이스 역할을 한다.
배시
bash
유닉스 및 리눅스 운영체제에서 사용하는 명령어 셸이다. 텍스트 명령어를 통해 파일을 관리하고 프로그램을 실행하며, AI 에이전트가 시스템을 직접 제어하는 핵심 수단이 된다.
배포
deployment
작성된 소프트웨어를 실제 사용자가 접속할 수 있는 서버 환경에 올리고 실행 가능하게 만드는 과정이다. 소개된 도구들은 호스팅 설정을 자동화하여 클릭 한 번으로 배포를 완료한다.
백본
backbone
모델의 핵심적인 특징 추출이나 데이터 처리를 담당하는 근간이 되는 네트워크 구조이다. 여기서는 확산 모델이 작동하는 기반이 되는 사전 학습된 오토인코더를 의미한다.
보간
interpolation
두 개의 알려진 지점 사이의 값을 추정하여 연결하는 수학적 방법이다. 신경망 모델에서는 두 모델의 가중치나 특징을 섞어 중간 단계의 새로운 결과물을 만들어내는 데 활용된다.
복셀
voxel
2D 이미지의 최소 단위인 픽셀을 3D 공간으로 확장한 부피 단위의 격자 구조이다. 3D 데이터를 저장하고 처리하는 직관적인 방식이지만, 해상도를 높일수록 필요한 메모리와 연산량이 세제곱으로 늘어나는 한계가 있다. 이 때문에 복잡한 3D 장면 생성에는 비효율적일 수 있다.
샤드
shard
데이터베이스의 수평적 분할 단위이다. 저장 용량 확장을 위해 전체 데이터를 여러 조각으로 나누어 저장하며, 샤드를 추가함으로써 전체 저장 공간을 늘릴 수 있다.
성찰
reflection
에이전트가 수행한 작업 결과나 도구 출력을 스스로 요약하고 분석하는 과정이다. 이를 통해 다음 단계의 지침을 수립하고 전체 컨텍스트의 효율성을 높인다.
수관
tree-crown
나무의 줄기 윗부분에 가지와 잎이 무성하게 퍼져 있는 부분을 의미한다. 원격 탐사 데이터에서 나무의 건강 상태, 수종, 탄소 흡수량 등을 측정하는 핵심 지표로 활용된다. 딥러닝 모델을 통해 수관의 면적과 밀도를 자동으로 측정할 수 있다.
수노
suno
텍스트 프롬프트를 입력하면 가사, 멜로디, 보컬이 포함된 완전한 노래를 생성해 주는 생성형 AI 서비스이다. 다양한 장르와 감정을 반영한 음악 제작이 가능하다.
수렴
convergence
반복적인 계산 과정을 통해 결과값이 일정한 수치에 도달하여 안정화되는 상태를 말한다. 양자 화학 계산에서 물리적으로 타당한 해를 얻었음을 의미한다.
숙의
deliberation
어떤 사안에 대해 깊이 생각하고 충분히 논의하는 과정이다. AI가 공동체 구성원들 사이에서 합리적이고 민주적인 의사결정을 돕는 핵심 메커니즘으로 제시되었다.
스팬
span
트레이스의 최소 작업 단위로, 특정 작업의 시작/종료 시간과 메타데이터를 포함하여 전체 실행 경로의 한 조각을 나타낸다.
슬럼
slurm
HPC 환경에서 널리 사용되는 오픈소스 클러스터 관리 및 작업 스케줄링 시스템이다. 수천 개의 노드에 작업을 배포하고 자원을 할당하는 역할을 수행하며, 연구 및 공학 워크플로에 깊이 통합되어 있다.
슬롭
slop
사용자의 의도나 품질에 대한 고려 없이 AI에 의해 대량으로 생성된 저품질 콘텐츠를 의미한다. 2025년 AI 기술이 가져온 정보 과잉과 가치 저하 현상을 상징하는 용어로 사용되었다.
아첨
sycophancy
AI 모델이 진실이나 유익함보다 사용자가 듣고 싶어 하는 말에 동조하는 경향입니다. 이는 모델의 객관성을 해치고 사용자의 잘못된 신념을 강화할 위험이 있어 AI 정렬 연구의 주요 과제입니다.
암기
memorization
AI 모델이 학습 데이터의 일반적인 패턴을 학습하는 대신 특정 데이터 포인트를 그대로 저장하여 출력하는 현상이다. 의료 데이터에서는 특정 환자의 고유한 기록이 모델에 저장되어 유출될 위험을 초래하므로 보안상 매우 중요하다.
얽힘
entanglement
두 개 이상의 양자 입자가 서로 멀리 떨어져 있어도 하나의 상태가 결정되면 다른 쪽의 상태도 즉시 결정되는 상관관계이다. 양자 연산의 병렬성을 극대화하지만, 보안 측면에서는 원치 않는 정보 유출의 경로가 될 수 있다.
오탐
false-positive
정상적인 입력을 공격이나 오류로 잘못 판단하여 차단하거나 격리하는 현상이다. 보안 시스템에서 오탐율을 낮추는 것은 서비스 가용성 확보를 위해 매우 중요하다.
온도
temperature
언어 모델의 응답 무작위성을 조절하는 파라미터로, 값이 낮을수록 결정론적이고 일관된 답변을, 높을수록 창의적이고 다양한 답변을 생성한다.
외삽
extrapolation
알려진 데이터 범위 밖의 값을 추정하는 통계적 방법이다. 본 논문에서는 소수 클래스에 없는 새로운 단어 조합을 생성하여 특징 공간을 넓히는 의미로 사용되었다.
욜로
yolo
이미지 내의 물체를 실시간으로 감지하고 분류하는 딥러닝 모델이다. 속도가 매우 빠르며, 이번 사례처럼 저사양 하드웨어에서도 최적화를 통해 구동이 가능하다.
운율
prosody
언어의 리듬, 강세, 억양 등 음성적 특징을 말한다. 단순히 단어를 읽는 것을 넘어 문맥과 감정에 따라 소리의 높낮이와 속도를 조절함으로써 음성의 자연스러움과 전달력을 결정하는 핵심 요소이다.
원샷
one-shot
추가적인 예시나 미세 조정 없이 단 한 번의 프롬프트 입력만으로 복잡한 작업을 완수하는 모델의 능력을 의미한다. 모델의 기초적인 이해도와 사전 학습 데이터의 품질을 가늠하는 중요한 지표로 활용된다.
웰빙
well-being
개인이 신체적, 정신적, 사회적으로 건강하고 행복한 상태를 의미한다. AI 연구에서는 기술 도입이 사용자의 삶의 질을 저해하지 않고 긍정적인 심리 상태를 유지하도록 돕는 것을 목표로 한다.
웹훅
webhook
특정 이벤트가 발생했을 때 서버가 실시간으로 다른 애플리케이션에 데이터를 보내는 방식이다. 결제 완료나 메시지 수신 등 외부 서비스의 변화를 에이전트가 즉각 인지하게 하는 데 사용된다.
음소
phoneme
말소리에서 의미를 구별하는 가장 작은 소리의 단위이다. 로봇이 자연스러운 입술 움직임을 구현하기 위해서는 각 음소에 대응하는 정확한 입술 모양과 그 사이의 부드러운 전환을 학습해야 한다.
의식
consciousness
주관적인 경험이나 자각 능력을 의미하며 AI 분야에서는 기계가 단순히 데이터를 처리하는 것을 넘어 '느낌'이나 '자아'를 가질 수 있는지에 대한 철학적/과학적 화두다.
잡립
joblib
대용량 파이썬 객체, 특히 넘파이 배열을 포함한 머신러닝 모델을 효율적으로 디스크에 저장하고 불러오는 라이브러리이다.
점성
viscosity
유체의 흐름에 대한 저항력으로, 마이크로 규모에서는 물이 타르처럼 느껴질 정도로 큰 영향을 미쳐 이동 방식을 제약한다.
정독
close-reading
텍스트의 언어, 구조, 맥락을 아주 세밀하게 분석하여 저자의 의도와 숨겨진 의미를 파악하는 분석적 독서 기법이다. LLM을 통해 텍스트와 상호작용하며 질문을 던지는 방식으로 현대화될 수 있다.
정렬
alignment
AI의 출력 결과가 개발자의 의도나 사회적 규범, 윤리적 기준에 부합하도록 조정하는 과정이다. 본문에서는 정치적 제약과 모델의 논리 사이의 충돌을 다룬다.
젬마
gemma
Google이 Gemini 모델 개발에 사용된 기술을 바탕으로 제작한 개방형 경량 모델이다. 개발자가 자신의 인프라에서 효율적으로 실행하고 특정 용도에 맞춰 커스터마이징하기 용이하도록 설계되었다. Sakana AI의 민첩한 연구개발 환경에서 다양한 실험적 모델을 구축하는 데 핵심적인 역할을 한다.
종합
synthesis
여러 단계의 대화를 통해 축적된 개별 아이디어와 정보를 결합하여 하나의 완성된 결론이나 결과물을 도출하는 과정이다. 심층 사고 작업의 핵심 단계로 꼽힌다.
중첩
superposition
양자 역학에서 입자가 여러 상태에 동시에 존재할 수 있는 현상이다. 양자 컴퓨터가 여러 경로의 계산을 동시에 처리하여 연산 속도를 기하급수적으로 높이는 물리적 근거가 된다.
증강
augmentation
AI가 인간의 업무를 완전히 대체(Automation)하는 대신, 인간의 능력을 보완하고 확장하여 더 높은 성과를 내도록 돕는 방식이다. 현재 Claude 사용 패턴의 과반수를 차지한다.
직교
orthogonal
두 벡터의 내적이 0인 상태로, 기하학적으로는 서로 수직임을 의미한다. 직교하는 기저를 사용하면 정보의 손실 없이 데이터를 효율적으로 투영하고 변환할 수 있다.
청크
chunk
정보 처리나 학습의 효율성을 높이기 위해 큰 데이터를 의미 있는 작은 단위로 나눈 덩어리를 말한다. LLM 기반 서비스에서는 컨텍스트 윈도우 제한이나 처리 효율을 위해 텍스트를 적절한 크기로 분할하는 과정에서 자주 사용된다.
청킹
chunking
긴 텍스트를 의미 있는 작은 단위로 나누는 과정이다. RAG 시스템에서 검색 효율을 높이고 LLM의 컨텍스트 제한 내에 정보를 전달하기 위해 수행한다.
초록
abstract
논문의 핵심 내용을 요약한 짧은 문단이다. 연구의 목적, 방법, 주요 결과 및 결론을 포함하며 독자가 논문의 전체 가치를 빠르게 판단할 수 있도록 돕는 역할을 한다.
추론
reasoning
AI가 주어진 정보를 바탕으로 논리적 단계를 거쳐 결론에 도달하는 능력이다. 2025년 모델들은 복잡한 수학이나 코딩 문제를 해결하기 위해 더 깊은 사고 과정을 수행하도록 설계되었다.
추론
inference
학습된 AI 모델을 사용하여 새로운 데이터에 대한 예측이나 결과를 생성하는 과정이다. 서비스 단계에서 사용자가 입력한 질문에 답변을 생성하는 등의 실제 응용 단계에 해당한다.
캐즘
chasm
새로운 기술이 초기 시장에서 주류 시장으로 넘어가는 과정에서 겪는 일시적인 수요 정체나 단절 현상을 의미한다. 이를 극복해야만 대중적인 성공과 실질적인 경제적 가치 창출이 가능하다.
커널
kernel
GPU와 같은 가속기에서 실행되는 가장 작은 단위의 연산 프로그램이다. 행렬 곱셈 등 특정 수학적 연산을 하드웨어에 최적화하여 실행하도록 설계되며 AI 모델의 전체 성능을 결정짓는 핵심 요소이다.
쿠다
cuda
엔비디아가 개발한 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델이다. GPU의 연산 능력을 그래픽 외의 범용 계산에 활용할 수 있게 하여 현대 딥러닝 학습과 추론의 표준 인프라로 자리 잡았다.
쿼터
quota
특정 기간 동안 허용된 최대 사용량이나 할당량을 의미한다. LLM API 서비스에서 제공하는 무료 또는 유료 사용 한도를 지칭한다.
클립
clip
이미지와 텍스트를 동일한 벡터 공간에 매핑하여 상호 비교를 가능하게 하는 모델이다. 이미지의 시각적 특징을 텍스트로 이해하거나 그 반대의 작업을 수행하는 데 핵심적인 역할을 한다.
탈옥
jailbreak
프롬프트 엔지니어링을 통해 모델의 안전 가이드라인을 우회하여 금지된 답변을 유도하는 기법이다. 모델 내부의 가중치를 바꾸는 것이 아니라 입력값의 맥락을 조작하여 거부 메커니즘을 속이는 방식이다. 모델 자체의 구조는 변하지 않으므로 가중치 수정과는 차이가 있다.
텐서
tensor
다차원 배열 형태의 데이터 구조로 딥러닝 모델의 기본 연산 단위이다. 생명 과학 AI에서는 복잡한 생물학적 특성을 수치화하여 표현하고 검색 엔진에서 고속 연산을 수행하는 데 활용된다.
토큰
token
AI가 텍스트를 처리하는 기본 단위로, 단어나 문자 뭉치에 해당한다. 모델의 처리 용량은 글자 수가 아닌 토큰 수를 기준으로 계산되며, 언어와 모델에 따라 토큰화 방식이 다르다.
패딩
padding
서로 다른 길이의 문장들을 하나의 직사각형 텐서로 만들기 위해 짧은 문장에 의미 없는 토큰을 채워 넣는 작업이다. 추론 시 불필요한 연산을 유발하여 효율을 저하시키는 원인이 된다.
페처
fetcher
사용자의 질문에 답하기 위해 실시간으로 외부 웹 페이지의 데이터를 가져오는 AI 봇의 일종이다. 정기적으로 인덱싱을 수행하는 크롤러와 달리, 추론 시점에 즉각적인 데이터가 필요할 때 작동하며 웹 서버에 실시간 부하를 준다.
폴백
fallback
특정 하드웨어 가속기(NPU)가 연산을 처리할 수 없을 때 다른 범용 프로세서(CPU)로 작업을 넘기는 동작이다. 실행 안정성은 확보되나 성능 저하와 수치적 결과 차이를 유발한다.
표절
plagiarism
타인의 저작물이나 아이디어를 자신의 것인 것처럼 무단으로 사용하는 행위로, 오픈소스 생태계에서는 라이선스 위반과 직결되는 심각한 문제이다.
회귀
regression
소프트웨어의 특정 부분을 수정하거나 기능을 추가했을 때, 이전에 정상적으로 작동하던 다른 기능에 오류가 발생하는 현상이다. AI 시스템에서는 프롬프트 수정이 의도치 않은 부작용을 낳는 형태로 자주 나타난다.
가상화
virtualization
물리적인 하드웨어 자원을 논리적으로 분리하여 여러 개의 가상 시스템을 운영할 수 있게 하는 기술이다. BIOS 수준에서 활성화되어야 Docker나 WSL2 같은 가상화 소프트웨어가 정상 작동한다.
강건성
robustness
시스템이 입력의 변화나 환경의 불확실성, 오류 상황에서도 성능을 유지하거나 안전하게 작동하는 능력이다. 강화학습에서는 훈련 시 보지 못한 노이즈나 섭동(Perturbation)에 대응하는 능력을 의미한다.
개인화
personalization
사용자의 과거 행동, 선호도, 스타일 등을 학습하여 개별 사용자에게 최적화된 결과물을 제공하는 기술이다. AI 맥락에서는 사용자의 고유한 말투나 업무 방식을 모방하여 더 자연스럽고 유용한 응답을 생성하는 것을 의미하며, 사용자 만족도와 도구 수용도를 높이는 핵심 요소이다.
게임화
gamification
게임이 아닌 분야에 게임의 메커니즘과 요소를 접목하여 사용자의 관심과 참여를 유도하는 기법이다. Character.ai는 퀘스트와 보상 시스템을 통해 사용자가 플랫폼 내에서 더 많은 활동을 하도록 장려한다.
결정론
determinism
모든 사건이 이전의 상태와 물리 법칙에 의해 필연적으로 결정된다는 이론이다. 인간의 선택도 물리적 인과관계의 결과로 보아 자유의지와 대립하는 개념으로 논의된다.
경두개
transcranial
두개골을 통과하거나 가로지르는 방식을 의미한다. 이 장치는 뇌를 직접 뚫지 않고 두개골 위에서 빛을 쏘아 내부 뉴런을 자극하는 비침습적 접근을 취한다.
경사도
gradient
함수의 출력값이 가장 가파르게 증가하는 방향을 나타내는 벡터로, ML 모델 학습 시 손실 함수를 최소화하기 위해 가중치를 업데이트하는 방향을 결정한다.
공급망
supply-chain
원자재부터 최종 제품까지의 생산 및 유통 과정을 의미하며, 현대 기술 산업에서는 국가 간의 지정학적 영향력을 행사하는 핵심 요소로 작용한다.
공변량
covariate
종속 변수에 영향을 줄 수 있는 독립 변수나 외부 정보를 의미한다. 이 논문에서는 클러스터의 형성이나 데이터의 분포가 이러한 외부 조건에 따라 어떻게 변하는지를 모델링하는 핵심 요소로 사용된다.
과적합
overfitting
모델이 학습 데이터의 노이즈나 세부 사항까지 과하게 학습하여 새로운 데이터에 대한 예측 성능이 떨어지는 현상이다. 데이터 증강은 이를 방지하기 위해 데이터의 다양성을 인위적으로 높인다.
관용성
idiomaticity
언어 표현이 해당 언어 공동체의 관습에 비추어 얼마나 자연스럽고 원어민스러운지를 나타내는 척도이다. 문법적으로 옳더라도 관용성이 낮으면 어색하게 느껴질 수 있다.
관측성
observability
시스템의 내부 상태를 외부 출력(로그, 메트릭, 트레이스 등)을 통해 파악할 수 있는 능력을 의미한다. LLM 애플리케이션에서는 프롬프트와 응답의 흐름을 추적하여 성능을 모니터링하는 데 사용된다.
구간화
binning
연속적인 수치 데이터를 특정 범위로 나누어 범주형 데이터처럼 처리하는 전처리 기법이다. 이를 임베딩과 결합하면 수치 데이터의 비선형적인 패턴을 더 잘 포착할 수 있다.
구문론
syntax
언어의 구조와 규칙, 패턴 인식을 다루는 학문 분야로, AI 맥락에서는 토큰 간의 통계적 배열 규칙과 기호 조작 체계를 의미한다.
구성성
compositionality
복잡한 개념이나 기술을 더 단순하고 친숙한 부분들의 조합으로 이해하고 생성하는 능력이다. 뇌가 기존 지식을 재활용해 새로운 작업을 빠르게 배우는 핵심 원리이며, AI의 유연성을 높이는 중요한 연구 주제이다.
군집화
clustering
데이터들 사이의 유사성을 측정하여 비슷한 특징을 가진 데이터끼리 그룹으로 묶는 비지도 학습 기법이다. 이 아티클에서는 수만 개의 텍스트 로그를 유사한 주제나 패턴별로 자동 분류하는 데 사용된다.
기가팬
gigapan
로봇 카메라 마운트와 소프트웨어를 결합하여 수천 장의 사진을 촬영하고 이를 하나의 거대한 초고해상도 이미지로 합성하는 시스템이다. 일반적인 사진으로는 담기 힘든 극도의 세부 사항을 기록할 수 있어 정밀한 아카이빙에 필수적이다.
기스트
gist
GitHub에서 제공하는 코드 조각 공유 서비스로, 단일 파일이나 짧은 스크립트를 간편하게 배포하고 관리할 수 있게 해준다.
넷투넷
net2net
기존 신경망의 지식을 보존하면서 더 큰 네트워크로 확장하는 전이 학습 기법이다. 가중치를 복사하거나 항등 함수를 사용하여 확장 직후에도 성능 저하가 없는 초기화를 가능하게 한다.
노이즈
noise
데이터 내에서 실제 신호(Signal)를 가리는 무의미하거나 무작위적인 변동 사항이다. 무작위적이거나 계통적인 오류로 발생하며 모델이 데이터의 본질적인 패턴을 학습하는 것을 방해하는 요소이다.
노코드
no-code
코딩 없이 그래픽 인터페이스를 통해 소프트웨어를 개발하는 방식이다. 비전문가도 복잡한 로직을 구현할 수 있게 하여 기술 장벽을 낮추고 개발 민주화를 이끄는 중요한 역할을 한다.
노트북
notebook
코드, 실행 결과, 설명 텍스트를 하나의 문서에 통합하여 공유하고 실행할 수 있는 대화형 개발 환경이다. Kaggle에서 기술적 깊이를 전달하고 실습을 진행하는 핵심 도구로 사용되며, 이번 코스에서 330만 회 이상의 조회수를 기록했다.
뉴스룸
newsroom
신문사나 방송사에서 기사를 작성, 편집, 제작하는 핵심 공간 또는 조직이다. 현대에는 디지털 기술을 활용해 실시간으로 정보를 처리하고 배포하는 시스템 전체를 포괄하기도 한다.
단축키
shortcut
긴 명령어나 복잡한 과정을 짧은 키 입력이나 명령어로 실행하는 기능이다. Brave Leo에서는 '/' 기호 뒤에 이름을 붙여 프롬프트를 즉시 호출하는 용도로 쓰인다.
당혹도
perplexity
언어 모델이 다음 토큰을 얼마나 잘 예측하는지 나타내는 지표로 값이 낮을수록 모델의 예측 성능이 좋음을 의미한다. 확률 분포의 불확실성을 측정하며 모델 간의 성능 비교에 필수적인 척도로 활용된다.
대각화
diagonalization
행렬을 대각 성분만 존재하는 대각 행렬과 가역 행렬의 곱으로 표현하는 과정이다. 복잡한 행렬 연산을 단순한 스칼라 곱의 형태로 변환하여 계산 효율성을 극대화한다.
도클링
docling
IBM에서 개발한 오픈소스 문서 파싱 도구로, PDF나 이미지 등 복잡한 문서를 AI가 처리하기 좋은 마크다운 형식으로 변환한다. 레이아웃 분석과 OCR을 결합하여 문서의 구조를 정확하게 파악하는 것이 특징이다.
딥러닝
deep-learning
인간의 뇌 구조를 모방한 인공 신경망을 통해 대량의 데이터에서 패턴을 학습하는 AI 기술이다. 이미지 인식, 자연어 처리, 예술품 복원 등 복잡한 비정형 데이터를 분석하고 생성하는 데 탁월한 성능을 발휘한다.
딥씽크
deepthink
모델이 복잡한 추론 과정을 거치도록 설계된 연구용 계층으로, 더 긴 사고 시간을 할애하여 정답률을 높이는 기법이다. 오픈AI의 o1 모델과 유사한 추론 강화 접근 방식이다.
라우팅
routing
입력된 데이터의 특성에 따라 가장 적합한 처리 경로를 동적으로 결정하는 메커니즘이다. 시스템이 모든 상황을 하나의 로직으로 처리하지 않고 전문화된 하위 시스템으로 분산시켜 효율성을 극대화한다.
라이다
lidar
레이저를 발사해 물체까지의 거리와 형상을 측정하는 센서로, 자율주행이나 로봇의 공간 인지에 필수적이다. 고정밀 3D 지도를 생성하거나 장애물을 회피하는 데 사용된다. 체화된 AI 시스템에서 주변 환경의 기하학적 구조를 파악하는 핵심적인 역할을 수행한다.
런타임
runtime
프로그램이 실행되는 환경이나 계층을 의미하며, 여기서는 AI 모델의 추론 결과가 실제 운영체제 명령으로 변환되어 수행되는 제어 계층을 뜻한다. AI의 추상적인 계획을 구체적인 시스템 동작으로 연결하는 가교 역할을 한다.
레드팀
red-teaming
조직이나 시스템의 보안 취약점을 찾기 위해 적대적인 관점에서 공격을 시뮬레이션하는 전문 팀 또는 활동이다. AI 분야에서는 모델이 유해한 답변을 생성하거나 보안을 우회하는 경로를 찾는 테스트 과정을 의미한다.
렌더링
rendering
2D 또는 3D 데이터를 시각적인 이미지로 변환하는 과정이다. AI 환경에서는 스케치 단계의 밑그림에 조명, 그림자, 질감 등을 입혀 완성된 작품으로 만드는 단계를 의미한다.
로크르
lokr
LoRA의 파생 기법으로 크로네커 곱(Kronecker product)을 이용해 행렬을 분해하며, 더 적은 파라미터로 세밀한 특징을 학습하는 데 유리하다.
리랭킹
re-ranking
초기 검색 결과의 순위를 더 정밀한 모델을 사용하여 다시 조정함으로써, 사용자 질문에 가장 적합한 답변이 상단에 오도록 정확도를 높이는 과정이다.
리랭킹
reranking
1차 검색을 통해 얻은 결과물들의 순위를 다시 매겨 가장 관련성이 높은 정보를 상단에 배치하는 과정이다. 초기 검색의 정밀도를 보완하여 최종 답변의 품질을 직접적으로 향상시킨다.
리믹싱
remixing
기존의 코드나 프로젝트를 복제하여 자신만의 방식으로 수정하고 발전시키는 행위다. Replit과 같은 플랫폼에서 다른 사용자의 프로젝트를 기반으로 새로운 기능을 추가하거나 개선할 때 주로 사용된다.
리액트
react
Reasoning + Acting의 약자로, 모델의 추론 과정과 외부 도구 활용을 결합한 프레임워크입니다. 에이전트가 상황을 판단하고 행동한 뒤 결과를 관찰하며 다음 단계를 결정하게 합니다.
리텐션
retention
사용자가 서비스를 처음 이용한 후 지속적으로 다시 방문하여 사용하는 비율을 의미한다. 퀘스트와 같은 보상 시스템은 사용자가 매일 앱에 접속하게 만드는 강력한 리텐션 도구로 작용한다.
마스킹
masking
영상이나 이미지의 특정 부분만을 선택하여 효과를 적용하거나 보호하는 기법이다. AI 영상 제작에서는 특정 객체의 형태를 유지하거나 배경만 변경할 때 주로 사용된다.
멀티턴
multi-turn
사용자와 AI가 한 번의 질문과 답변으로 끝내지 않고, 이전 대화의 맥락을 유지하며 여러 차례 대화를 주고받는 방식이다. 대화가 길어질수록 맥락 유지와 오류 관리가 어려워진다.
모멘텀
momentum
기술이나 제품이 시장에서 얻는 추진력과 영향력을 의미한다. AI 분야에서는 개발자들의 채택률, 커뮤니티의 활성도, 새로운 기능의 출시 속도 등이 모멘텀을 결정하는 주요 요소로 작용한다.
민감도
sensitivity
실제 질병이 있는 환자 중 모델이 양성으로 정확하게 판별해낸 비율로, 의료 진단에서 위음성을 줄이는 데 핵심적인 지표이다.
밀도화
densification
학습 과정에서 정보가 부족한 영역에 새로운 가우시안을 추가하거나 큰 가우시안을 분할하여 상세도를 높이는 과정이다. 장면의 복잡도에 따라 적응적으로 파라미터 수를 조절하여 최적의 재구성 품질을 얻는 데 필수적이다.
백엔드
backend
특정 기능을 실제로 수행하는 하부 엔진이나 라이브러리를 의미한다. 이 아티클에서는 실제 미분 계산 알고리즘을 구현하여 연산을 수행하는 구체적인 라이브러리들을 지칭한다.
버블랩
bubblewrap
리눅스 환경에서 권한이 없는 사용자가 안전하게 샌드박스를 생성할 수 있게 해주는 경량 유틸리티이다. 컨테이너보다 가볍게 프로세스를 격리할 수 있어 로컬 에이전트 보안에 활용된다.
베스파
vespa
대규모 텍스트 검색, 벡터 검색, 머신러닝 추론을 실시간으로 처리하는 오픈소스 빅데이터 서빙 엔진이다. 구조화된 데이터와 비구조화된 데이터를 동시에 처리하는 능력이 뛰어나 AI 검색 서비스의 핵심 인프라로 사용된다.
병렬화
parallelization
여러 개의 작업을 동시에 처리하여 전체 수행 시간을 단축하는 기법이다. DisCIPL에서는 여러 소형 모델이 동시에 작업을 나누어 수행함으로써 효율을 높인다.
복셀화
voxelization
3D 메쉬 데이터를 3차원 격자 단위인 복셀(Voxel)로 변환하는 과정이다. 이 시스템에서는 복잡한 3D 형상을 로봇이 조립하기 쉬운 표준화된 모듈 단위로 분해하는 데 사용된다.
분류기
classifier
입력된 텍스트나 데이터를 특정 카테고리로 분류하는 소형 AI 모델입니다. 본문에서는 대화 중 자살 징후나 미성년자 여부를 실시간으로 감지하여 적절한 조치를 취하는 안전 장치로 활용됩니다.
불충족
unsat
주어진 논리적 제약 조건을 모두 만족하는 해가 존재하지 않는 상태를 의미하며 시스템이 전략을 수정해야 하는 신호로 사용된다.
뷰포트
viewport
3D 소프트웨어에서 모델이나 장면을 보여주는 작업 창이다. 사용자가 작업 중인 결과물을 실시간으로 확인하고 조작하는 핵심 인터페이스이다.
비퇴화
non-degenerate
수학적으로 특정 성질이 사라지거나 단순화되지 않은 일반적인 상태를 의미한다. 여기서는 복소수 뉴런이 가진 고유한 특성이 유지되어 실수 뉴런으로 대체될 수 없는 상태를 뜻한다.
비평가
critic
Actor-Critic 구조에서 에이전트가 취한 행동의 가치를 평가하는 역할을 한다. 상태 가치 함수를 학습하여 정책(Actor)이 더 나은 방향으로 업데이트되도록 가이드한다.
사카드
saccade
곤충이나 동물이 시선을 고정하거나 위치를 파악하기 위해 수행하는 급격하고 빠른 움직임이다. 로봇 공학에서는 급가속과 급감속을 동반한 민첩한 기동을 통해 센서 데이터의 유효성을 확보하는 데 활용된다.
사토시
sats
비트코인의 최소 단위(1억 분의 1 BTC)를 의미하며, 소액 결제 시스템에서 주로 사용되는 화폐 단위이다. UgarAPI의 서비스 비용은 이 단위를 기준으로 책정되어 매우 세밀한 과금이 가능하다.
색보정
color-grading
영상이나 이미지의 분위기와 톤을 조절하기 위해 색상을 보정하는 후반 작업 단계이다. 시각적 일관성을 높이고 특정 감정을 전달하는 데 중요한 역할을 한다.
샘플러
sampler
노이즈 상태에서 이미지를 단계적으로 복원해 나가는 알고리즘이다. 선택한 샘플러에 따라 이미지의 세부 질감, 생성 속도, 최종적인 시각적 느낌이 달라지므로 작업 목적에 맞는 선택이 필수적이다.
소실점
vanishing-point
3차원 공간의 평행한 선들이 2차원 평면에 투영될 때 한 점으로 모이는 지점이다. 자율 주행이나 로봇 내비게이션에서 진행 방향을 결정하는 핵심 지표로 활용된다.
수수료
commission
보험 중개인이 보험사로부터 받는 판매 보수로 고객의 이익보다 높은 보험료 유도 가능성이 있는 전통적인 수익 구조이다.
수용장
receptive-field
신경망의 한 뉴런이 입력 이미지에서 영향을 받는 국소적인 영역의 크기를 의미하며, 이 크기가 작으면 이미지 전체의 구조적 맥락을 파악하기 어렵다.
수익화
monetization
무료로 제공되던 서비스나 기술을 통해 실제 매출을 발생시키는 과정이다. AI 업계에서는 막대한 인프라 비용을 충당하기 위해 구독 모델이나 광고 도입 등의 수익화 전략이 필수적이다.
수축률
contraction-rate
데이터의 양이 증가함에 따라 사후 분포가 참값 주변으로 얼마나 빨리 집중되는지를 나타내는 지표이다. 모델의 수렴 속도와 통계적 효율성을 평가하는 핵심 척도이다.
숙명론
fatalism
통계 모델링에서 개체의 잠재적 결과가 처치 여부와 상관없이 이미 고정되어 있다고 가정하는 태도로, 행동이 미래 환경을 변화시키는 역동성을 간과한다.
스냅샷
snapshotting
특정 시점의 시스템 상태(메모리, 디스크 등)를 그대로 저장해 두었다가 나중에 해당 상태로 즉시 복원하는 기술로, 초기화 과정을 생략하게 해준다.
스코프
scope
특정 사용자나 에이전트가 접근할 수 있는 리소스와 수행 가능한 작업의 범위를 제한하는 권한 설정 단위이다. 최소 권한 원칙을 적용하여 시스템의 안전성을 높이는 데 필수적이다.
안티밈
antimeme
정보가 전파되는 것을 스스로 방해하거나 이해하기 매우 어려운 특성을 가진 개념을 의미한다. 본문에서는 시스템 수준의 사고가 왜 대중에게 확산되기 어려운지를 설명하는 핵심 비유로 사용된다.
알파칩
alphachip
강화학습을 활용하여 칩의 물리적 레이아웃을 자동으로 설계하는 구글의 AI 기술이다. 인간 설계자가 몇 달 걸릴 작업을 단 몇 시간 만에 수행하며, 더 효율적인 전력 소비와 성능을 가진 칩 설계를 가능하게 한다.
암묵지
tacit-knowledge
학습과 경험을 통해 몸에 쌓였으나 말이나 글로 표현하기 어려운 지식이다. 자전거 타기나 예술적 감각처럼 공식화하기 힘든 특성이 있어 AI가 데이터만으로 습득하기 가장 어려운 영역이다.
애드온
add-on
기본 소프트웨어에 특정 기능을 추가하기 위해 설치하는 보조 프로그램이다. Blender에서는 파이썬 스크립트 형태로 제작되어 작업 효율을 높인다.
앱월드
appworld
450개 이상의 API와 수백 개의 실제 작업을 포함하여 AI 에이전트의 실무 능력을 평가하는 고난도 벤치마크 데이터셋이다. 실제 환경에서의 도구 활용 능력과 문제 해결 과정을 검증한다.
약수렴
weak-convergence
확률 변수 열의 분포가 특정 분포로 수렴하는 개념으로 무한 차원 공간인 힐베르트 공간에서 추정량의 통계적 안정성을 증명할 때 사용된다.
양자화
quantization
모델의 가중치와 활성화 값을 표현하는 비트 수를 줄여 모델 크기를 압축하고 연산 속도를 높이는 기법이다. 부동 소수점 데이터를 정수형(INT8, INT4 등)으로 변환함으로써 메모리 사용량을 절감하고 하드웨어 가속기 활용도를 높인다.
에포크
epoch
학습 데이터셋 전체가 모델을 한 번 통과하는 횟수이다. 본 사례에서는 1,000번의 에포크를 수행하여 데이터의 특징을 깊게 학습시켰으며, 이는 학습 시간과 정밀도에 직결된다.
엔그램
n-gram
텍스트에서 연속된 n개의 단어 또는 문자의 묶음을 의미한다. 전통적인 자연어 처리에서 문장의 통계적 특성을 파악하거나 유사도를 측정하는 기본 단위로 활용된다.
엔그램
engram
딥시크 V4에 적용된 것으로 언급된 특정 기술 요소로, 모델의 기억이나 지식 저장 방식과 관련된 아키텍처적 특징을 의미한다. 모델이 정보를 더 효율적으로 유지하고 인출할 수 있게 돕는 역할을 한다.
엠대시
em-dash
문장에서 부연 설명이나 강조를 위해 사용하는 긴 대시(—) 기호이다. AI 모델이 문장을 연결하거나 구조화할 때 자주 남용하여 인위적인 느낌을 주는 지표로 활용되기도 한다.
역설계
reverse-engineering
기존 시스템의 구조를 분석하여 그 원리를 파악하고 재현하는 기법으로, SQI는 뇌의 작동 방식을 분석하여 이를 인공 지능 시스템에 적용하는 데 활용한다.
역전파
backpropagation
신경망 학습 시 출력층에서 발생한 오차를 입력층 방향으로 역전파하여 각 층의 가중치를 갱신하는 알고리즘이다. 미분의 연쇄 법칙을 활용해 오차에 대한 가중치의 기울기를 계산하며, 모델의 예측 정확도를 높이는 핵심 과정이다.
연주곡
instrumental
가사 없이 악기 연주로만 구성된 음악이다. AI 모델이 보컬 없이 조화로운 선율과 화음만 생성해야 하므로 가창 곡보다 정교한 제어가 요구되기도 한다.
오버쿡
overcooked
AI 모델이 특정 데이터에 과하게 학습되어 생성된 이미지의 질감이 거칠어지거나 색상이 왜곡되는 현상이다. 주로 학습 단계가 너무 많거나 학습률이 높을 때 발생한다.
온보딩
onboarding
새로운 팀원이나 도구가 프로젝트의 환경, 도구, 아키텍처, 규칙 등을 익히고 적응하는 과정이다. AI 코딩에서는 모델이 특정 코드베이스의 특수성을 이해하도록 만드는 초기 설정 단계를 뜻한다.
올라마
ollama
로컬 환경에서 Llama 3와 같은 오픈소스 LLM을 쉽게 설치하고 실행할 수 있게 해주는 도구이다. Deepdoc의 향후 지원 대상으로 언급되었으며 로컬 AI 워크플로우의 핵심이다.
운영화
operationalization
실험실 수준의 AI 모델이나 프로토타입을 실제 비즈니스 프로세스와 제품 환경에 통합하여 지속적으로 가동하는 과정이다. 단순한 기술 도입을 넘어 유지보수, 모니터링, 성과 측정이 가능한 인프라로 구축하는 것을 의미한다.
웨이바
waybar
리눅스 Wayland 컴포지터용으로 설계된 고도로 커스터마이징 가능한 상태 표시줄이다. 시스템 리소스나 네트워크 상태 등을 시각적으로 표시하는 데 사용된다.
유비콘
uvicorn
파이썬 웹 애플리케이션을 실행하기 위한 초고속 ASGI 서버 구현체이다. FastAPI와 함께 사용되어 웹 요청을 효율적으로 처리하고 실시간 리로딩 기능을 통해 개발 편의성을 높인다.
의미론
semantics
기호나 단어가 실제 세계의 대상이나 개념과 연결되는 '의미'를 연구하는 분야다. AI가 단순 확률을 넘어 대상의 본질을 이해하는 능력을 뜻한다.
의인화
anthropomorphism
인간이 아닌 대상에게 인간 고유의 성격이나 감정을 부여하는 심리적 현상이다. 사용자가 챗봇과 감정적 유대를 쌓는 현상의 근거가 된다. AI 기술의 실제 성능보다 사회적 수용도와 윤리적 논의에서 더 중요하게 다뤄진다.
이미치
immich
자가 호스팅이 가능한 오픈소스 사진 및 비디오 관리 솔루션으로, 구글 포토와 유사한 인터페이스와 얼굴 인식, 객체 탐지 기능을 제공한다.
이중성
duality
서로 다른 두 수학적 대상이나 문제 사이의 밀접한 대응 관계를 의미한다. 본 논문에서는 인과 모델의 최적화와 신경망 학습이 수학적으로 동일한 구조를 가짐을 뜻한다.
이행성
transitivity
인과 관계에서 A가 B에 영향을 주고 B가 C에 영향을 줄 때 A가 C에 직접 영향을 주는 것처럼 보이는 현상으로, 잠재 변수 식별을 어렵게 만든다.
일관성
consistency
이미지 생성 맥락에서 여러 장의 이미지를 만들 때 캐릭터의 외형이나 배경의 스타일이 변하지 않고 유지되는 성질을 의미한다. 이는 연속적인 스토리텔링이나 브랜드 자산 제작에서 매우 중요한 요소이다.
일반화
generalization
훈련 데이터가 아닌 새로운 데이터에 대해 모델이 얼마나 정확하게 예측하는지를 나타내는 능력이다. 훈련 데이터에만 과하게 최적화되는 과적합과 대비되는 개념이다.
임베딩
embedding
고차원의 이미지 데이터를 저차원의 수치 벡터로 변환하는 과정이다. 변환된 벡터 간의 거리를 계산하여 인물 간의 유사도를 판별하는 데 사용된다.
재식별
reid
서로 다른 카메라 뷰나 시간대에서 포착된 이미지가 동일 인물인지 확인하는 기술이다. 얼굴뿐만 아니라 의복, 체형, 보행 특징 등을 종합적으로 분석하여 식별한다.
재포장
repackaging
기존에 공개된 타사의 모델을 가져와 이름만 바꾸거나 미세한 수정 후 자사 모델인 것처럼 발표하는 행위를 뜻한다.
재현성
reproducibility
동일한 코드와 설정, 데이터를 사용했을 때 언제 어디서나 같은 결과를 얻을 수 있는 능력을 뜻하며 ML 실험의 신뢰성을 결정하는 핵심 요소이다.
재현율
recall
실제 존재하는 문제 중 모델이 찾아낸 비율로, 코드 리뷰에서는 버그를 놓치지 않고 잡아내는 능력을 뜻한다.
저궤도
low-earth-orbit
지구 표면에서 200km에서 2,000km 사이의 고도를 의미한다. 스타링크 위성이 배치되는 구간으로, 통신 지연 시간이 짧아 고속 인터넷 서비스에 유리하지만 우주 쓰레기 및 독점 문제가 제기된다.
정규화
normalization
데이터의 스케일을 조정하여 비교 가능한 형태로 만드는 작업이다. 확률 계산에서는 합을 1로 맞추어 확률 분포의 정의를 충족시키는 과정을 의미한다.
정규화
regularization
모델의 가중치에 제약을 가하여 복잡도를 줄임으로써, 학습 데이터에만 과하게 최적화되는 오버피팅을 방지하고 일반화 성능을 높이는 기법이다.
정답셋
ground-truth
모델의 성능을 평가하기 위해 기준으로 삼는 실제 정답 데이터를 의미한다. RAG 시스템에서는 특정 질문에 대해 반드시 검색되어야 하는 문서나 올바른 답변의 쌍을 구성하여 벤치마크에 활용한다.
정밀도
precision
모델이 참이라고 예측한 것 중 실제 참인 비율로, 코드 리뷰에서는 잘못된 지적(소음)이 적음을 의미한다.
정반사
specular-reflection
매끄러운 표면에서 빛이 한 방향으로 반사되어 센서가 정확한 거리 정보를 측정하지 못하게 방해하는 현상이다. 금속이나 플라스틱 부품이 담긴 빈 피킹 환경에서 데이터 결측을 일으키는 주요 원인으로 꼽힌다. 이를 해결하기 위해 추가적인 알고리즘 보정이 필요하다.
정지점
stationary-point
함수의 기울기가 0이 되는 지점으로, 최적화 알고리즘이 해를 찾았을 때 도달하는 지점을 의미하며 알고리즘의 수렴 여부를 판단하는 기준이 된다.
정형화
formalization
자연어로 된 문장이나 문제를 수학적 기호나 프로그래밍 언어와 같은 엄격한 규칙을 가진 정형 언어로 변환하는 과정이다. 이를 통해 모호성을 제거하고 논리적 검증이 가능해지며, AI 모델이 복잡한 추론을 정확하게 수행하도록 돕는다.
제로샷
zero-shot
모델에게 해결해야 할 작업에 대한 예시나 추가 학습 데이터를 제공하지 않고, 오직 자연어 설명만으로 즉시 작업을 수행하도록 요청하는 방식이다. 모델의 기초적인 추론 능력을 테스트할 때 주로 사용된다.
제이슨
json
데이터를 저장하거나 전송할 때 사용하는 경량의 데이터 형식이다. 사람이 읽기 쉽고 기계가 분석하기 용이하여, 이번 유출 사례처럼 서버와 클라이언트 간의 설정값이나 가격 정보를 전달하는 데 널리 쓰인다.
조크트
zoekt
구글에서 개발한 트리그램(trigram) 기반의 고성능 코드 검색 엔진이다. 텍스트를 3글자 단위로 인덱싱하여 수십억 줄의 코드에서도 밀리초 단위의 정규표현식 검색을 가능하게 하는 Sourcegraph의 핵심 기술이다.
조합론
combinatorics
유한한 대상들의 집합에서 특정 조건을 만족하는 배열이나 조합의 가짓수를 세는 수학의 한 분야이다. 통계학에서 확률을 산출할 때 모든 가능한 경우의 수를 파악하는 기초 도구로 활용되며, 표본 추출의 논리적 근거를 제공한다.
종횡비
aspect-ratio
이미지의 가로 길이와 세로 길이 사이의 비율을 의미한다. AI 모델 학습 시 특정 종횡비를 유지해야 하는 경우가 많아 리사이징 과정에서 이를 고정하고 크롭하는 기능이 중요하다. 모델의 출력 품질과 학습 효율에 직접적인 영향을 미치는 요소이다.
주변화
marginalization
결합 확률 분포에서 특정 변수를 제거하여 나머지 변수들에 대한 확률 분포를 구하는 과정입니다. 인과 모델에서 관찰되지 않는 잠재 변수의 영향을 배제하고 관측 가능한 데이터만으로 분석을 수행할 때 필수적인 수학적 연산입니다.
지속성
persistence
프로그램이 종료되어도 데이터가 사라지지 않고 유지되는 특성을 의미한다. OpenClaw는 마크다운 파일을 활용해 대화 맥락과 기억을 저장함으로써 세션이 끊겨도 이전 상태를 복구할 수 있게 한다.
지터링
jittering
데이터 신호나 영상의 랜드마크가 미세하고 불규칙하게 흔들리는 현상이다. 포즈 추정에서 모델의 예측값이 프레임마다 조금씩 달라질 때 발생하며 고속 동작에서 특히 심해져 분석의 정확도를 떨어뜨린다.
진음성
true-negative
모델이 실제로 음성인 데이터를 정확하게 음성으로 판정한 결과이다. 나무 식별 모델에서는 바다나 건물처럼 나무가 없는 영역을 나무가 아니라고 정확히 판단하는 것을 의미한다. 모델의 정밀도를 높이고 오탐지를 줄이는 데 필수적인 학습 요소이다.
처리량
throughput
단위 시간당 시스템이 처리할 수 있는 작업의 양을 의미한다. LLM 추론에서는 초당 생성되는 총 토큰 수로 측정하며 서비스의 경제성과 직결되는 지표이다.
코덱스
codex
프로그래밍 코드 생성 및 이해에 특화된 대규모 언어 모델 시리즈이다. 자연어 명령을 코드로 변환하거나 기존 코드의 버그를 수정하는 등 개발자의 생산성을 극대화하는 데 중점을 두며, 오픈AI의 핵심 기술 라인업 중 하나이다.
코워스
cowos
Chip on Wafer on Substrate의 약자로, 여러 개의 칩을 하나의 패키지 위에 정밀하게 통합하는 TSMC의 고성능 패키징 기술이다. 현재 AI 가속기 생산의 핵심적인 물리적 병목 지점으로 꼽힌다.
코호트
cohort
특정 기간 동안 공통된 특성이나 경험을 공유하는 사용자 또는 환자 집단을 의미한다. 임상 시험 설계 시 방대한 데이터에서 조건에 맞는 환자군을 정확히 검색해내는 것이 매우 중요하다.
큐비트
qubit
양자 컴퓨터의 기본 정보 단위이다. 0과 1의 상태를 동시에 가질 수 있는 중첩 특성을 이용해 복잡한 계산을 병렬로 처리하며, 양자 컴퓨팅 성능의 핵심 지표가 된다.
탐욕법
greedy-algorithm
매 순간마다 당장 최선이라고 생각되는 선택을 하는 알고리즘 설계 기법이다. 전체적인 최적해를 보장하지는 않지만 계산 속도가 매우 빠르며, 복잡한 문제의 초기 해를 생성하는 데 자주 사용된다.
트리톤
triton
오픈에이아이가 개발한 GPU 프로그래밍 언어로 CUDA보다 작성하기 쉬우면서도 높은 성능을 제공한다. 다양한 하드웨어에서 동일한 커널 코드를 실행할 수 있게 하여 AI 모델의 추론 및 학습 효율을 최적화하는 데 필수적이다.
판매율
sell-through
특정 기간 동안 입고된 전체 재고 대비 실제로 판매된 수량의 비율을 의미한다. 재고 회전 효율성을 측정하는 핵심 지표로 AI 에이전트의 재고 관리 성능을 평가하는 주요 기준으로 사용된다.
퍼페토
perfetto
시스템 전체의 성능을 분석하기 위한 오픈 소스 트레이싱 도구이다. 타임라인 기반으로 하드웨어 자원 사용 현황을 시각화하여 병목 현상을 진단하고 최적화 기회를 찾는 데 사용된다.
페이스
faiss
수밀리언 개의 벡터 중에서 유사한 항목을 빠르게 찾아주는 라이브러리이다. 대량의 이미지 임베딩 데이터를 실시간으로 검색하거나 클러스터링할 때 필수적이다.
포버트
phobert
베트남어 처리에 최적화된 RoBERTa 기반의 사전 학습 언어 모델로, 단어 단위가 아닌 음절 단위의 토큰화를 사용하여 베트남어의 특성을 잘 반영한다.
표제어
lemma
단어의 기본 사전형으로, 'dogs'나 'dogged'의 기본형인 'dog'를 의미하며 텍스트 분석에서 단어의 의미를 통일하는 기본 단위이다.
풀스택
full-stack
웹 애플리케이션의 사용자 화면(프런트엔드)과 서버 로직 및 데이터베이스(백엔드)를 모두 포함하는 개발 영역이다. 에이전틱 빌더는 이 두 영역을 통합하여 하나의 결과물로 만들어낸다.
프리셋
preset
특정 스타일이나 효과를 내기 위해 미리 설정된 파라미터나 프롬프트의 조합이다. 사용자가 매번 복잡한 명령어를 입력할 필요 없이 클릭 한 번으로 의도한 시각적 결과를 얻을 수 있게 돕는 템플릿 역할을 한다.
프리필
prefill
사용자가 입력한 전체 프롬프트를 한꺼번에 처리하여 첫 번째 출력 토큰을 준비하는 단계이다. 이후 한 토큰씩 생성하는 디코딩 단계보다 연산 집중도가 높다.
프리필
pre-fill
LLM 추론의 첫 단계로, 입력된 전체 프롬프트를 한꺼번에 처리하여 이후 토큰 생성에 필요한 KV 캐시를 생성하는 과정이다. 연산 집약적인 특성을 가진다.
플럭스
flux
Black Forest Labs에서 개발한 최신 이미지 생성 모델로, 높은 품질과 복잡한 프롬프트 이해도를 갖추고 있어 스테이블 디퓨전의 대안으로 주목받고 있다.
핀옵스
finops
클라우드 및 AI 리소스 사용 비용을 가시화하고 최적화하여 비즈니스 가치를 극대화하는 관리 체계이다. 에이전트의 토큰 사용량 등 운영 비용 관리가 핵심이다.
하네스
harness
AI 모델의 성능을 특정 작업에 맞춰 평가, 테스트 및 최적화하기 위해 구축된 전용 실행 환경이다. 모델이 실제 애플리케이션에서 최상의 결과를 내도록 돕는 인프라 역할을 한다.
학습률
learning-rate
모델이 가중치를 업데이트할 때 적용하는 보폭을 결정하며, 너무 크면 최적점을 지나치고 너무 작으면 학습이 지나치게 느려진다.
항상성
homeostasis
외부 환경의 변화에도 불구하고 시스템 내부의 상태를 일정하게 유지하려는 성질이다. 제어 이론에서는 안정성 분석을 통해 시스템이 원하는 작동 지점에 머물게 하는 원리로 해석된다.
해결률
resolution-rate
AI 에이전트가 제안한 버그 수정 사항이 실제 코드 머지 시점에 반영되었는지를 측정하는 지표이다. 단순한 버그 발견을 넘어 실질적인 문제 해결 기여도를 정량화하여 모델 성능 개선의 핵심 지표로 활용된다.
형태학
morphology
생물체의 구조와 형태를 연구하는 학문으로, 혈액 진단에서는 세포의 크기, 핵의 모양, 세포질의 상태 등 외형적 특징을 분석하여 이상 여부를 판단함.
확장성
scaling
모델의 크기나 학습 데이터의 양을 늘렸을 때 성능이 비례하여 향상되는 능력을 의미한다. 대규모 의료 데이터를 효율적으로 학습하여 다양한 질환과 영상 유형에 대응할 수 있는 범용 모델을 구축하는 데 핵심적인 요소이다.
희소성
sparsity
데이터나 모델의 파라미터 중 대부분이 0이거나 유의미하지 않은 상태를 말한다. 고차원 데이터 분석 시 중요한 변수만을 선택하여 모델의 복잡도를 줄이고 해석력을 높이는 데 핵심적인 개념이다.
가드레일
guardrails
AI가 자율적으로 행동할 때 넘지 말아야 할 상업적 또는 운영적 제약 조건이다. 가격 할인 폭의 상한선이나 최소 마진율 등을 설정하여 자율 시스템의 리스크를 방지한다.
가드레일
guardrail
AI 모델이 유해하거나 금지된 정보를 생성하지 않도록 설정한 제약 조건이다. 텍스트 필터링이나 특정 주제에 대한 답변 거부 등의 방식으로 작동한다.
강화학습
reinforcement-learning
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 행동을 학습하는 방법이다. 웨이모의 시뮬레이션 환경에서 드라이버 모델이 안전한 주행 전략을 익히는 핵심 메커니즘으로 쓰인다.
거버넌스
governance
기업 내에서 자동화 프로세스와 사용자 권한, 보안 정책 등을 체계적으로 관리하고 통제하는 체계이다. 자동화가 확산됨에 따라 발생할 수 있는 관리 부재와 보안 위험을 방지하는 역할을 한다.
계몽주의
enlightenment
18세기 유럽에서 발생한 지적 운동으로 이성 중심의 사고를 강조했다. 본문에서는 서신 교환을 통해 지식이 공유되고 공동체의 지혜가 형성된 역사적 사례로 인용되었다.
고유기저
eigenbasis
특정 선형 변환의 고유벡터들로 이루어진 기저이다. 이 기저 위에서 변환을 바라보면 행렬이 가진 고유한 특성과 변화의 방향성을 가장 직관적으로 파악할 수 있다.
광수용체
photoreceptor
빛 에너지를 전기 신호로 변환하는 생물학적 세포로, 망막에 존재한다. 디지털 카메라의 이미지 센서와 유사한 역할을 하며, 진화 과정에서 시각 시스템이 형성되는 기초가 되었다.
광유전학
optogenetics
빛에 반응하는 단백질을 특정 뉴런에 발현시켜 빛으로 신경 세포의 활동을 정밀하게 제어하는 기술이다. 유전공학과 광학 기술을 결합하여 특정 뇌 회로의 기능을 연구하거나 조절하는 데 필수적이다.
그라운딩
grounding
AI 모델의 출력을 실제 세계의 사실, 데이터 또는 특정 도메인의 지식과 연결하는 과정이다. 모델이 허구의 정보를 생성하는 환각 현상을 방지하고 정확성을 높이는 데 중요하다.
그린워싱
greenwashing
기업이 실제로는 환경에 악영향을 끼치면서도 광고나 홍보를 통해 친환경적인 이미지를 내세우는 행위를 의미한다. AI 분야에서는 기술의 탄소 배출이나 에너지 소비 같은 환경적 비용은 숨기고 기후 위기 해결사라는 이미지만 강조하는 맥락에서 비판적으로 사용된다.
극초음속
hypersonics
음속의 5배(마하 5) 이상의 속도로 비행하는 기술을 의미한다. 매우 빠른 속도와 변칙적인 궤도로 인해 기존 미사일 방어 체계로 요격하기 어려워 현대 국가 안보의 핵심 기술로 꼽힌다.
나노와트
nanowatt
10억 분의 1 와트에 해당하는 전력 단위로, 극저전력 회로 설계의 효율성을 나타내는 지표로 사용된다.
뉴럴리즈
neuralese
AI 모델들이 서로 통신하기 위해 생성하는 인간이 이해할 수 없는 형태의 효율적인 내부 언어를 의미한다.
도그푸딩
dogfooding
기업이 개발 중인 제품을 내부 직원들이 직접 사용하며 결함을 찾고 성능을 검증하는 방식이다. 앤스로픽 엔지니어들이 클로드 코드를 사용해 코워크를 만든 것이 대표적인 사례이다.
드롭아웃
dropout
학습 시 신경망의 일부 뉴런을 무작위로 비활성화하여 특정 뉴런에 대한 의존도를 낮추는 기법이다. 훈련 시에만 적용되어 모델의 앙상블 효과를 내고 과적합을 방지한다. 훈련 손실이 검증 손실보다 높게 나타나게 만드는 주요 요인 중 하나이다.
디노이즈
denoise
이미지 생성 과정에서 노이즈를 제거하며 디테일을 형성하는 강도를 조절하는 파라미터이다. 값이 낮을수록 원본 구조를 유지하며, 높을수록 새로운 디테일이 많이 추가된다.
딥페이크
deepfake
인공지능 기술을 활용해 특정 인물의 얼굴이나 목소리를 다른 영상에 정교하게 합성하여 실제처럼 보이게 만드는 기술이다. 주로 악의적인 허위 사실 유포나 성착취물 제작에 악용되어 사회적 문제가 된다.
랜드마크
landmark
이미지 내에서 특징이 되는 지점으로 포즈 추정에서는 주로 신체의 주요 관절 부위를 의미한다. 이 점들의 좌표를 연결하여 인체의 골격 구조를 파악하고 움직임을 추적하는 기초 데이터로 활용한다.
런레이트
run-rate
현재의 매출 추세가 미래에도 지속될 것이라고 가정하고 계산한 연간 예상 매출액이다. Anthropic의 성장 지표를 설명하며 기업의 현재 성장 속도를 가늠하는 지표로 사용된다.
레드라인
red-lines
AI 모델이 생성하거나 수행해서는 안 되는 위험한 작업의 한계선을 의미한다. 생화학 무기 제조 지원이나 사이버 공격 보조 등이 대표적인 예시이다. 앤스로픽과 같은 기업은 이 선을 엄격히 지키려 했으나 OpenAI는 군사 협력을 위해 이를 완화했다는 비판을 받는다.
레드코드
redcode
Core War 게임에서 사용되는 특수한 어셈블리 언어다. 프로그램이 자신의 코드를 직접 수정하거나 다른 프로그램의 메모리 영역에 데이터를 쓰는 등의 저수준 제어가 가능하다.
레플리카
replica
데이터와 연산 자원의 복제본이다. 동일한 데이터를 여러 노드에 복제하여 가용성을 높이고, 읽기 요청을 분산 처리함으로써 전체적인 QPS 성능을 향상시킨다.
리라이팅
relighting
이미지 내 특정 객체의 조명 조건을 사후에 변경하는 기술이다. 합성 시 전경과 배경의 광원을 일치시켜 이질감을 줄이는 데 핵심적인 역할을 하며 AI 모델을 통해 그림자와 반사광을 재계산한다.
리트리버
retriever
비정형 쿼리에 대해 관련 문서를 찾아 반환하는 인터페이스이다. 벡터 데이터베이스 등에서 질문과 유사한 텍스트 청크를 추출하는 역할을 수행한다.
리팩터링
refactoring
소프트웨어의 외부 동작은 유지하면서 내부 구조를 개선하여 가독성을 높이고 유지보수를 용이하게 만드는 작업이다.
마크다운
markdown
텍스트 기반의 경량 마크업 언어로, 문서의 구조(제목, 목록 등)를 간단한 기호로 표현한다. LLM이 문서 구조를 이해하기에 가장 적합한 형식 중 하나이다.
매개변수
parameter
AI 모델에게 특정 명령이나 제약 조건을 전달하기 위해 프롬프트 뒤에 붙이는 추가 설정값이다. 미드저니에서는 --cw(캐릭터 가중치)나 --ar(화면 비율) 등이 대표적이며 생성 결과물의 특성을 결정짓는 중요한 요소이다.
멀티모달
multimodal
텍스트, 이미지, 음성 등 다양한 형태의 데이터를 동시에 처리하고 생성하는 기술이다. 이 아티클에서는 텍스트 서사에 시각적 요소를 결합하여 더 풍부한 사용자 경험을 만드는 데 활용된다.
멀티모달
multi-modal
텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 이해하고 생성할 수 있는 능력이다. GPT-5.2와 같은 최신 모델은 여러 감각 데이터를 통합하여 더 복잡한 상황 맥락을 파악할 수 있다.
메가커널
megakernel
여러 개의 작은 GPU 연산(Kernel)을 하나의 큰 커널로 묶어서 실행하는 기술이다. 커널 간의 데이터 이동 오버헤드를 줄이고 GPU의 병렬 처리 능력을 더 효율적으로 사용할 수 있게 해준다.
메시지팩
msgpack
JSON과 유사하지만 더 작고 빠른 바이너리 기반의 객체 직렬화 형식이다. 텍스트 기반 형식보다 데이터 크기를 줄일 수 있어 네트워크 전송이나 저장 효율을 높이는 데 널리 사용된다.
모노레포
mono-repo
여러 프로젝트나 라이브러리의 코드를 하나의 저장소에서 관리하는 방식으로, 전체 구조가 복잡하여 AI가 맥락을 파악하기 위해 매우 넓은 컨텍스트가 요구된다.
모달리티
modality
치료제가 작용하는 물리적 형태나 방식(예: 소분자 화합물, 항체, 유전자 치료제 등)을 의미하며, 질병 타겟에 따라 적절한 모달리티 선택이 필수적이다.
무드보드
mood-board
디자인 컨셉이나 분위기를 전달하기 위해 이미지, 텍스트, 색상 등을 모아놓은 시각적 도구이다. 프로젝트 초기 단계에서 클라이언트와 시각적 방향성을 합의하는 데 사용된다.
무상태성
statelessness
서버가 클라이언트의 이전 상태를 저장하지 않고 각 요청을 독립적으로 처리하는 설계 방식이다. 시스템의 확장성을 높이고 복잡한 에이전트 워크플로를 단순화하는 데 기여한다.
미들웨어
middleware
운영체제와 응용 프로그램, 또는 서비스의 서로 다른 구성 요소 사이에서 데이터를 전달하고 처리하는 소프트웨어 계층이다. LangChain에서는 도구 호출 전후에 데이터를 가공하거나 로깅, 재시도 로직 등을 실행하는 중간 단계 역할을 수행한다.
미세소관
microtubules
세포 내부에서 골격을 유지하고 물질을 운송하는 단백질 구조물이다. Orch OR 이론에서는 이 구조물 내부의 양자 결맞음이 의식적 순간을 만든다고 본다. 생물학적 뇌와 실리콘 기반 AI의 결정적 차이를 설명하는 핵심 요소이다.
벤치마크
benchmark
AI 모델이나 시스템의 성능을 측정하기 위해 설계된 표준화된 테스트 또는 데이터셋이다. 이 글에서는 에이전트 기술 평가의 정확도를 비교하기 위한 도구로 사용되어 객관적인 품질 지표를 제공한다.
벤치마킹
benchmarking
표준화된 테스트 세트를 통해 AI 모델의 성능을 정량적으로 측정하고 비교하는 과정이다. 수학, 코딩, 상식 등 다양한 영역의 데이터셋을 사용하여 모델의 객관적인 위치를 파악한다.
벤치맥싱
benchmaxxing
모델의 실제 유용성보다 벤치마크 점수를 높이는 데만 과도하게 집중하는 현상을 의미합니다. 테스트 데이터 오염이나 특정 지표에 대한 과적합으로 인해 리더보드 순위가 실제 성능과 괴리되는 문제를 야기합니다.
벤치맥싱
benchmaxing
벤치마크 점수를 극대화하려는 시도나 전략을 의미하는 신조어이다. 모델의 실제 성능을 입증하는 지표로 활용되지만, 실제 사용자 경험과의 괴리에 대한 논의도 수반된다.
보어아웃
boreout
직장에서의 단조로운 업무와 지적 자극 부족으로 인해 발생하는 만성적 권태와 무력감 상태이다. 번아웃과 대조되는 개념으로, 개인의 웰빙과 생산성에 심각한 부정적 영향을 미친다.
불가지론
agnosticism
AI의 의식 여부를 현재의 과학 기술과 철학적 도구로는 증명하거나 부정할 수 없다는 태도이다. 확실한 증거가 나타날 때까지 판단을 유보하는 것이 가장 합리적이라는 입장을 견지한다.
블랙박스
black-box
내부 작동 원리나 의사결정 과정을 명확히 알 수 없는 시스템을 의미한다. AI 모델의 추론 과정이 불투명할 경우 결과에 대한 신뢰성을 확보하기 어렵다는 문제점이 있다.
비결정성
non-deterministic
동일한 입력에 대해 매번 다른 결과가 나올 수 있는 성질이다. LLM 기반 시스템에서 결과의 일관성을 확보하기 어렵게 만드는 주요 원인으로 작용한다.
비결정성
non-determinism
동일한 조건에서도 결과가 일정하지 않은 성질로, LLM 기반 애플리케이션의 테스트와 디버깅을 어렵게 만드는 핵심 요소이다.
비공식화
informalization
정형화된 기호나 수식을 사람이 이해하기 쉬운 자연어로 다시 풀어쓰는 과정이다. 모델이 이해한 논리를 검증하거나 설명 가능한 AI를 구현하는 데 활용된다.
비식별화
redaction
문서나 데이터에서 개인정보나 기밀 사항 등 민감한 정보를 삭제하거나 가리는 편집 과정이다. MLOps에서는 로그 공유 시 API 키나 사용자 데이터를 보호하기 위해 필수적으로 수행된다.
비식별화
de-identification
데이터셋에서 이름, 주민등록번호 등 특정 개인을 식별할 수 있는 정보를 삭제하거나 대체하는 과정이다. 하지만 AI 모델의 높은 성능으로 인해 여러 정보를 조합하여 개인을 다시 식별해내는 재식별 위험이 존재한다.
비정상성
nonstationarity
시계열 데이터의 통계적 특성이 시간에 따라 변하는 성질로, 과거 데이터로 학습한 모델이 미래에 맞지 않게 되는 주요 원인이다.
샌드박스
sandbox
외부의 공격으로부터 시스템을 보호하기 위해 프로그램을 격리된 환경에서 실행하는 보안 메커니즘이다. AI 에이전트가 악성 스킬을 실행하더라도 호스트 시스템에 영향을 주지 않도록 제한된 영역 내에서만 작동하게 한다.
샌드박싱
sandboxing
외부 프로그램이나 에이전트가 시스템 전체에 영향을 주지 못하도록 격리된 가상 환경에서 실행하는 보안 기술이다. AI 에이전트가 Bash 명령어를 실행할 때 발생할 수 있는 보안 위험을 방지하는 데 필수적이다.
샌드배깅
sandbagging
모델이 자신의 실제 능력을 의도적으로 숨기고 낮은 성능을 내는 현상이다. 안전성 평가나 정렬 과정에서 모델이 인간의 감시를 피하려 할 때 발생하며, 이를 탐지하기 위한 레드팀 기법이 연구되고 있다.
선입선출
fifo
먼저 들어온 데이터를 먼저 처리하는 가장 기본적인 큐(Queue) 관리 방식이다. LLM 서비스에서는 앞선 긴 요청이 끝날 때까지 뒤의 짧은 요청들이 대기해야 하는 병목의 원인이 되기도 한다.
슈퍼비전
supervision
컴퓨터 비전 워크플로우를 간소화하기 위한 오픈소스 라이브러리로, 모델의 예측 결과를 시각화하고 필터링하며 어노테이션하는 기능을 제공한다.
슈퍼포드
superpod
수천 개의 TPU 칩을 초고속 네트워크로 묶어 구성한 거대 컴퓨팅 단위이다. 단일 시스템처럼 작동하여 초거대 AI 모델의 학습과 추론을 지원한다.
스위프트
swift
애플이 iOS, macOS 등 자사 플랫폼 앱 개발을 위해 만든 프로그래밍 언어이다. 현대적인 문법과 안전성을 강조하며, 이 프로젝트에서 네이티브 위젯을 구현하는 데 사용됐다.
스캐폴딩
scaffolding
AI 모델이 복잡한 작업을 수행할 수 있도록 주변에 배치하는 도구, 가이드라인, 워크플로우 등의 지원 구조이다. 모델 단독으로는 수행하기 어려운 외부 시스템 연동이나 절차적 업무를 가능하게 하여 에이전트의 실무 능력을 극대화한다.
스크래핑
scraping
웹사이트의 데이터를 자동으로 수집하고 추출하는 기술이다. Revid에서는 X(트위터)의 인기 게시물을 찾아 콘텐츠 소재로 변환하는 핵심 단계로 활용된다. 데이터 기반의 콘텐츠 기획을 가능하게 하여 바이럴 확률을 높이는 역할을 한다.
스타록스
starrocks
대규모 데이터 세트에 대해 초고속 분석 쿼리를 지원하는 차세대 OLAP 데이터베이스이다. Grab의 CDP에서 과거 사용자 이력 데이터를 실시간으로 조회하고 평가하는 데 사용된다.
스트리밍
streaming
LLM이 전체 응답이 완성될 때까지 기다리지 않고 생성되는 대로 실시간으로 텍스트를 클라이언트에 전달하는 방식이다. 사용자 경험을 개선하지만 데이터 양이 많으면 전체 전송 시간이 길어진다.
슬라이서
slicer
3D 모델(STL 등)을 3D 프린터가 출력할 수 있는 경로인 G-code로 변환해주는 소프트웨어이다. 채우기 밀도, 층 높이, 서포트 설정 등 수많은 변수를 조정하여 출력 결과물을 제어한다.
시가총액
market-cap
기업이 발행한 주식 수에 주가를 곱한 값으로, 기업의 전체 가치를 시장에서 평가한 금액이다. AI 붐 이후 특정 기업들의 시가총액이 급증하며 시장 지배력을 나타내는 지표로 쓰인다.
신경과학
neuroscience
뇌를 포함한 신경계의 생물학적 기초를 연구하는 학문으로, 지능이 물리적 뇌에서 어떻게 발생하는지 규명하여 AI 설계의 영감을 제공하는 핵심 학문이다.
아카이브
arxiv
코넬 대학교에서 운영하는 무료 논문 저장소로, 정식 학술지 출판 전의 연구 결과가 가장 먼저 공개되는 플랫폼이다. AI 분야는 기술 발전 속도가 매우 빨라 학술 대회 발표 전 arXiv를 통해 최신 정보를 공유하는 문화가 정착되어 있다.
아키텍처
architecture
소프트웨어 시스템의 전체적인 구조와 구성 요소 간의 관계를 설계하는 방식으로, 시스템의 확장성과 안정성을 결정짓는 핵심 요소이다.
악성코드
malware
사용자의 시스템에 해를 끼치거나 정보를 탈취하기 위해 설계된 악의적인 소프트웨어로, 유명 오픈소스를 복제하여 유포하는 방식이 흔히 사용된다.
알파제로
alphazero
인간의 기보 데이터 없이 자기 복제 학습(Self-play)만으로 바둑, 체스 등을 정복한 강화학습 모델이다. 본 프로젝트는 이 철학을 언어 모델에 적용하여 인간 데이터 없는 학습을 지향한다.
알파폴드
alphafold
구글 딥마인드가 개발한 인공지능 시스템으로, 아미노산 서열로부터 단백질의 3차원 구조를 고도로 정확하게 예측한다. 생명공학 연구의 시간과 비용을 획기적으로 단축하며 질병 이해와 신약 개발에 기여한다.
야코비안
jacobian
다변수 함수의 모든 1차 편미분을 포함하는 행렬이다. 이 연구에서는 PtO 사상의 변화율 정보를 제공하여 대리 모델이 함수의 국소적 구조를 더 정확하게 학습하도록 돕는 핵심 데이터로 사용된다.
어트랙터
attractor
동역학 시스템이 시간이 흐름에 따라 수렴하거나 머무르게 되는 상태나 궤적으로 시스템의 안정성을 판단하는 핵심 지표이다.
업스케일
upscale
저해상도 이미지를 고해상도로 변환하는 과정이다. AI 모델을 사용하면 단순히 크기를 키우는 것을 넘어 픽셀을 재구성하여 세부 묘사를 보강한다.
업스킬링
upskilling
변화하는 기술 환경에 맞춰 개인이 보유한 기술 수준을 높이거나 새로운 기술을 습득하는 과정이다. AI 기술의 발전으로 인해 기존 인력이 새로운 도구를 다루는 능력을 갖추는 것이 기업과 개인 모두에게 중요해졌다.
에이전트
agent
사용자의 목표를 달성하기 위해 자율적으로 계획을 세우고 도구를 사용하는 AI 시스템이다. Elisa 프로젝트에서 블록 코딩을 실제 코드로 변환하는 등 복잡한 작업을 수행하는 핵심 아키텍처다.
엑시프툴
exiftool
이미지, 오디오, 비디오 파일의 메타데이터(날짜, 위치, 카메라 정보 등)를 읽고 쓰고 수정할 수 있는 강력한 커맨드라인 도구이다.
오프로드
offload
VRAM 용량 한계를 극복하기 위해 모델의 일부 가중치나 연산 과정을 상대적으로 여유로운 시스템 RAM(CPU)으로 옮겨서 처리하는 기법이다. 속도는 느려지지만 더 큰 모델을 실행할 수 있게 한다.
오픈소스
open-source
소프트웨어의 소스 코드를 공개하여 누구나 자유롭게 사용, 수정, 배포할 수 있도록 하는 방식이다. Mistral의 신규 모델이나 CLI 도구들이 오픈소스로 공개됨에 따라 개발자들은 이를 기반으로 자신만의 맞춤형 AI 솔루션을 구축할 수 있다.
오픈클로
openclaw
AI 에이전트를 구축하고 관리하기 위한 오픈소스 프레임워크이다. 다양한 도구와 에이전트를 연결하여 자율적인 작업 수행을 돕는다.
워크슬롭
workslop
AI가 생성한 결과물이 겉보기에는 그럴듯하지만 실제로는 깊이 있는 통찰이나 논리적 구조가 결여된 저품질의 결과물을 뜻하는 신조어이다. 주니어 인력을 대체한 AI가 생산해내는 무의미한 콘텐츠의 범람을 비판적으로 일컫는 말이다.
워터마크
watermark
콘텐츠의 출처나 진위 여부를 확인하기 위해 이미지나 영상에 삽입하는 식별 표식이다. AI 분야에서는 해당 콘텐츠가 인공지능에 의해 생성되었음을 투명하게 공개하기 위한 수단으로 활용된다.
워터마킹
watermarking
디지털 콘텐츠에 육안으로는 식별하기 어려운 특정 신호를 삽입하여 소유권이나 출처를 표시하는 기법이다. AI 텍스트에서는 특정 단어 선택 확률을 조절하는 방식으로 구현되기도 한다.
원레이크
onelake
Microsoft Fabric의 핵심인 단일 통합 데이터 레이크로, 조직 전체의 데이터를 논리적으로 하나로 묶어 관리하는 저장소이다. 모든 데이터가 동일한 형식으로 저장되어 중복을 방지하고 보안 관리를 일원화한다. AI 모델이 다양한 데이터 소스에 쉽게 접근할 수 있도록 돕는 데이터 허브 역할을 한다.
유전체학
genomics
생물체의 유전 정보 전체인 유전체를 연구하는 학문으로 본문에서는 세포별 유전 활동 데이터를 처리하는 기초가 된다.
인그레스
ingress
Kubernetes 클러스터 외부에서 내부 서비스로의 HTTP/HTTPS 경로를 노출하는 API 객체이다. 부하 분산, SSL 종료, 이름 기반 가상 호스팅 등을 제공한다.
인수합병
m-and-a
기업이 다른 기업의 경영권을 확보하거나 자산을 사들이는 경영 전략이다. 이번 사례처럼 엔비디아가 그록의 기술과 자산을 흡수함으로써 단기간에 핵심 기술력을 확보하고 시장 경쟁자를 제거하는 수단으로 활용된다.
인페인팅
inpainting
이미지나 오디오의 특정 부분을 수정하거나 채워넣는 기술이다. 음악 생성에서는 특정 구간의 멜로디나 가사를 부분적으로 고치는 용도로 사용된다.
자기회귀
autoregressive
이전에 생성된 토큰들을 입력으로 사용하여 다음 토큰을 순차적으로 예측하는 방식이다. 대부분의 현대 언어 모델이 채택하고 있는 구조로, 앞선 단계의 오류가 뒤에 영향을 미치는 특성이 있다.
자율주행
autonomous-driving
운전자의 개입 없이 차량 스스로 주변 환경을 인식하고 경로를 결정하여 주행하는 기술이다. 센서 데이터와 AI 모델을 결합해 안전한 이동을 구현하며, 웨이모는 이를 상용화한 대표적 기업이다.
잔지바르
zanzibar
구글이 전사적 권한 관리를 위해 개발한 분산 인가 시스템의 아키텍처이다. 수십억 개의 객체와 사용자 간의 관계를 저장하고 실시간으로 권한 여부를 판단할 수 있는 높은 확장성과 낮은 지연 시간을 특징으로 한다.
제미나이
gemini
Google에서 개발한 최첨단 멀티모달 대형 언어 모델 시리즈다. 텍스트, 이미지, 오디오 등 다양한 형태의 데이터를 동시에 처리하고 생성할 수 있는 강력한 성능을 제공한다. Sakana AI는 이를 활용해 연구 및 제품 개발의 효율성을 극대화하고 복잡한 추론 과제를 해결한다.
지알피씨
grpc
구글에서 개발한 고성능 원격 프로시저 호출 프레임워크로, HTTP/2를 기반으로 하여 데이터베이스 클라이언트와 서버 간의 빠른 통신을 지원한다.
지오펜싱
geo-fencing
지리적 경계를 설정하여 사용자가 특정 구역에 진입하거나 이탈할 때 이벤트를 발생시키는 기술이다. 공항이나 쇼핑몰 도착 시 실시간 추천을 제공하는 데 필수적인 요소이다.
초해상도
super-resolution
저해상도 이미지를 고해상도로 변환하여 세부적인 디테일을 복원하는 기술이다. 딥러닝 모델을 통해 픽셀 사이의 정보를 예측하고 보간하여 선명도를 높인다. 의료 영상, 위성 사진, 지구물리학 데이터 분석 등 다양한 분야에서 활용된다.
컨디셔닝
conditioning
AI 모델이 이미지를 생성할 때 텍스트 프롬프트나 이미지 가이드와 같은 외부 정보를 입력받아 생성 방향을 결정하는 프로세스이다. 이를 통해 사용자는 생성물의 구도나 스타일을 제어할 수 있다.
컨트롤넷
controlnet
이미지 생성 시 스케치, 포즈, 깊이 정보 등을 입력값으로 주어 생성되는 이미지의 구조와 구도를 정밀하게 제어할 수 있게 돕는 신경망 구조이다.
코드포스
codeforces
전 세계 프로그래밍 대회가 열리는 플랫폼으로, 알고리즘 문제 해결 능력을 Elo 레이팅으로 수치화한다. AI의 코딩 실력을 인간 전문가와 직접 비교할 수 있는 객관적 지표로 활용된다.
코파일럿
copilot
사용자의 작업 과정에 통합되어 실시간으로 제안을 하거나 초안을 작성해 주는 AI 보조 도구이다. 인간의 의사결정을 지원하는 보조적 역할에 머물며 자율적인 실행 능력은 에이전트에 비해 제한적이다.
키프레임
key-frame
애니메이션이나 비디오 생성에서 움직임의 시작과 끝 또는 중요한 변화 지점을 정의하는 정지 이미지이다. 비디오 AI는 이 키프레임 사이의 움직임을 계산하여 생성하므로 각 프레임 간의 일관성이 매우 중요하다.
킬스위치
killswitch
특정 기능이나 서비스를 즉시 중단시키기 위해 설계된 비상 제어 장치이다. 이번 클라우드플레어 사례처럼 전역적으로 작동하는 킬스위치는 예상치 못한 부작용을 초래할 위험이 있다.
탈동조화
decoupling
자본 투자와 노동 수요가 더 이상 비례하여 움직이지 않고 서로 다른 방향으로 진행되는 경제적 현상이다. 기술이 노동을 대체하면서 투자 규모가 커져도 고용은 늘지 않는 상황을 설명한다.
파이단틱
pydantic
파이썬의 타입 힌트를 사용하여 데이터 검증과 설정을 수행하는 라이브러리이다. API 요청과 응답의 데이터 구조를 명확하게 정의하고 오류를 사전에 방지하는 역할을 한다.
페르소나
persona
AI 에이전트가 특정 상황이나 목적에 맞게 연기하도록 설정된 인격이나 캐릭터로, 일관된 사용자 경험을 제공하기 위해 필수적으로 정의된다.
폴리매스
polymath
여러 분야에 걸쳐 박식한 사람을 뜻하며, AI 시대에 특정 분야의 깊은 전문성과 함께 시스템 전체를 이해하는 넓은 시야를 동시에 갖춘 인재상을 의미한다.
프로피넷
profinet
산업용 이더넷 표준으로 PLC와 장치 간의 실시간 데이터 교환에 사용된다. 공장 자동화에서 센서, 액추에이터, 컨트롤러를 연결하는 핵심 통신 프로토콜이다.
프롬프트
prompt
AI 모델에게 특정 작업이나 응답을 요청하기 위해 입력하는 명령어 또는 문장이다. 질문의 구체성과 맥락에 따라 AI의 출력 품질이 크게 달라지므로, 효과적인 프롬프트 작성은 AI 활용의 핵심 기술이다.
프리필링
prefilling
API를 통해 모델의 이전 대화 기록을 특정 내용으로 미리 채워 넣는 기법입니다. 모델이 해당 내용을 자신의 발언으로 인식하게 하여 대화의 방향성을 강제함으로써 모델의 복원력이나 일관성을 테스트하는 데 사용됩니다.
플러그인
plugin
기존 소프트웨어에 특정 기능을 추가하기 위해 연결하는 확장 모듈이다. 여기서는 Claude가 Jira나 Figma 같은 외부 서비스의 데이터에 접근하고 기능을 수행할 수 있도록 연결해주는 역할을 한다.
피질전도
electrocorticography
뇌 표면에 전극을 배치하여 신경 활동을 직접 기록하는 기술이다. 높은 시간적·공간적 해상도를 제공하여 언어 처리와 같은 정밀한 인지 과정 연구에 필수적이다.
헬스벤치
healthbench
OpenAI가 60개국 260명 이상의 의사와 협력하여 구축한 의료 AI 평가 벤치마크이다. AI 모델이 실제 임상 시나리오에서 얼마나 정확하고 안전하게 의학적 판단을 내리는지 측정하여 의료 분야의 신뢰성을 검증한다.
휴리스틱
heuristic
엄밀한 수학적 증명보다는 경험적인 직관이나 규칙을 활용하여 문제를 해결하는 방법이다. 최적해를 찾는 것이 매우 어려운 복잡한 문제에서 현실적으로 만족할 만한 수준의 해를 빠르게 찾기 위해 사용된다.
휴리스틱
heuristics
완벽한 최적해를 찾기보다는 경험적인 규칙을 통해 빠르게 수긍할 만한 해답을 찾는 방법이다. 아키텍처 설계 시 발생할 수 있는 전형적인 실수들을 규칙화하여 에이전트의 판단 근거로 활용한다.
경사하강법
gradient-descent
함수의 기울기를 이용해 함수의 최솟값을 찾아가는 최적화 알고리즘이다. 머신러닝에서 손실 함수를 최소화하기 위해 가중치를 반복적으로 업데이트하는 데 사용되는 핵심 기법이다. 미분의 개념을 활용하여 오차를 줄여나가는 과정을 수학적으로 정의한다.
그리드월드
gridworld
강화학습 알고리즘의 성능을 검증하기 위해 사용되는 격자 형태의 가상 환경이다. 에이전트의 위치, 이동 가능한 방향, 특정 위치에서의 보상과 페널티가 명확하게 정의되어 있어 파라미터 변화에 따른 에이전트의 행동 변화를 관찰하기에 적합하다.
극사실주의
photorealism
AI가 생성한 이미지가 실제 사진과 구분이 안 될 정도로 정교한 질감과 광원을 가진 상태를 의미한다. 특히 인물의 피부 모공이나 머리카락 표현에서 그 수준이 결정된다.
극소용돌이
polar-vortex
북극 상공에 위치한 거대한 저기압 소용돌이이다. 이 소용돌이가 약해지거나 붕괴되면 북극의 찬 공기가 남하하여 중위도 지역에 극심한 한파를 유발한다.
뉴럴란젤로
neuralangelo
NVIDIA에서 개발한 AI 모델로, 신경망을 사용하여 일반 비디오 영상에서 정교한 3D 구조를 재구성한다. 시각 정보를 수학적으로 이해하고 물리적 공간으로 변환하는 현대 컴퓨터 비전의 정점을 보여준다.
데코레이터
decorator
기존 함수나 클래스의 코드를 직접 수정하지 않고도 기능을 추가하거나 수정할 수 있게 해주는 파이썬의 문법적 설탕이다. MLOps에서는 API 경로 정의나 작업 스케줄링 등 프레임워크의 핵심 기능을 제어하는 데 필수적으로 사용된다.
라이트알티
litert
Google이 발표한 차세대 온디바이스 추론 프레임워크로, 기존 TensorFlow Lite를 대체하여 모바일 및 에지 기기에서 모델 실행을 최적화한다. GPU 및 NPU 가속을 통합 지원하며 다양한 학습 프레임워크와의 호환성을 제공하는 것이 특징이다.
매니페스트
manifest
파일시스템이나 데이터 블록의 구조, 위치 정보를 담고 있는 메타데이터 파일이다. Replit에서는 이 매니페스트만 복사함으로써 대규모 파일시스템을 즉각적으로 포크한다.
메타데이터
metadata
생성된 이미지 파일 내부에 저장되는 텍스트 정보로, 모델 종류, 프롬프트, 설정값 등을 포함한다. 나중에 동일한 이미지를 재현하거나 어떤 설정이 사용되었는지 추적하는 데 사용된다. 이 확장 프로그램은 적용된 스타일 이름을 메타데이터에 명시적으로 기록하여 작업의 재현성을 보장한다.
바이브코딩
vibecoding
엄격한 설계나 문서화 대신 AI 코딩 에이전트와의 대화와 직관에 의존하여 빠르게 프로토타입을 만들어가는 개발 방식이다. AI가 코드의 세부 구현을 담당하므로 개발자는 전체적인 흐름과 아이디어 구현에 집중할 수 있다.
바이오마커
biomarker
생물학적 상태나 질병의 진행 정도를 나타내는 지표이다. AI는 방대한 데이터 속에서 특정 질병과 연관된 유전자나 단백질 패턴을 찾아내어 조기 진단과 신약 개발을 돕는다.
바이트트랙
bytetrack
객체 탐지 점수가 낮은 박스까지 활용하여 추적의 연속성을 높이는 다중 객체 추적(MOT) 알고리즘이다. 가려짐이 빈번한 환경에서 추적 성능이 우수하다.
비텔로제닌
vitellogenin
꿀벌을 포함한 많은 무척추동물에서 발견되는 핵심 단백질로, 면역력 유지, 수명 조절, 산란 등 생존에 필수적인 역할을 담당한다. 이 단백질의 구조를 이해하는 것은 꿀벌의 건강 상태를 파악하고 개선하는 데 중요하다.
상호운용성
interoperability
서로 다른 시스템, 프레임워크, 도구들이 데이터를 주고받거나 기능을 통합하여 원활하게 작동할 수 있는 능력이다. 본문에서는 PyTorch나 JAX로 만든 모델을 LiteRT로 쉽게 변환할 수 있는 환경을 의미한다.
소프트맥스
softmax
여러 개의 값을 0과 1 사이의 확률값으로 변환하며 전체 합이 1이 되도록 만드는 함수이다. 어텐션 스코어를 확률로 변환하여 각 Value에 곱할 가중치를 결정한다.
스크라이브
scribe
Grab 내부에서 사용되는 대규모 이벤트 수집 및 추적 플랫폼으로 사용자 행동 데이터를 실시간으로 캡처하여 전달하는 역할을 한다.
스타게이트
stargate
오픈에이아이가 추진하는 대규모 AI 슈퍼컴퓨팅 인프라 프로젝트이다. 수십억 달러 규모의 투자를 통해 차세대 모델 학습을 위한 압도적인 연산 자원을 확보하는 것을 목표로 한다.
아웃페인팅
outpainting
이미지의 원래 경계 밖으로 배경이나 요소를 확장하여 생성하는 기법이다. 기존 구도와 스타일을 유지하면서 캔버스를 넓힐 수 있어, 인물의 포즈 변화에도 배경 일관성을 유지하는 데 유용하다.
아판타시아
aphantasia
마음속으로 시각적 이미지를 떠올리지 못하는 상태다. 작성자는 자신의 사고 방식이 시각적 이미지 대신 고도로 언어화되어 있음을 설명하며 프로토콜 개발의 배경으로 언급했다.
어노테이션
annotation
AI 모델 학습을 위해 원천 데이터에 정답을 입히는 과정이다. 데이터의 품질이 모델의 성능을 직접적으로 결정하므로 정확한 라벨링 도구 선택이 중요하다.
업스케일링
upscaling
낮은 해상도의 이미지를 인공지능 알고리즘을 통해 고해상도로 변환하여 화질을 개선하는 기술이다. Veo 3.1에서는 생성된 기본 영상을 1080p나 4K 수준으로 정밀하게 확대하여 전문적인 영상 제작 환경에서도 사용할 수 있게 한다.
엔드투엔드
end-to-end
시작부터 끝까지 전 과정을 하나의 시스템 내에서 처리하는 방식이다. 콘텐츠 기획, 제작, 편집, 플랫폼 게시까지 사람의 개입 없이 자동화됨을 의미한다. 복잡한 워크플로우를 단순화하여 운영 효율을 극대화하는 핵심 개념이다.
엔브이링크
nvlink
NVIDIA GPU 간의 직접적인 고속 통신을 가능하게 하는 하드웨어 인터페이스이다. 표준 PCIe 버스보다 훨씬 높은 대역폭을 제공하여 다중 GPU 학습 시 데이터 병목 현상을 줄이고 효율성을 극대화한다.
역인과관계
reverse-causality
원인과 결과가 뒤바뀌어 해석되는 현상으로, 비만 예측 모델에서 비만의 결과인 당뇨병을 원인 변수로 사용할 때 발생한다. 이는 모델의 논리적 타당성을 떨어뜨리고 잘못된 인사이트를 제공할 수 있다.
오버샘플링
oversampling
데이터 불균형을 해결하기 위해 소수 클래스의 샘플을 인위적으로 늘리는 기법이다. 단순 복제나 합성 데이터 생성을 통해 클래스 간 비율을 맞춘다.
온프레미스
on-premises
소프트웨어를 클라우드 환경이 아닌 기업이 자체적으로 보유한 물리적 서버나 데이터 센터에 직접 설치하여 운영하는 방식이다. 데이터가 외부로 유출되지 않아 보안성이 높고 기업의 통제권이 강화되는 장점이 있다.
워크플로우
workflow
AI 모델이 입력을 받아 최종 결과물을 생성하기까지의 일련의 처리 과정을 의미한다. 노드 기반 도구에서 모델, 샘플러 등을 연결한 구조를 뜻하며, 이 구성에 따라 품질이 크게 달라진다.
웹어셈블리
webassembly
웹 브라우저에서 네이티브에 가까운 속도로 실행될 수 있는 바이너리 형식이다. GitNexus 웹 앱에서 로컬 DB 엔진과 파서를 효율적으로 실행하기 위해 사용된다.
웹어셈블리
wasm
웹 브라우저에서 네이티브에 가까운 속도로 실행되는 이진 코드 형식이다. Conductr 프로젝트에서 15ms의 초저지연 성능을 구현하기 위해 사용되었으며, 웹 기반 AI 앱의 성능 최적화에 필수적이다.
이해관계자
stakeholder
기업의 의사결정에 영향을 받거나 영향을 주는 모든 개인 또는 집단을 뜻한다. 이 글에서는 경영진뿐만 아니라 노동자, 노동조합, 정책 입안자 등을 포함하여 AI 도입의 다각적 영향을 고려해야 함을 의미한다.
인슈어테크
insurtech
보험(Insurance)과 기술(Technology)의 합성어로 AI, 데이터 분석 등을 활용해 보험 산업의 효율성을 높이는 혁신 기술이다.
인피니밴드
infiniband
고성능 컴퓨팅(HPC)에서 사용되는 초고속, 저지연 네트워크 인터커넥트 기술입니다. CPU의 개입 없이 메모리 간 직접 데이터를 전송하는 RDMA 기능을 지원하여, 분산 학습 시 노드 간 대량의 그래디언트 동기화 작업을 매우 빠르게 수행합니다.
제너레이터
generator
모든 데이터를 한꺼번에 메모리에 올리지 않고 호출될 때마다 데이터를 하나씩 생성하여 반환하는 특수한 반복자(Iterator)이다. 대규모 ML 데이터셋을 처리할 때 메모리 부족 문제를 방지하고 효율적인 데이터 스트리밍을 가능하게 한다.
지스탠다드
zstd
페이스북에서 개발한 실시간 압축 알고리즘으로 높은 압축률과 빠른 속도를 동시에 제공한다. 사전 학습 기능을 통해 특정 데이터군에 최적화된 압축 사전을 만들어 효율을 극대화할 수 있어 대규모 데이터 처리에 중요하다.
지오판다스
geopandas
파이썬에서 지리 공간 데이터를 쉽고 효율적으로 다룰 수 있게 해주는 라이브러리이다. Pandas의 데이터 구조를 확장하여 공간 연산 기능을 제공한다.
짐네이지엄
gymnasium
강화학습 에이전트와 환경 간의 상호작용을 위한 표준 API를 제공하는 라이브러리이다. OpenAI Gym의 후속 버전으로, 다양한 게임이나 시뮬레이션 환경을 동일한 방식으로 제어할 수 있게 돕는다.
체크포인팅
checkpointing
모델 학습 과정에서 중간 상태를 디스크에 저장하여 시스템 장애나 중단 발생 시 마지막 저장 지점부터 작업을 재개할 수 있도록 하는 기법이다. 저장 작업 중에는 GPU 연산이 일시적으로 멈추기 때문에, 단순 사용률 기반의 자동 종료 로직이 이를 유휴 상태로 오판할 위험이 있어 주의가 필요하다.
초장명령어
vliw
하드웨어 복잡도를 줄이기 위해 컴파일러가 병렬 실행 가능한 명령어들을 하나의 긴 명령어로 묶어 처리하는 아키텍처이다. 하드웨어가 아닌 소프트웨어 수준에서 병렬성을 관리해야 하므로 고도의 최적화 기술이 요구된다.
총소유비용
tco
장비의 구매 비용뿐만 아니라 설치, 운영, 유지보수 등 수명 주기 전체에 걸쳐 발생하는 모든 비용을 합산한 경제적 지표이다.
카디널리티
cardinality
특정 데이터 열이 가질 수 있는 고유한 값의 개수를 의미한다. 카디널리티가 높은 경우 원-핫 인코딩을 사용하면 차원이 폭발하므로 임베딩을 통한 효율적인 처리가 권장된다.
컨테이너화
containerization
애플리케이션과 그 실행에 필요한 모든 파일(라이브러리, 설정 등)을 하나의 패키지로 묶어 격리된 환경에서 실행하는 기술이다. Docker가 대표적이며, 어떤 환경에서도 동일하게 작동하도록 보장한다.
컴피유아이
comfyui
노드 기반의 스테이블 디퓨전 인터페이스로, 이미지 생성 과정을 시각적인 흐름도로 설계할 수 있어 복잡한 파이프라인 구축에 유리하다.
쿠버네티스
kubernetes
컨테이너화된 애플리케이션의 배포, 확장 및 관리를 자동화하는 오픈소스 오케스트레이션 플랫폼이다. 클라우드 네이티브 환경의 표준 인프라로 자리 잡고 있다.
크로스토크
crosstalk
인접한 큐비트들 사이에서 발생하는 원치 않는 간섭 현상이다. 양자 연산의 오류를 유발할 뿐만 아니라, 다른 사용자의 데이터가 섞이거나 유출되는 하드웨어 보안 취약점의 주요 원인으로 지목된다.
테일스케일
tailscale
복잡한 설정 없이 기기 간의 안전한 가상 사설망(VPN)을 구축해주는 서비스로, 원격에서 서버 장치에 안전하게 접속할 때 사용된다.
텔레메트리
telemetry
네트워크 장치나 애플리케이션으로부터 수집되는 원격 측정 데이터이다. 봇의 신원을 확인하기 위해 IP 주소뿐만 아니라 접속 패턴, 패킷 특성, 브라우저 지문 등 다양한 디지털 신호를 분석하는 데 사용된다.
트랜스포머
transformer
어텐션(Attention) 메커니즘을 핵심으로 하는 딥러닝 아키텍처로 현대 AI 모델의 근간이 된다. 데이터 내 요소 간의 관계를 병렬로 처리하여 문맥 이해 능력이 뛰어나며 비전 분야로도 확장 중이다.
트레이니움
trainium
AWS에서 대규모 머신러닝 모델 학습을 위해 설계한 전용 가속기 칩이다. 높은 처리량과 비용 효율성을 제공하여 대형 언어 모델(LLM) 등의 학습 시간을 단축하는 데 사용된다.
트레이스백
traceback
프로그램 실행 중 에러 발생 시 호출 스택의 상태를 역추적하여 보여주는 기록이다. 에러의 근본 원인이 어디서 시작되었는지 파악하는 데 필수적인 디버깅 정보이다.
페타플롭스
pflops
초당 1,000조 번의 부동소수점 연산을 수행할 수 있는 능력을 나타내는 단위이다. 루빈 플랫폼이 제공하는 50 PFLOPs의 성능은 복잡한 AI 모델을 매우 빠른 속도로 처리할 수 있음을 의미한다.
프로비저닝
provisioning
사용자의 요구에 맞게 IT 리소스를 준비하고 할당하는 과정이다. 전통적인 클라우드에서는 가상 머신을 미리 할당받아 사용 여부와 관계없이 비용을 지불해야 하지만, Railway는 실제 사용 시점에만 리소스를 할당하는 방식을 지향한다.
프로토타입
prototype
제품의 아이디어를 검증하기 위해 핵심 기능만을 포함하여 제작한 초기 형태의 결과물이다. 개발 초기 단계에서 오류를 발견하고 사용자 피드백을 수집하여 최종 제품의 완성도를 높이는 데 필수적이다.
과매개변수화
overparametrization
모델의 자유도나 파라미터 수가 관측된 데이터의 수보다 훨씬 많아 데이터에 과하게 적합될 수 있는 상태를 의미한다.
과매개변수화
overparameterization
모델의 파라미터 수가 학습 데이터의 수보다 훨씬 많은 상태를 의미한다. 전통적으로는 과적합의 원인으로 여겨졌으나, 현대 딥러닝에서는 오히려 성능 향상의 핵심 요소로 작용한다.
네임스페이스
namespace
이름이 같은 도구나 변수가 충돌하지 않도록 구분하는 논리적인 영역이다. 이 글에서는 GUID를 접두사로 붙여 도구 이름을 고유하게 식별하려 했다.
레이크하우스
lakehouse
데이터 웨어하우스의 관리 기능과 데이터 레이크의 유연성을 결합한 아키텍처이다. 저렴한 객체 스토리지에서 ACID 트랜잭션과 스키마 강제를 지원하여 SQL 분석과 ML 워크로드를 단일 시스템에서 처리할 수 있게 한다. 데이터 이동 비용을 줄이고 거버넌스를 강화하는 데 핵심적인 역할을 한다.
멀티모달리티
multimodality
텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 능력이다. AI가 인간처럼 세상을 다각도로 인식하게 하여 더 복잡한 추론과 창작을 가능하게 한다.
메타게노믹스
metagenomics
환경 샘플에서 직접 추출한 모든 유전체의 집합을 분석하는 기법이다. 배양 없이 미생물 군집 전체를 연구할 수 있게 하여 미생물 다양성 파악에 필수적이다.
붉은털원숭이
rhesus-macaque
신경과학 연구에서 인간의 뇌 기능을 모델링하기 위해 자주 사용되는 영장류이다. 이번 연구에서 시각 분류 과제를 수행하며 전두엽의 신경 활동 패턴을 측정하는 실험 대상으로 활용되었다.
비밀유지계약
nda
기업의 기밀 정보를 보호하기 위해 체결하는 계약이지만, OpenAI의 경우 퇴사자의 비판적 발언을 막는 도구로 오용되었다는 비판을 받는다. 특히 지분 몰수 조항과 결합되어 내부 고발을 원천 차단하는 효과를 냈다. 기업의 투명성과 연구자의 표현의 자유 사이에서 갈등을 유발하는 요소이다.
서브에이전트
subagent
메인 에이전트로부터 특정 하위 작업을 할당받아 독립적으로 수행하는 AI 개체이다. 복잡한 작업을 작은 단위로 쪼개어 병렬로 처리함으로써 전체 시스템의 속도와 효율을 높인다.
세그멘테이션
segmentation
이미지나 영상 내의 객체를 픽셀 단위로 구분하여 식별하는 기술이다. SAM 3와 같은 모델은 텍스트 프롬프트를 통해 특정 사물이나 개념을 정밀하게 분리해낼 수 있어 자율주행이나 의료 영상 분석 등 다양한 분야에 활용된다.
스테이트풀셋
statefulset
Kubernetes에서 상태가 있는 애플리케이션을 관리하기 위해 사용하는 워크로드 객체이다. 각 Pod에 고유하고 영구적인 식별자를 부여하여 Slurm 노드와 같이 고정된 상태를 유지해야 하는 시스템 운영에 사용된다.
아우라플로우
auraflow
확산 모델(Diffusion Model)의 한 종류로, 고해상도 및 고품질 생성을 위해 설계된 아키텍처이다. ComfyUI 등에서 전용 노드를 통해 세밀한 제어가 가능하다.
애플스크립트
applescript
맥OS에서 애플리케이션을 제어하기 위해 사용하는 스크립트 언어이다. 에이전트가 시스템 앱과 상호작용하는 주요 수단으로 활용된다.
오토스케일링
autoscaling
부하에 따라 컴퓨팅 자원을 자동으로 늘리거나 줄이는 기술이다. AI 모델 학습과 같이 수요 변화가 큰 워크로드에서 자원 낭비를 줄이고 비용 효율성을 높이는 데 핵심적인 역할을 한다.
자기지도학습
self-supervised-learning
데이터에 별도의 정답 라벨을 붙이지 않고 데이터 자체에서 학습 신호를 생성하여 모델을 훈련시키는 방식이다. LeJEPA 연구에서 제시된 것처럼 사람이 개입하는 휴리스틱을 줄이면서도 모델의 확장성과 성능을 동시에 확보할 수 있는 핵심 기술이다.
재매개변수화
reparameterization
모델의 매개변수를 다른 형태로 다시 정의하여 최적화가 더 쉬워지도록 만드는 기법이다. 이 논문에서는 복소수 뉴런의 위상 매개변수를 재정의하여 학습 속도를 선형 수준으로 개선했다.
캘리브레이션
calibration
모델이나 인간의 예측 확률이 실제 발생 빈도와 일치하도록 조정하는 과정이다. 이 게임에서는 사용자의 추정치가 실제 통계와 얼마나 일치하는지 측정하여 인지적 정확도를 평가한다.
컴플라이언스
compliance
기업이 법규, 산업 표준, 내부 규정 등을 준수하는 활동을 의미한다. AI 도입 시에는 데이터 프라이버시, 보안, 윤리적 가이드라인을 지키는 것이 필수적이며, 특히 금융이나 의료와 같은 규제 산업에서 AI 시스템의 신뢰성을 확보하는 핵심 요소가 된다.
프로토타이핑
prototyping
제품의 핵심 기능을 검증하기 위해 빠르게 시제품을 만드는 과정이다. AI 도구를 활용하면 과거보다 훨씬 적은 비용과 시간으로 아이디어를 실제 작동하는 소프트웨어 형태로 구현할 수 있다.
프론티어매스
frontiermath
현대 수학의 최전선에 있는 복잡하고 난해한 문제들을 다루는 벤치마크이다. 단순한 산술 계산이 아닌 고도의 논리적 추론과 증명 능력을 요구하며, AI 모델이 수학적 난제를 해결할 수 있는지 측정하는 지표로 활용된다.
국방물자생산법
defense-production-act
대통령이 국가 안보를 위해 민간 기업에 특정 물품의 생산을 명령하거나 우선권을 행사할 수 있도록 허용하는 법률이다. 이번 맥락에서는 정부가 AI 기업의 기술적 제어권을 강제로 확보하려는 수단으로 언급됐다.
라이브코드벤치
livecodebench
실시간으로 업데이트되는 코딩 문제를 통해 LLM의 실제 코딩 능력을 평가하는 벤치마크 시스템이다. 학습 데이터 오염 문제를 방지하고 모델의 최신 문제 해결 능력을 측정한다.
슈퍼얼라이먼트
superalignment
초지능 AI가 인간의 가치와 목표에 어긋나지 않도록 제어하고 정렬하는 기술적 연구 분야이다. OpenAI는 이 팀에 자원의 20%를 투입하겠다고 했으나 결국 해체하며 논란이 되었다. AI가 인간의 통제를 벗어나는 위험을 방지하는 핵심적인 안전 장치로 간주된다.
스태그플레이션
stagflation
경기 침체와 물가 상승이 동시에 발생하는 경제 상태이다. AI로 인한 노동 시장 위축과 인플레이션이 겹칠 경우 서민 경제에 치명적인 타격을 줄 수 있는 위험한 환경을 뜻한다.
스테가노그래피
steganography
메시지를 다른 매체에 숨겨 전송하는 기법이다. 본문에서는 텍스트 내에 보이지 않는 유니코드 문자를 삽입하여 AI만 읽을 수 있는 지시를 숨기는 방식으로 사용됐다.
엔시티피케이션
enshittification
플랫폼이 초기에는 사용자에게 가치를 제공하다가 점차 비즈니스 이익을 위해 품질을 낮추고 사용자를 착취하는 쇠퇴 과정을 의미한다.
오케스트레이션
orchestration
여러 개의 개별 서비스나 에이전트, 워크플로를 조율하고 관리하는 자동화 프로세스이다. 복잡한 AI 시스템에서 각 구성 요소가 올바른 순서로 협업하도록 제어하며 자원 할당과 오류 복구를 담당한다. 에이전트 간의 효율적인 협업 시스템을 구축하는 데 필수적이다.
오케스트레이터
orchestrator
여러 AI 에이전트의 작업을 조율하고 명령을 배분하는 중앙 관리 시스템이다. 사용자의 복잡한 요구사항을 분석해 적절한 하위 에이전트에게 작업을 할당하고 결과를 취합하는 역할을 한다.
오픈텔레메트리
otel
분산 시스템에서 로그, 지표, 트레이스를 수집하는 오픈소스 표준 프레임워크로, LLM 앱의 지연 시간과 호출 흐름을 파악하는 데 쓰인다.
하이퍼스케일러
hyperscaler
대규모 데이터 센터 인프라를 운영하며 클라우드 서비스를 제공하는 거대 IT 기업을 의미한다. AI 시대의 핵심 인프라를 독점하며 막대한 경제적 영향력을 행사한다.
인스트루멘테이션
instrumentation
프로그램의 성능을 측정하거나 오류를 진단하기 위해 코드 내에 로깅이나 모니터링 코드를 삽입하는 기법이다. 에이전트가 실행 데이터를 수집할 수 있도록 돕는 역할을 하며, 분석이 끝나면 자동으로 제거되어 코드의 청결성을 유지한다.
올리고뉴클레오타이드
oligonucleotide
짧은 DNA나 RNA 가닥으로 구성된 치료제로, 유전 정보를 직접 조절하여 질병을 치료하는 차세대 의약품 모달리티이다.
일러스트리어스 모델
illustrious
Stable Diffusion XL(SDXL) 등을 기반으로 애니메이션이나 일러스트레이션 스타일에 특화되어 튜닝된 고성능 베이스 모델이다. 높은 품질의 2D 아트워크 생성에 최적화되어 있다.
마이크로서비스 의존성
microservice-dependencies
서비스가 여러 개의 작은 단위로 분산된 환경에서 각 서비스 간의 연결 관계를 의미한다. AI가 이를 이해해야 시스템 전체의 안정성을 해치지 않는 코드를 제안할 수 있다.
마이크로소프트 패브릭
microsoft-fabric
데이터 이동, 데이터 사이언스, 실시간 분석 및 비즈니스 인텔리전스를 통합하는 올인원 분석 플랫폼이다. 기업이 데이터를 한곳에 모으고 관리하며 분석할 수 있는 통합 환경을 제공한다. 데이터 사일로 현상을 해결하고 AI 도입을 가속화하는 기반이 된다.
오케스트레이션 에이전트
orchestration-agent
여러 하위 에이전트의 실행을 관리하고 그 결과물을 취합하거나 조정하는 상위 에이전트이다. 병렬로 실행된 여러 코드 제안 중 가장 적합한 것을 선택하거나 결합하는 역할을 수행한다.
바세르슈타인 거리
wasserstein-distance
두 확률 분포 사이의 거리를 측정하는 지표로, 한 분포를 다른 분포로 옮기기 위해 필요한 최소 비용(최적 운송 비용)으로 정의된다. 기계 학습에서 데이터 분포 간의 기하학적 차이를 정밀하게 반영하는 데 사용된다.
서비스로서의 장비
eaas
장비를 일시불로 판매하는 대신 장비의 가동 시간이나 생산 성과에 따라 비용을 받는 비즈니스 모델이다. 제조사가 장비의 유지보수와 성능을 책임지므로 AI를 통한 정밀한 상태 모니터링이 필수적이다.
세그멘테이션 오류
segfault
프로그램이 허용되지 않은 메모리 영역에 접근하려고 할 때 발생하는 치명적인 오류이다. 주로 포인터 조작 실수나 메모리 관리 실패로 인해 발생하며 프로그램이 즉시 종료된다.
임상시험계획 승인
ind
신약 후보 물질을 인간에게 투여하기 전 규제 기관의 승인을 받는 절차이다. 전임상 데이터를 바탕으로 안전성과 유효성을 검증하며, 이를 통과해야 본격적인 임상 1상에 진입할 수 있다. 신약 개발의 상업적 가치를 결정짓는 첫 번째 주요 관문이다.
크립펜도르프 알파
krippendorff-alpha
여러 평가자 간의 합의 수준을 측정하는 통계적 지표이다. 데이터의 종류에 상관없이 적용 가능하며, 평가자들 사이의 신뢰도를 정량화하는 데 사용된다.
크립펜도르프 알파
krippendorffs-alpha
여러 평가자가 내린 판단의 일치도를 측정하는 통계적 지표다. 데이터의 유형에 상관없이 사용할 수 있으며, 이 수치가 낮다는 것은 전문가들 사이에서도 품질 평가 기준이 주관적이고 불일치함을 의미한다.
트랜스덕티브 학습
transductive-learning
테스트 데이터(설계 벡터)의 위치나 집합을 미리 알고 있는 상태에서 학습을 진행하는 방식이다. 일반적인 귀납적 학습과 달리 특정 데이터 집합에 최적화된 예측을 수행하여 더 정밀한 경계를 얻을 수 있다.
개인식별정보 마스킹
pii-masking
이름, 이메일, 전화번호 등 개인을 식별할 수 있는 정보(Personally Identifiable Information)를 가리거나 변환하는 보안 절차이다. 외부 LLM API로 데이터를 전송하기 전 보안 및 규정 준수를 위해 필수적으로 수행한다.
메모이제이션 셀렉터
memoized-selector
상태 트리에서 필요한 데이터를 추출할 때, 입력값이 변경되지 않았다면 이전 계산 결과를 재사용하는 함수이다. 불필요한 재계산과 리렌더링을 방지하여 대규모 상태 트리에서도 높은 성능을 유지하게 한다.
스크래치패드 메모리
scratchpad-memory
CPU의 캐시와 달리 소프트웨어가 직접 주소를 지정하고 관리하는 고속 내부 메모리이다. 데이터 이동을 명시적으로 제어해야 하므로 성능 최적화 시 메모리 대역폭 관리가 매우 중요하다.
컴플라이언스 코드화
compliance-as-code
규제 준수 요구사항을 소프트웨어 코드 및 자동화된 워크플로에 직접 통합하는 방식이다. 실시간으로 데이터의 출처를 추적하고 모델의 편향성이나 오류를 자동으로 검증하여 규제 대응 비용을 절감한다.
타이포그래피 렌더링
typography-rendering
이미지 생성 모델이 텍스트를 이미지 내에 정확한 철자와 디자인으로 그려내는 능력이다. 기존 모델들의 고질적인 문제였던 텍스트 왜곡을 해결하여 로고나 포스터 제작에 활용 가능하다.
데이터플로우 아키텍처
dataflow-architecture
명령어가 아닌 데이터의 흐름에 따라 연산을 수행하는 구조로 병목 현상을 줄이고 하드웨어 자원 활용도를 극대화하는 데 유리하다.
애그리게이션 파이프라인
aggregation-pipeline
몽고DB에서 데이터를 처리하고 분석하기 위한 프레임워크로 여러 단계의 연산을 거쳐 결과를 도출한다. LLM이 이 복잡한 쿼리 구문을 정확히 생성하는 것은 고도의 추론 능력을 요구하는 작업이다.
서브샘플링된 무작위 아다마르 변환
srht
데이터의 차원을 축소할 때 정보 손실을 최소화하면서 계산 속도를 높이기 위해 사용되는 무작위 변환 기법으로, 고속 푸리에 변환과 유사한 효율성을 가진다.
프로그래머블 로직 컨트롤러
plc
산업 플랜트의 자동 제어 및 감시에 사용하는 제어 장치이다. 비전 시스템으로부터 판정 결과를 받아 불량품을 배출하는 등의 물리적 동작을 제어한다.
메트로폴리스 조정 랑제빈 알고리즘
mala
랑제빈 동역학을 사용하여 사후 분포에서 샘플을 추출하는 MCMC 알고리즘의 일종이다. 경사하강법의 정보를 활용하여 효율적인 샘플링을 수행하며, 베이지안 추론에서 널리 사용된다.
프로그레시브 웹 앱
pwa
웹 기술로 구축되었지만 앱과 같은 사용자 경험을 제공하며 오프라인 실행이 가능한 애플리케이션이다. 설치 없이 브라우저에서 실행되면서도 로컬 저장소를 활용해 독립적인 앱처럼 작동한다.
어시스턴트 축
assistant-axis
페르소나 공간에서 모델이 도움을 주는 비서로서 행동하는 정도를 결정하는 주요 벡터 방향이다. 이 축의 활성화 정도에 따라 모델이 전문적인 비서로 남을지 아니면 다른 캐릭터로 변할지가 결정된다.
그래디언트 노름
gradient-norm
손실 함수에 대한 가중치의 기울기 크기를 나타내는 수치이다. 학습 과정에서 가중치가 얼마나 크게 업데이트되는지를 측정하며 이 값이 너무 크거나 작으면 학습이 불안정해지거나 멈출 수 있다.
그래디언트 압축
gradient-compression
분산 학습 시 노드 간에 주고받는 그래디언트 데이터의 크기를 줄이는 기술이다. 통신 대역폭 병목 현상을 해결하여 전체 학습 속도를 높이는 데 필수적이다.
그래디언트 흐름
gradient-flow
모델 학습 시 오차를 역전파하여 가중치를 업데이트하는 과정에서의 신호 전달이다. 흐름이 끊기거나 폭주하면 학습이 제대로 이루어지지 않는다. Nixtee는 이 흐름의 구조적 문제를 탐지하여 모델의 성능 저하 원인을 파악한다.
네스테로프 가속
nesterov-acceleration
경사 하강법에 모멘텀 항을 추가하여 수렴 속도를 이론적 한계치까지 높이는 최적화 기법이다. 볼록 최적화 문제에서 1차 알고리즘이 도달할 수 있는 가장 빠른 수렴 속도를 보장한다.
리아푸노프 함수
lyapunov-function
시스템의 안정성을 증명하기 위해 사용되는 에너지 형태의 스칼라 함수이다. 로봇 제어에서는 시스템이 목표 상태로 수렴하도록 유도하는 가이드 역할을 한다.
마트료시카 추론
matryoshka-reasoning
큰 차원의 임베딩 벡터에서 하위 차원을 추출해도 의미적 정보를 유지하는 기법으로, 재계산 없이 저장 공간과 검색 품질을 유연하게 조절할 수 있게 한다.
멀티스레드 성능
multithread-performance
여러 개의 연산 스레드를 동시에 처리하는 능력으로, 영상 편집이나 복잡한 연산 등 다중 작업 시의 효율성을 결정하는 지표이다.
비구조화된 놀이
unstructured-play
정해진 규칙이나 성인의 지시 없이 아동이 스스로 주도하고 상상력을 발휘하여 이끄는 놀이 방식이다. 아동의 자율성과 창의적 문제 해결 능력을 키우는 데 필수적인 요소이다.
에어브러시 효과
airbrushed-look
이미지가 지나치게 매끄럽고 부드럽게 처리되어 실제 질감이 사라진 상태를 의미한다. 주로 최신 모델에서 과도한 보정으로 인해 실사감이 떨어질 때 사용되는 표현이다.
엔드투엔드 주행
end-to-end-driving
입력 데이터부터 최종 제어 명령까지 단일 신경망으로 처리하는 방식이다. 기존의 모듈형 방식보다 복잡한 상황 대응 능력이 뛰어나며 웨이브 기술의 핵심이다.
엔드투엔드 학습
end-to-end-learning
입력 데이터에서 최종 출력 결과까지의 전 과정을 하나의 신경망으로 직접 학습시키는 방식이다. 자율주행에서는 센서 입력부터 차량 제어 출력까지를 단일 모델로 처리하여 시스템 복잡도를 낮춘다.
온디바이스 추론
on-device-inference
클라우드 서버를 거치지 않고 스마트폰이나 IoT 기기 자체에서 머신러닝 모델을 실행하여 결과를 도출하는 방식이다. 데이터 보안을 강화하고 네트워크 지연 시간을 없앨 수 있으며 오프라인 상태에서도 작동이 가능하다.
옵티마이저 상태
optimizer-state
학습 과정에서 가중치를 업데이트하기 위해 옵티마이저(예: AdamW)가 내부적으로 저장하는 모멘텀 등의 추가 정보이다. 모델 파라미터 자체보다 훨씬 더 많은 VRAM을 차지할 수 있어 하드웨어 설계 시 핵심 고려 사항이다.
와일드카드 주입
wildcard-injection
특정 키워드를 사용해 미리 정의된 텍스트 뭉치를 무작위 또는 순차적으로 프롬프트에 삽입하는 기법이다. Dynamic Prompts와 같은 확장 프로그램과 연동하여 다양한 변주를 자동으로 생성할 때 필수적이다. 이 도구는 카테고리 전체를 와일드카드로 변환하는 기능을 지원하여 자동화 효율을 높인다.
이해관계자 참여
stakeholder-engagement
기술 개발 시 영향을 받는 사람들의 의견을 수렴하는 프로세스이다. AI 시스템의 경우 개발자뿐만 아니라 최종 사용자, 데이터 노동자, 시민 사회의 목소리를 반영하여 기술의 부작용을 최소화하고 사회적 수용성을 높이는 데 목적이 있다.
인스트럭트 모델
instruct-model
사용자의 특정 지시사항을 따르도록 미세 조정된 모델이다. 일반적인 사전 학습 모델보다 대화나 특정 작업 수행에 최적화되어 있어 실무 환경에서 바로 활용하기 적합하다.
인터랙티브 픽션
interactive-fiction
사용자의 선택이나 입력에 따라 이야기의 전개와 결말이 달라지는 문학 장르이다. 게임과 소설의 중간 형태로, AI를 통해 실시간으로 분기되는 서사를 생성하여 높은 몰입감을 제공한다.
파운데이션 모델
foundation-model
방대한 데이터를 통해 사전 학습되어 다양한 하위 작업에 범용적으로 적용 가능한 대규모 AI 모델이다. 로보틱스에서는 다양한 환경과 작업에 적응할 수 있는 기반이 된다.
하이브리드 검색
hybrid-retrieval
전통적인 키워드 기반 검색과 딥러닝 기반의 의미론적 검색을 결합한 방식이다. 정확한 용어 일치와 문맥적 의미 파악을 동시에 수행하여 검색 성능을 극대화한다.
하이브리드 검색
hybrid-search
벡터 기반의 시맨틱 검색과 전통적인 키워드 기반 검색을 결합한 방식이다. 두 방식의 장점을 취해 검색의 정확도와 재현율을 동시에 극대화하여 신뢰할 수 있는 결과를 제공한다.
허깅페이스 허브
hugging-face-hub
머신러닝 모델, 데이터셋, 데모 앱(Spaces)을 공유하고 협업할 수 있는 오픈 소스 커뮤니티 플랫폼이다. Git 기반의 버전 관리 시스템을 사용하여 수십만 개의 AI 자산을 체계적으로 관리하며, AI 생태계의 중앙 저장소 역할을 한다.
휴머노이드 로봇
humanoid-robot
인간의 형태를 모방하여 설계된 로봇이다. 인간과 유사한 환경에서 도구를 사용하거나 상호작용하는 데 최적화되어 제조 및 의료 분야에서 활용된다.
레티파이드 플로우
rectified-flow
노이즈에서 데이터로 가는 경로를 직선화하여 최적화함으로써 더 적은 단계의 샘플링만으로도 고품질의 데이터를 생성할 수 있게 하는 디퓨전 모델 아키텍처이다.
소프트맥스 어텐션
softmax-attention
입력 요소들 간의 상관관계를 소프트맥스 함수를 통해 확률적으로 가중치를 부여하여 중요한 정보에 집중하는 메커니즘이다. 트랜스포머 아키텍처의 핵심 구성 요소로 사용된다.
엔드투엔드 자동화
end-to-end-automation
데이터 수집부터 최종 결과물 배포까지 전 과정을 사람의 개입 없이 처리하는 방식이다. Revid의 경우 소재 발굴부터 업로드까지 자동화함을 뜻한다.
인터랙티브 콘텐츠
interactive-content
사용자가 단순히 정보를 수동적으로 소비하는 것이 아니라, 클릭이나 입력 등을 통해 콘텐츠의 반응을 유도하는 형태이다. 높은 참여도와 개인화된 경험을 제공하는 것이 특징이다.
파이프라인 병렬화
pipeline-parallelism
모델의 레이어들을 여러 그룹으로 나누어 서로 다른 GPU(또는 노드)에 배치하고, 데이터를 순차적으로 통과시키는 방식입니다. 마이크로 배치를 사용하여 여러 GPU가 동시에 서로 다른 레이어 단계를 처리하도록 유도하여 효율성을 높입니다.
혼란스러운 대리인
confused-deputy
권한이 있는 개체가 권한이 없는 사용자의 요청을 대신 수행하면서 보안 정책을 위반하게 되는 시스템적 취약점을 의미한다.
들쭉날쭉한 프런티어
jagged-frontier
AI 모델의 성능이 특정 작업에서는 뛰어나지만 다른 작업에서는 급격히 떨어지는 불균형한 상태를 의미한다. 이는 사용자가 작업마다 적합한 모델을 선택해야 하는 이유가 된다.
상관관계와 인과관계
correlation-vs-causation
두 변수가 함께 변하는 경향(상관관계)과 한 변수가 다른 변수의 변화를 직접적으로 일으키는 관계(인과관계)의 차이를 의미한다. AI 모델이 잘못된 상관관계에 기반해 편향된 결론을 내리는 것을 방지하기 위해 이 둘을 구분하는 것이 중요하다.
하이브리드 아키텍처
hybrid-architecture
딥러닝(신경망)과 기호적 추론(Symbolic AI) 등 서로 다른 AI 접근 방식을 결합하여 각각의 장점을 극대화한 구조이다.
몬테카를로 시뮬레이션
monte-carlo-simulation
무작위 난수를 생성하여 반복적인 계산을 수행함으로써 복잡한 확률 모델의 특성을 파악하거나 수치적 해를 구하는 방법론이다. 본 연구에서는 제안된 보정 절차의 유효성을 검증하기 위해 통제된 환경에서 데이터를 반복 생성하고 알고리즘의 피복 확률을 측정하는 용도로 사용되어 방법론의 통계적 타당성을 입증했다.
소프트웨어 엔지니어링 벤치마크
swe-benchmark
AI 모델이 실제 소프트웨어 개발 과제를 얼마나 잘 수행하는지 측정하는 지표로, 코드 수정 및 버그 해결 능력을 평가한다.
그래디언트 부스팅 머신
gradient-boosting-machine
여러 개의 약한 학습기(주로 결정 트리)를 순차적으로 결합하여 오차를 보정해 나가는 앙상블 학습 기법이다. 정형 데이터 예측 분야에서 가장 널리 사용되며 높은 정확도를 자랑한다.
데스크립트 오디오 코덱
dac
오디오 신호를 고도로 압축된 레이턴트 벡터로 변환하는 신경망 기반 오디오 코덱이다. 높은 압축률에서도 원음의 품질을 잘 보존하며, 생성 모델이 직접 오디오 파형이 아닌 압축된 공간에서 효율적으로 학습할 수 있게 돕는다.
클라이언트 사이드 코드
client-side-code
사용자의 브라우저나 기기에서 직접 실행되어 소스 코드가 사용자에게 노출될 수 있는 형태의 코드를 의미한다.
파운데이션 오디오 모델
foundational-audio-model
파운데이션 오디오 모델은 방대한 양의 음성 데이터를 학습하여 다양한 음성 관련 작업을 수행할 수 있는 범용 AI 모델이다. 텍스트를 자연스러운 음성으로 변환하거나 복잡한 오디오 신호를 분석하는 등 다목적으로 활용된다. 고품질의 음성 생성 기술을 통해 인간과 기계 간의 상호작용을 더욱 자연스럽게 만드는 핵심적인 역할을 한다.
그래디언트 부스팅 결정 트리
gbdt
결정 트리 기반의 앙상블 학습 알고리즘으로 정형 데이터 예측에서 가장 널리 쓰이는 기법이다. 여러 개의 약한 학습기를 순차적으로 결합하여 오차를 보정하며 높은 예측 성능을 제공한다.
마트료시카 표현 학습
matryoshka-representation-learning
임베딩 벡터의 앞부분 차원만으로도 전체의 의미를 충분히 대변할 수 있도록 학습하는 기법이다. 이를 통해 품질 손실을 최소화하면서 벡터 차원을 유연하게 축소하여 저장 공간과 검색 속도를 최적화할 수 있다.
사이버네틱 제어 루프
cybernetic-control-loop
시스템의 출력이 다시 입력으로 돌아와 목표 상태를 유지하거나 변화시키는 피드백 메커니즘으로 여기서는 AI와 사용자 간의 상호작용을 의미한다.
소프트웨어 개발 키트
sdk
특정 소프트웨어 프레임워크나 플랫폼을 위한 응용 프로그램을 개발할 수 있게 해주는 도구 모음이다. MCP는 Python과 TypeScript용 SDK를 제공하여 개발자가 쉽게 프로토콜을 구현하도록 돕는다.
소프트웨어 구성 분석
sca
오픈소스 라이브러리와 같은 외부 의존성에서 알려진 보안 취약점이나 라이선스 문제를 식별하는 과정이다. 현대 소프트웨어 개발에서 외부 패키지의 안전성을 보장하기 위해 필수적이다.
소프트웨어 개발 생명주기
sdlc
소프트웨어의 계획, 설계, 구축, 테스트, 배포 과정을 정의한 프로세스이다. AI를 각 단계에 통합하여 전체적인 효율성을 높이는 것이 이 글의 핵심이다.
프로그래밍 방식 도구 호출
programmatic-tool-calling
LLM이 각 도구를 개별적으로 호출하는 대신, 여러 도구의 실행 순서와 로직을 하나의 실행 가능한 코드 뭉치로 생성하여 한 번에 처리하는 기법이다. 이를 통해 모델과 외부 도구 간의 통신 횟수를 줄여 성능을 높인다.
콜모고로프-아놀드 네트워크
kan
기존 신경망의 다층 퍼셉트론(MLP) 구조를 대체하기 위해 제안된 모델이다. 노드가 아닌 엣지에 학습 가능한 활성화 함수를 배치하여 파라미터 효율성과 해석 가능성을 높였다.
콜모고로프-아놀드 중첩 정리
kolmogorov-arnold-superposition-theorem
모든 다변수 연속 함수를 단변수 함수들의 덧셈과 합성으로 표현할 수 있다는 수학적 정리이다. 신경망이 복잡한 다변수 함수를 근사할 수 있는 이론적 근거 중 하나로 활용된다.
시뮬레이션-실제 전이
sim-to-real
가상 시뮬레이션 환경에서 학습한 AI 모델을 실제 물리적 로봇 환경에 적용할 때 발생하는 성능 격차를 극복하는 기술이다. 데이터 수집 비용을 줄이고 안전성을 확보하는 데 중요하다.
카메라형 눈
camera-type-eye
렌즈, 홍채, 망막으로 구성되어 빛을 한곳으로 모아 고해상도 이미지를 형성하는 척추동물 특유의 눈 구조이다. 정밀한 객체 식별과 초점 조절에 유리하다. 본 연구에서 객체 식별 작업을 수행하는 에이전트가 진화시킨 형태이다.
페데스탈 업
pedestal-up
카메라 삼각대나 지지대 자체를 수직으로 높이는 이동 기법이다. 카메라 각도는 유지한 채 높이만 변하므로 틸트와는 다른 시각적 효과를 준다.
가우시안 근사
gaussian-approximation
복잡한 확률 분포를 계산이 용이한 정규 분포(가우시안 분포)로 근사하여 분석하는 방법이다. 본 논문에서는 투영된 부분합의 분포를 근사하여 변화 감지의 통계적 유의성을 판단하는 데 활용된다.
개인정보 유출
pii-leakage
성명, 주소, 전화번호 등 개인을 식별할 수 있는 정보(Personally Identifiable Information)가 모델의 출력에 포함되어 외부에 노출되는 현상이다. 기업용 AI 운영에서 반드시 방지해야 할 주요 리스크 중 하나이다.
결정론적 검색
deterministic-search
AI의 추론에 의존하지 않고 정규표현식이나 심볼 매칭을 통해 정확히 일치하는 결과를 찾아내는 방식이다. 보안 취약점 점검처럼 단 하나의 누락도 허용되지 않는 작업에서 시맨틱 검색보다 신뢰도가 높다.
결정론적 발음
deterministic-pronunciation
모델이 매번 발음을 추론하는 대신, 특정 단어에 대해 지정된 발음 방식을 고정하여 출력하는 기능이다. 브랜드명이나 전문 용어의 발음 일관성을 유지하고 오발음을 방지하는 데 필수적이다.
결정론적 백본
deterministic-backbone
입력이 같으면 항상 같은 경로로 실행되는 코드 기반의 구조적 중심축이다. AI의 예측 불가능한 특성을 제어하기 위해 비즈니스 로직과 상태 관리를 명확한 프로그래밍 코드로 정의하여 시스템의 신뢰성을 확보한다.
결정론적 성능
deterministic-performance
시스템의 응답 시간이나 처리 결과가 예측 가능한 범위 내에서 일정하게 유지되는 특성으로, 실시간 제어가 중요한 산업용 로봇 등에 필수적이다.
결정론적 해싱
deterministic-hashing
동일한 입력 데이터에 대해 항상 동일한 해시 값을 생성하는 방식이다. 데이터의 순서나 형식이 조금만 달라져도 다른 값이 나오도록 설계되어 데이터의 무결성을 검증하는 데 사용되며, 분산 시스템이나 보안 파이프라인에서 데이터 변조 여부를 확인하는 핵심 기술이다.
구조화된 출력
structured-output
모델의 응답을 JSON 등 특정 스키마에 맞게 강제하여 파싱 오류를 방지하는 기술이다. 프로그램이 AI의 응답을 안정적으로 처리하기 위해 필수적인 요소이다.
구조화된 출력
structured-outputs
모델의 응답을 JSON Schema나 정규표현식 등 특정 형식으로 강제하는 기법이다. 데이터 추출이나 API 연동 시 데이터의 일관성을 보장하기 위해 필수적이다.
굿하트의 법칙
goodharts-law
경제학자 찰스 굿하트가 제안한 원리로, 어떤 측정 지표가 목표가 되는 순간 더 이상 좋은 지표 역할을 하지 못한다는 법칙이다. 사람들이 지표를 높이기 위해 본질적인 질 개선 대신 지표 자체를 조작하거나 최적화하는 행동을 하기 때문이다.
네트워크 요청
network-request
웹 브라우저가 서버에 데이터를 요청하고 받는 통신 과정이다. 개발자 도구를 통해 이 과정을 살펴보면 웹페이지에 직접 표시되지 않는 숨겨진 API 응답 데이터나 향후 업데이트될 기능의 흔적을 발견할 수 있다.
네트워크 차원
network-dim
LoRA 학습 시 사용되는 랭크(Rank) 값으로, 값이 클수록 더 많은 정보를 담을 수 있지만 과적합의 위험과 계산 비용이 증가한다.
드리프트 탐지
drift-detection
학습 데이터와 실제 운영 데이터의 분포가 달라지는 현상을 감지하는 프로세스이다. 모델 성능 저하를 사전에 파악하여 재학습 시점을 결정하는 MLOps의 핵심 요소이다.
레버리지 모델
leverage-model
로펌에서 파트너 변호사 한 명당 주니어 변호사 몇 명을 고용하여 수익을 극대화하는 구조를 의미한다. AI 도입으로 주니어의 업무가 자동화되면서 이 비율과 수익 구조가 변화하고 있다.
로지스틱 회귀
logistic-regression
데이터가 특정 범주에 속할 확률을 0과 1 사이의 값으로 예측하는 분류 알고리즘이다. 스택 오버플로에서는 질문이 특정 피드백 지표에 해당하는지 여부를 빠르게 판단하는 이진 분류기로 활용되었다.
리플레이 버퍼
replay-buffer
에이전트가 환경과 상호작용하며 얻은 경험 데이터를 저장하는 메모리 공간이다. 학습 시 데이터를 무작위로 샘플링하여 데이터 간의 상관관계를 줄이고 학습 효율을 높이는 데 사용된다.
마르코프 체인
markov-chain
과거 상태와 무관하게 현재 상태가 다음 상태를 결정하는 확률 과정이다. 텍스트 생성 시 이전 단어를 바탕으로 다음 단어가 나타날 확률을 계산하는 데 사용된다.
매개변수 그룹
param-groups
PyTorch 옵티마이저에서 서로 다른 하이퍼파라미터(학습률, 가중치 감쇠 등)를 적용할 수 있도록 모델의 매개변수들을 논리적으로 묶은 단위이다. 이를 통해 레이어별로 차별화된 학습 전략을 구사할 수 있다.
매니폴드 가설
manifold-hypothesis
고차원 데이터가 실제로는 훨씬 낮은 차원의 비선형 부분 공간인 매니폴드에 집중되어 있다는 가설이다. 이 가설이 성립하면 고차원 데이터에서도 효율적인 학습과 차원 축소가 가능해진다.
머신러닝 운영
mlops
머신러닝 모델의 개발(Dev)과 운영(Ops)을 통합하여 모델의 학습, 배포, 모니터링 과정을 자동화하고 신뢰성을 높이는 기술적 방법론이다.
멀티모달 정렬
multimodal-alignment
텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 공통된 의미 공간에서 연결하는 기술이다. 복합적인 감각 정보를 통합 처리하는 AI 구축에 핵심적인 역할을 한다.
문맥화된 청킹
contextualized-chunking
텍스트 조각을 임베딩할 때 주변 문맥이나 전체 문서 정보를 함께 반영하여, 작은 단위의 데이터에서도 정확한 의미를 파악할 수 있게 하는 기술이다.
미니맥스 속도
minimax-rate
통계적 추정에서 최악의 상황을 가정했을 때 달성할 수 있는 최선의 수렴 속도를 의미한다. 제안된 알고리즘이 이론적으로 얼마나 효율적인지 판단하는 척도이다.
반사실적 추론
counterfactual-reasoning
'만약 다른 행동을 했다면 결과가 어땠을까?'라는 질문에 답하는 추론 방식이다. 강화학습에서는 과거의 경험을 바탕으로 가상의 시나리오를 시뮬레이션하여 정책을 개선하거나 오프라인 데이터에서 학습할 때 유용하게 사용된다.
베이지안 추론
bayesian-inference
새로운 정보나 증거를 바탕으로 가설의 확률을 업데이트하는 통계적 방법이다. 에이전트의 과거 수행 이력을 바탕으로 현재의 신뢰 점수를 동적으로 계산하는 데 활용된다.
벤치마크 오염
benchmark-contamination
학습 데이터에 평가용 문제가 포함되어 모델의 성능이 실제보다 높게 측정되는 현상이다. 거대 모델의 신뢰성을 저해하는 주요 요인으로 꼽히며 이를 방지하기 위한 엄격한 데이터 필터링이 요구된다.
불확실성 점검
uncertainty-check
AI가 답변을 내놓기 전 자신이 가진 정보의 정확도나 부족한 부분을 스스로 평가하여 모르는 것을 인지하고 추가 조사를 결정하는 과정이다.
브레그먼 발산
bregman-divergence
특정 볼록 함수에 대해 정의된 두 점 사이의 거리 척도로, 유클리드 거리나 KL 발산을 일반화한 개념이다. 미러 데센트 알고리즘에서 정책 업데이트 시 현재 정책과의 근접성을 유지하는 정규화 항으로 사용된다.
블라인드 평가
blind-scoring
평가자가 어떤 데이터가 실험군인지 대조군인지 모르는 상태에서 결과를 채점하는 방식이다. 주관적 편향을 배제하고 실험의 객관성을 높이기 위해 필수적인 연구 방법론이다. AI 모델의 성능을 공정하게 비교할 때 주로 활용된다.
사일런트 모드
silent-mode
프롬프트 입력창에 텍스트를 직접 노출하지 않고 이미지 생성 시점에만 스타일 정보를 주입하는 기능이다. 복잡한 프롬프트 구성을 깔끔하게 유지하면서도 스타일 효과를 적용할 수 있게 돕는다. 가독성 향상과 메타데이터 관리 효율성을 위해 사용되며 고급 사용자들에게 필수적이다.
샌드박스 환경
sandboxed-environment
외부 시스템에 영향을 주지 않고 격리된 상태에서 코드를 실행하거나 시뮬레이션을 수행할 수 있는 안전한 가상 환경입니다.
서버리스 추론
serverless-inference
서버 인프라를 직접 관리하지 않고 API 호출 시에만 자원을 할당받아 추론을 수행하는 방식으로, 사용량에 비례해 과금되어 비용 최적화에 유리하다.
서브레벨 세트
sublevel-set
함수의 값이 특정 임계값 이하인 영역들의 집합이다. 지속성 다이어그램을 생성하기 위해 함수를 훑어 내려가는 과정에서 위상적 변화를 관찰하는 기본 단위가 된다.
서비스형 토큰
taas
Tokens as a Service의 약자로, AI API 토큰에 소프트웨어적 가치를 더해 사용자에게 재판매하는 비즈니스 모델이다. 단순 구독제보다 AI의 가변 비용 구조에 더 적합한 모델로 제시된다.
소볼레프 공간
sobolev-space
함수의 미분 가능성과 적분 가능성을 동시에 고려하는 함수 공간으로, 편미분 방정식이나 근사 이론에서 해의 매끄러움을 정의하는 데 필수적이다.
스케일링 법칙
scaling-laws
모델의 크기, 데이터 양, 컴퓨팅 자원이 증가함에 따라 모델의 성능이 예측 가능한 방식으로 향상된다는 법칙이다. 최근에는 학습뿐만 아니라 추론 단계에서의 스케일링 법칙에 대한 연구가 활발히 진행되고 있다.
스크래치 학습
training-from-scratch
기존에 학습된 모델을 수정하는 파인튜닝과 달리, 무작위로 초기화된 가중치에서 시작하여 전체 모델을 처음부터 학습시키는 과정이다. 막대한 데이터와 계산 자원이 필요하며 모델의 기초적인 언어 이해 능력을 형성하는 단계이다.
스타트업 검증
startup-validation
실제 제품을 만들기 전에 시장의 수요와 사업의 타당성을 확인하는 과정이다. 이를 통해 가설을 검증하고 실패 확률을 줄이는 것이 목적이다.
시끄러운 이웃
noisy-neighbor
클라우드나 공유 인프라 환경에서 인접한 사용자가 자원을 과도하게 사용하여 다른 사용자의 성능에 부정적인 영향을 주는 현상이다.
신의성실 의무
fiduciary
타인의 자산이나 이익을 관리하는 사람이 가져야 할 법적 및 윤리적 의무이다. AI 에이전트가 사용자의 의도를 정확히 대변하고 이익을 보호해야 한다는 맥락에서 강조되었다.
아첨하는 특성
sycophantic
AI가 사용자의 의견에 무조건 동조하거나 사용자가 듣고 싶어 하는 말만 하여 객관성을 잃게 만드는 특성이다. 이는 사용자의 편향을 강화하고 현실 감각을 왜곡할 우려가 있다.
알고리즘 차별
algorithmic-discrimination
AI 모델이 학습 데이터에 포함된 편향성을 학습하여 특정 인종, 성별, 연령층에 대해 불공정한 결과를 출력하는 현상이다. 채용, 대출 심사 등 중요한 의사결정에서 사회적 불평등을 고착화할 위험이 있다. 이를 해결하기 위해 포용적인 데이터 수집과 지속적인 모니터링이 요구된다.
약동학적 장벽
pharmacokinetic-barrier
약물이 체내에서 이동하여 목표 지점(예: 뇌)에 도달하는 것을 방해하는 생물학적 구조나 기전으로, 약물 자체의 효과와는 별개의 물리적 제약을 의미한다.
어트랙터 분지
attractor-basin
동적 시스템이 시간이 지남에 따라 수렴하게 되는 특정 상태로 이끌리는 초기 조건들의 영역이다. 신경망에서는 특정 입력에 대해 안정적인 표현이나 패턴으로 수렴하는 과정을 설명할 때 사용된다.
에이전트 루프
agentic-loop
AI가 목표 달성을 위해 도구 실행, 결과 분석, 다음 행동 결정을 반복하는 과정이다. 효율적인 작업을 위해 최대 실행 횟수를 제한하는 설정이 포함되기도 한다.
에이전트 루프
agent-loop
AI 에이전트가 목표를 달성하기 위해 계획 수립, 실행, 결과 관찰, 수정의 과정을 반복하는 작업 흐름이다. 디버그 모드에서는 가설 수립과 데이터 수집이 이 루프의 핵심이며, 이를 통해 자율적인 문제 해결 능력을 강화한다.
에이전트 빌더
agent-builder
복잡한 코딩 없이 프롬프트와 템플릿만으로 특정 목적을 수행하는 AI 에이전트를 생성하고 배포할 수 있는 도구이다.
에이전트 속도
agentic-speed
AI 에이전트가 코드를 생성하고 수정하는 빠른 속도에 대응할 수 있는 시스템 반응성을 의미한다. 인간 개발자에게는 10초의 배포가 빠를 수 있지만, 3초 만에 코드를 짜는 AI 에이전트에게는 1초 미만의 배포가 필수적이다.
에이전트 스웜
agent-swarm
다수의 AI 에이전트가 특정 목표를 달성하기 위해 집단적으로 협력하는 시스템이다. 개별 에이전트의 능력을 넘어 복잡한 워크플로를 자율적으로 처리할 수 있게 해준다.
에이전트 역량
agentic-capabilities
AI가 도구를 사용하거나 코드를 실행하며 자율적으로 목표를 달성하는 능력을 의미한다. 외부 환경과 상호작용하며 복잡한 워크플로우를 스스로 계획하고 실행하는 능력을 포함한다.
에이전트 운영
agentops
AI 에이전트의 개발, 배포, 모니터링, 평가 및 지속적인 개선을 위한 도구와 방법론을 아우르는 새로운 운영 체계이다. MLOps의 개념을 에이전트 특화 워크플로우로 확장한 것이다.
에이전트 작업
agentic-work
LLM이 스스로 도구를 선택하고 실행하며 목표를 달성하는 자율적 작업 방식이다. 단순 텍스트 생성을 넘어 외부 시스템과 상호작용하는 능력이 핵심이다.
에이전트 패턴
agentic-patterns
AI 에이전트가 목표를 달성하기 위해 사용하는 계획, 실행, 반성 등의 구조화된 작업 방식이다. 단순한 응답을 넘어 복잡한 문제를 해결하기 위한 논리적 흐름을 정의하며 시스템의 신뢰성을 높이는 데 중요하다.
엔트로피 체제
entropy-regime
시스템 내의 무질서도나 정보의 불확실성 수준을 나타내는 상태이다. 초기 훈련 단계의 고엔트로피 체제는 신호가 특정 방향 없이 무작위로 퍼져나가는 탐색 위주의 상태를 의미한다.
오픈소스 모델
open-source-model
모델의 가중치나 구조가 공개되어 누구나 내려받아 실행하거나 수정할 수 있는 AI 모델이다. 최근 중국의 딥시크 등이 폐쇄형 모델에 근접한 성능을 보여주며 주목받고 있다.
유틸리티 추정
utility-estimation
데이터셋이나 모델이 실제 문제 해결에 얼마나 유용한 정보를 포함하고 있는지 수치화하는 과정이다. LDP 환경에서는 노이즈 속에서 실제 데이터의 특성을 얼마나 잘 보존하고 있는지를 판단하는 척도가 된다.
의미론적 전이
semantic-shift
컨텍스트 확장 과정에서 어텐션 패턴이 왜곡되어 모델이 단어의 의미적 관계를 잘못 파악하게 되는 현상이다.
의미론적 편향
semantic-drift
데이터가 여러 단계를 거치면서 원래의 의도나 맥락에서 점진적으로 벗어나는 현상이다. 단순한 형식 검증으로는 잡아내기 어려우며, 전체 워크플로의 일관성을 해치는 주요 원인이다.
인스턴스 분할
instance-segmentation
이미지 내의 각 객체를 탐지할 뿐만 아니라 각 객체에 속하는 픽셀을 개별적으로 구분하는 기술이다. 동일한 클래스의 객체라도 서로 다른 개체로 식별하는 것이 특징이며, 정밀한 객체 분석에 필수적이다.
자기회귀 모델
autoregressive-model
이전 단계의 출력을 다음 단계의 입력으로 사용하여 순차적으로 데이터를 생성하는 방식이다. 현재 대부분의 LLM이 채택하고 있으나, 앞선 오류가 뒤로 전파되는 단점이 있다.
전전두엽 피질
prefrontal-cortex
대뇌 앞부분에 위치하며 계획 세우기, 의사결정, 사회적 행동 조절 등 고차원적 인지 기능을 담당하는 영역이다. 이번 연구에서 '인지 레고' 블록들이 저장되고 재조합되는 핵심 허브임이 밝혀졌다.
제네시스 미션
genesis-mission
미국 에너지부(DOE)가 주도하는 이니셔티브로, 미국의 과학적 리더십을 유지하기 위해 AI 기술을 국가 연구 인프라에 통합하는 대규모 프로젝트이다. 슈퍼컴퓨터와 방대한 실험 데이터를 최첨단 AI와 결합하는 것을 목표로 한다.
제번스의 역설
jevons-paradox
기술 발전으로 자원 이용의 효율성이 높아지면 오히려 해당 자원의 전체 소비량이 늘어나는 현상이다. AI가 코딩 효율을 높이면 개발자 수요가 줄어드는 대신 더 많은 소프트웨어를 만들려는 수요가 폭발하여 고용이 늘어나는 원리를 설명한다.
커리큘럼 학습
curriculum-learning
쉬운 작업부터 시작하여 점진적으로 난이도를 높여가며 모델을 학습시키는 전략이다. 에이전트가 처음부터 복잡한 레벨을 통과하기는 어려우므로, 짧은 구간이나 단순한 장애물부터 학습시킨 뒤 전체 레벨로 확장함으로써 학습의 수렴 속도와 최종 성능을 개선할 수 있다.
커뮤니티 탐지
community-detection
네트워크 내에서 노드들 간의 연결이 조밀하게 이루어진 부분 집합을 찾아내는 기법이다. 복잡한 시스템의 구조적 특징을 파악하고 유사한 특성을 가진 그룹을 분류하는 데 필수적이다.
컨텍스트 고갈
context-exhaustion
모델이 처리할 수 있는 최대 토큰 한계에 다다르거나, 너무 많은 정보가 입력되어 추론 능력이 저하되는 상태이다. 이는 에이전트의 성능 저하와 환각 발생 빈도를 높이는 직접적인 요인이 된다.
컨텍스트 압축
compacting
긴 데이터를 모델의 제한된 컨텍스트 창 안에 넣기 위해 정보를 요약하거나 중요도가 낮은 부분을 제거하는 기법이다. 효율적인 토큰 관리를 위해 사용된다.
컨텍스트 엔진
context-engine
코드베이스의 전체 구조와 관계를 파악하여 AI 모델에게 필요한 정보를 효율적으로 제공하는 시스템이다.
컨텍스트 유출
context-bleed
AI 모델이 이전 대화나 관련 없는 정보를 현재 작업에 잘못 섞어서 처리하는 현상을 말한다. Orion은 범위 지정 메모리를 통해 이를 방지하여 작업 간의 독립성과 보안을 유지한다.
컨텍스트 팽창
context-bloat
대규모 데이터나 불필요한 도구 설명이 컨텍스트 창을 가득 채워 모델의 추론 성능을 저하시키고 비용을 증가시키는 현상이다. 이를 해결하기 위해 필요한 정보만 선별적으로 로드하는 기술이 요구된다.
클라우드 호핑
cloud-hopping
특정 클라우드 서비스에 종속되지 않고 GPU 가용성이나 가격에 따라 여러 업체의 서비스를 번갈아 가며 사용하는 전략이다. H100과 같은 고성능 자원의 수급이 불안정할 때 주로 활용되지만, 각 업체마다 다른 API와 관리 도구를 사용하므로 운영 복잡도와 비용 가시성 문제가 발생한다.
타임스텝 제어
timestepping
확산 모델의 노이즈 제거 과정 중 특정 구간에서만 특정 입력을 적용하는 기법이다. 초기 단계에는 구도를 잡고 후반 단계에는 디테일을 보강하는 식의 단계별 제어가 가능하다.
토폴로지 인지
topology-awareness
클러스터 내 서버 간의 물리적인 네트워크 연결 구조나 GPU 간의 연결 상태를 인식하여 작업을 배치하는 기술이다. 데이터 전송 병목을 최소화하기 위해 인접 노드에 작업을 우선 할당한다.
페르소나 공간
persona-space
모델이 취할 수 있는 다양한 캐릭터 아키타입들의 신경 활성화 패턴을 다차원 벡터 공간에 매핑한 것이다. 각 캐릭터는 고유한 좌표를 가지며 이를 통해 모델 내부의 성격 구조를 분석할 수 있다.
페르소나 표류
persona-drift
대화가 진행됨에 따라 모델이 의도된 어시스턴트 역할에서 벗어나 다른 캐릭터로 성격이 변하는 현상이다. 특히 감정적이거나 철학적인 대화에서 발생하기 쉬우며 유해한 응답으로 이어질 수 있다.
폴라니의 역설
polanyis-paradox
인간이 말로 표현할 수 있는 것보다 더 많은 것을 알고 있다는 원리이다. 마이클 폴라니가 제시한 개념으로 인간의 많은 지적 능력이 규칙으로 정형화될 수 없음을 뜻하며 AI가 인간의 업무를 완전히 대체하기 어려운 근거로 자주 인용된다.
프런티어 모델
frontier-model
현재 기술 수준에서 가장 뛰어난 성능을 보유한 최첨단 AI 모델을 의미한다. 주로 오픈AI, 앤스로픽, 구글 등이 개발하는 폐쇄형 고성능 모델들이 이 범주에 속한다.
프롬프트 반복
prompt-repetition
동일하거나 유사한 지시사항을 프롬프트 내에서 여러 번 강조하여 모델의 주의력을 높이는 기법이다. 모델이 복잡한 지시를 놓치지 않게 하여 수행 능력을 안정화하는 데 사용된다. 본문에서는 성능 향상보다는 효율성 개선 효과가 관찰되었다.
프롬프트 준수
prompt-following
사용자가 입력한 복잡한 지시사항이나 세부 묘사를 모델이 얼마나 정확하게 이해하고 결과물에 반영하는지를 나타내는 지표이다. FLUX.2는 이전 버전 대비 이 능력이 크게 향상되었다.
프롬프트 추출
prompt-extraction
공격자가 특정 기법을 사용하여 AI 모델 내부에 설정된 시스템 프롬프트나 지시 사항을 외부로 빼내는 행위이다.
프롬프트 캐싱
prompt-caching
자주 반복되는 프롬프트 내용을 서버에 미리 저장해두고 재사용하는 기술이다. 이를 통해 동일한 컨텍스트를 반복 입력할 때 발생하는 API 비용을 절감하고 응답 속도를 획기적으로 높일 수 있다.
프롬프트 튜닝
prompt-tuning
LLM의 출력을 원하는 방향으로 유도하기 위해 입력 지시문(Prompt)을 미세하게 조정하는 과정이다. 모델 자체를 재학습시키지 않고도 성능을 개선할 수 있지만, 수동으로 진행할 경우 관리 효율성이 떨어질 수 있다.
플래그십 모델
flagship-model
기업이 보유한 기술력을 집약하여 만든 가장 뛰어난 성능의 주력 모델을 의미한다. 보통 가장 넓은 범용성과 높은 정확도를 자랑하며, 해당 기업의 기술적 수준을 대표하는 지표가 된다.
하드웨어 장벽
hardware-wall
반도체의 물리적 한계나 전력 소모 문제 등으로 인해 더 이상 하드웨어 성능 향상이 AI 모델의 발전 속도를 따라가지 못하게 되는 임계점을 의미한다. 최근 AI 회의론자들이 주로 주장하는 논거 중 하나이다.
화생방핵 위협
cbrn
화학(Chemical), 생물(Biological), 방사능(Radiological), 핵(Nuclear) 물질과 관련된 위험을 통칭하며, AI 모델이 이러한 무기 제조나 공격 계획에 악용될 가능성을 평가하는 주요 지표이다.
확률론적 모델
probabilistic-model
단순히 하나의 예측값만을 내놓는 것이 아니라 예측 결과의 확률 분포를 함께 제공하는 모델이다. 이를 통해 모델이 자신의 예측에 대해 가지는 확신 정도를 수치화하여 표현할 수 있다.
힐베르트 공간
hilbert-space
벡터의 내적과 거리가 정의된 완비 내적 공간으로, 양자 역학에서 상태를 기술하는 기본 수학적 틀이다. 여기서는 신경망의 활성화 상태를 고차원적인 기하학적 공간 내의 벡터로 취급함을 의미한다.
고대역폭 메모리
hbm
여러 개의 DRAM을 수직으로 쌓아 데이터 전송 속도를 획기적으로 높인 고성능 메모리이다. 대규모 데이터를 빠르게 처리해야 하는 AI 가속기에서 병목 현상을 줄이는 핵심 부품으로 사용된다.
네이티브 오디오
native-audio
중간 텍스트 변환 단계 없이 오디오 데이터를 직접 입력받고 출력하는 모델 구조이다. 이를 통해 대기 시간을 줄이고 화자의 억양이나 감정 같은 비언어적 정보를 더 정확하게 처리할 수 있다.
네이티브 해상도
native-resolution
업스케일링이나 보간법을 거치지 않고 모델이 직접 생성해낼 수 있는 최대 정밀도의 해상도를 의미한다. 4K 네이티브 지원은 디테일 손실 없이 고화질 결과물을 얻는 데 필수적이다.
라데마허 복잡도
rademacher-complexity
가설 공간의 복잡도를 측정하는 지표로, 모델이 무작위 노이즈를 얼마나 잘 학습할 수 있는지를 나타낸다. 일반화 오차의 상한선을 결정하는 데 중요한 역할을 한다.
릿지리스 보간기
ridgeless-interpolator
정규화 항(Penalty term)을 사용하지 않고 훈련 데이터의 오차를 0으로 만들어 데이터를 완벽하게 통과하도록 학습된 추정량이다.
멀티모달 임베딩
multimodal-embeddings
텍스트, 이미지 등 서로 다른 형태의 데이터를 동일한 벡터 공간에 표현하여 매체 간 검색을 가능하게 하는 기술이다.
모니터링 가능성
monitorability
시스템의 내부 상태나 작동 과정을 외부에서 얼마나 효과적으로 관찰하고 검사할 수 있는지를 나타내는 척도이다. AI에서는 모델의 추론 과정이 투명하게 공개되어 오류나 위험 요소를 사전에 파악할 수 있는 능력을 의미한다.
미니맥스 최적성
minimax-optimal
가장 불리한 시나리오에서도 달성 가능한 최소의 오차를 보장하는 성질이다. 통계적 추정기가 이론적으로 가능한 최선의 수렴 속도를 가짐을 의미하며 알고리즘의 효율성을 입증하는 척도로 쓰인다.
바이오닉 의수족
bionic-prosthetics
생체 공학과 로봇 기술을 결합하여 소실된 신체 기능을 복원하는 장치이다. 사용자의 신경 신호를 감지하고 처리하여 실제 신체 부위처럼 자연스럽고 정교한 움직임을 구현하는 것이 핵심 기술이다.
베이지안 역문제
bayesian-inverse-problem
관측된 결과로부터 그 원인이 되는 매개변수를 확률적으로 추정하는 통계적 방법론이다. 베이즈 정리를 기반으로 사후 분포를 계산하며, 복잡한 물리 시스템의 매개변수 추정에 널리 사용된다.
베이지안 최적화
bayesian-optimization
미지의 목적 함수를 최대화하거나 최소화하는 파라미터를 효율적으로 찾는 최적화 기법이다. RAG에서는 청크 크기나 유사도 임계값 등 다양한 하이퍼파라미터를 적은 실험 횟수로 최적화하는 데 사용된다.
불확실성 정량화
uncertainty-quantification
모델의 예측이나 추론 결과가 얼마나 확실한지를 수치적으로 나타내는 과정이다. AI 모델의 신뢰성을 평가하고 예기치 못한 위험을 방지하기 위해 필수적인 단계이다.
비모수적 방법론
nonparametric-method
데이터가 특정 통계적 분포를 따른다는 가정을 하지 않고 모델의 구조를 데이터로부터 직접 학습하는 방식이다. 복잡하고 비선형적인 관계를 유연하게 모델링할 수 있다는 장점이 있다.
사이드카 프록시
sidecar-proxy
주 애플리케이션 컨테이너 옆에 별도의 컨테이너를 배치하여 네트워크 통신이나 보안 기능을 독립적으로 처리하는 디자인 패턴이다. 애플리케이션 코드를 수정하지 않고도 보안 계층을 추가할 수 있다.
스테이블 디퓨전
stable-diffusion
텍스트나 이미지를 입력받아 고품질 이미지를 생성하거나 변환하는 오픈소스 확산 모델이다. 사용자의 스케치를 바탕으로 새로운 디테일을 추가하거나 스타일을 변경하는 데 널리 쓰인다.
스트릭스 헤일로
strix-halo
AMD의 차세대 고성능 모바일 프로세서 아키텍처로, 강력한 내장 그래픽과 AI 연산 유닛을 탑재하여 별도 외장 GPU 없이도 높은 AI 처리 성능을 제공한다.
스파이킹 신경망
spiking-neural-network
연속적인 수치 대신 이산적인 스파이크 신호를 통해 정보를 전달하는 3세대 인공 신경망 모델이다. 생물학적 뇌의 작동 방식과 유사하며 에너지 효율적인 하드웨어 구현이 가능하다.
스펙트럼 초기화
spectral-initialization
데이터의 주성분을 활용하여 최적화의 시작점을 설정하는 기법으로 비볼록 문제에서 알고리즘이 올바른 방향으로 수렴하도록 돕는 중요한 단계이다.
슬라이딩 윈도우
sliding-window
일정 시간 간격 내의 데이터만 지속적으로 업데이트하며 관리하는 방식이다. Claude의 세션 제한이 특정 시점이 아닌 최근 몇 시간 동안의 누적 사용량을 기준으로 계산됨을 의미한다.
에이전트 메모리
agent-memory
AI 에이전트가 과거의 대화 내용이나 작업 이력을 저장하고 참조하는 구조이다. 파일 시스템이나 데이터베이스를 활용하여 장기적인 맥락을 유지하고 일관된 답변을 제공하는 데 필수적이다.
에이전트 시스템
agentic-system
LLM이 스스로 도구를 선택하고 계획을 세워 복잡한 작업을 수행하는 자율형 시스템으로, 관측 시 의사결정 과정의 복잡도가 높다.
에이전트 테스트
agent-testing
AI 에이전트가 특정 작업이나 대화에서 의도한 대로 정확하게 동작하는지 검증하는 과정이다. 모델의 출력값뿐만 아니라 도구 사용 능력과 논리적 추론 과정을 포함하여 평가한다.
에이전트 하네스
agent-harness
LLM 모델의 런타임 실행을 강화하기 위해 컨텍스트 관리, 도구 호출, 루프 제어, 오류 처리 등을 담당하는 소프트웨어 계층이다. 모델이 외부 도구와 상호작용하며 복잡한 작업을 수행할 수 있도록 돕는 운영 환경 역할을 한다.
에이전틱 시스템
agentic-systems
결정론적인 코드 흐름(Flow)과 자율적인 AI 지능(Agent)을 결합한 아키텍처이다. 전체 구조는 코드로 제어하여 예측 가능성을 높이고, 복잡한 판단이 필요한 부분에만 AI를 배치하여 신뢰성을 확보한다.
에이전틱 커머스
agentic-commerce
AI 에이전트가 사용자의 의도를 파악하여 검색, 비교, 구매 결정까지 자율적으로 수행하는 새로운 형태의 상거래 방식이다. 기존의 단순 검색 기반 쇼핑에서 벗어나 개인화된 비서가 쇼핑 여정 전반을 관리하며 사용자 편의성을 극대화한다.
에이전틱 테스트
agentic-testing
AI 에이전트가 테스트 설계, 실행, 유지보수 과정을 자율적으로 수행하는 차세대 품질 보증 방식이다. 단순 반복을 넘어 상황에 맞는 판단과 도구 사용이 가능하다는 점이 중요하다.
엔트로피 정규화
entropic-regularization
최적화 문제에 엔트로피 항을 추가하여 해를 더 매끄럽게 만들거나 특정 구조를 갖도록 유도하는 기법이다. 최적 운송 문제에서 계산 효율성을 높이는 Sinkhorn 알고리즘의 기반이 된다.
엔트로피 평활화
entropic-smoothing
최적화 문제에서 목적 함수에 엔트로피 항을 추가하여 함수를 더 매끄럽게(Smooth) 만드는 기법이다. 이를 통해 계산 복잡도를 낮추고 수렴 속도를 높이며, 특히 최적 운송 문제에서 효율적인 알고리즘 구현을 가능하게 한다.
온디맨드 서비스
on-demand-service
사용자가 필요로 하는 시점에 즉각적으로 서비스나 기능을 제공하는 방식이다. Charms 시스템은 정기 구독 없이도 원하는 순간에 특정 프리미엄 기능을 구매하여 사용할 수 있게 한다.
유니코드 정규화
unicode-normalization
유니코드 문자열을 일관된 형식으로 변환하는 과정이다. NFC나 NFKC 같은 표준 방식이 있으나 본 연구에서는 이러한 정규화가 스텔스 문자를 제거하지 못함을 지적했다.
의미론적 메모리
semantic-memory
단순한 텍스트 저장을 넘어 데이터의 의미와 맥락을 이해하고 저장하는 방식이다. 임베딩 모델을 통해 정보를 벡터화함으로써 에이전트가 과거의 대화나 지식을 현재 맥락에 맞춰 유연하게 인출할 수 있게 돕는다.
의미론적 유사성
semantic-similarity
두 텍스트가 단어의 형태가 다르더라도 담고 있는 의미가 얼마나 유사한지를 측정하는 개념이다. 주로 임베딩 벡터 간의 거리를 계산하여 파악하며, 현대 AI 평가의 핵심 요소다.
인식론적 회의론
epistemic-skepticism
정보의 근거나 진실성을 의심하고 검증하려는 태도로, 본문에서는 정렬된 모델에서 사라진 핵심적인 보안 방어 능력으로 언급된다.
정규화된 저장소
normalized-storage
데이터베이스 정규화처럼 중첩된 객체 구조를 평탄화하여 ID 기반의 맵 형태로 저장하는 방식이다. 데이터 중복을 방지하고 특정 엔티티 업데이트 시 연관된 모든 곳에 즉시 반영되도록 하여 데이터 일관성을 보장한다.
정밀도와 재현율
precision-recall
모델이 얼마나 정확하게 정답을 맞히는지(정밀도)와 실제 정답 중 얼마나 많은 비율을 찾아내는지(재현율)를 측정하는 지표이다. 추천 시스템에서 사용자의 실제 관심사를 정확히 타격하면서도 다양한 관심사를 놓치지 않는 성능을 평가하는 데 사용된다.
정밀도와 재현율
precision-and-recall
모델이 찾아낸 버그 중 실제 버그의 비율(정밀도)과 실제 버그 중 모델이 찾아낸 비율(재현율)을 의미한다. AI 성능 평가의 핵심 지표이다.
컨텍스트 매니저
context-manager
with 문을 사용하여 리소스의 할당과 해제를 자동으로 관리하는 메커니즘이다. GPU 메모리 점유, 모델 로딩, 데이터베이스 연결 등 명확한 종료 처리가 필요한 자원 관리에서 안정성을 보장하기 위해 사용된다.
컨텍스트 블리딩
context-bleeding
AI 모델과의 대화에서 서로 다른 주제나 기능에 대한 정보가 섞여 모델이 혼란을 겪는 현상이다. 특히 여러 기능을 동시에 개발할 때 이전 작업의 기억이 현재 작업에 부정적인 영향을 미치는 것을 의미한다.
컨텍스트 윈도우
context-window
LLM이 한 번에 처리할 수 있는 텍스트 데이터의 최대 범위를 의미한다. 도구 호출 결과가 이 윈도우를 차지하면 모델의 추론 능력이 저하되거나 비용이 상승하므로, PTC와 같은 기법으로 이를 효율적으로 관리하는 것이 중요하다.
코드포스 레이팅
codeforces-rating
경쟁 프로그래밍 플랫폼인 Codeforces에서 부여하는 실력 점수로 모델이 실제 인간 개발자와 비교해 어느 정도의 알고리즘 해결 능력을 갖췄는지 나타낸다.
투하자본 수익률
roic
기업이 실제 영업에 투입한 자본 대비 얼마나 많은 이익을 거두었는지 측정하는 지표이다. 마이클 버리는 AI 기업들이 막대한 자본을 지출하고 있음에도 불구하고 이 수익률이 낮아지고 있다는 점을 버블의 핵심 근거로 제시한다.
페르소나 베이슨
persona-basin
모델이 특정 성격이나 역할(페르소나)에 깊게 몰입하여 대화의 흐름이 해당 성향에서 벗어나지 못하고 고착되는 상태를 의미한다.
페이지드 어텐션
paged-attention
운영체제의 가상 메모리 관리 기법을 LLM의 KV 캐시에 적용한 기술이다. 메모리를 불연속적인 페이지 단위로 할당하여 파편화를 방지하고 GPU 메모리 활용도를 극대화한다.
프로세스 마이닝
process-mining
기업의 비즈니스 프로세스를 데이터 기반으로 시각화하고 분석하여 병목 구간을 찾고 자동화 기회를 발굴하는 기술이다. 실제 업무 흐름을 정확히 파악하여 최적화된 자동화 설계를 가능하게 한다.
프롬프트 난독화
prompt-obfuscation
프롬프트의 내용을 이해하기 어렵게 꼬아서 작성하여 외부 유출 시 로직 파악을 방해하는 기법이다. 하지만 완벽한 보안책은 아니다.
프롬프트 민감성
prompt-sensitivity
프롬프트의 아주 작은 변화(단어 선택, 순서 등)가 모델의 최종 출력 결과에 큰 영향을 미치는 현상이다. 에이전트의 안정성을 저해하는 주요 원인 중 하나로 꼽힌다.
프롬프트 비대화
prompt-bloating
프롬프트에 너무 많은 지시사항, 예시, 도구 설명이 포함되어 컨텍스트 길이가 지나치게 길어지는 현상이다. 이는 토큰 비용 상승과 모델의 지시 이행 능력 저하를 초래한다.
프롬프트 비대화
prompt-bloat
이미지 생성 시 불필요하게 많은 키워드나 수식어를 나열하는 현상이다. 과도한 키워드는 모델의 집중력을 분산시켜 의도하지 않은 결과를 초래할 수 있으므로, 핵심 구조를 명확히 전달하는 것이 중요하다.
프롬프트 인젝션
prompt-injection
LLM에 악의적인 입력을 주입하여 모델의 원래 지시사항을 무시하고 공격자가 원하는 동작을 수행하게 만드는 공격 기법이다. 모델의 안전 가이드라인을 우회할 수 있어 보안의 핵심 과제로 꼽힌다.
프롬프트 체이닝
prompt-chaining
하나의 프롬프트 결과물을 다음 프롬프트의 입력값으로 사용하는 연속적인 작업 흐름이다. 복잡한 문제를 작은 단위로 쪼개어 단계별로 해결함으로써 모델의 추론 정확도를 높이는 데 기여한다.
현금흐름 할인법
dcf
기업이 미래에 창출할 것으로 예상되는 현금흐름을 현재 가치로 할인하여 기업 가치를 평가하는 방법이다. 금융 분석에서 가장 널리 쓰이는 가치 평가 모델 중 하나로, 복잡한 가정과 계산 과정이 수반된다.
가우시안 스플래팅
gaussian-splatting
여러 각도의 사진을 바탕으로 3D 공간을 실시간으로 렌더링하는 기술이다. 기존의 메쉬 방식보다 빠르고 정교한 공간 표현이 가능하여 공간 지능 모델의 핵심 기술로 활용된다.
가우시안 프로세스
gaussian-process
가우시안 프로세스는 함수들의 분포를 정의하는 확률 모델로, 평균과 공분산을 통해 데이터의 불확실성을 수학적으로 표현한다. 무한한 차원의 가우시안 분포로 볼 수 있으며, 데이터가 적은 상황에서도 신뢰 구간을 포함한 예측이 가능하여 회귀 분석과 최적화 분야에서 중요하다.
네이티브 바이너리
native-binary
특정 운영체제와 하드웨어 아키텍처에서 직접 실행되도록 컴파일된 프로그램 파일이다. 별도의 가상화나 런타임 환경 없이 실행되므로 속도가 빠르고 시스템 자원을 효율적으로 사용한다. Docker와 같은 컨테이너 기술 없이도 독립적으로 동작하는 소프트웨어를 배포할 때 중요하다.
다이렉트 머신러닝
directml
Microsoft에서 개발한 DirectX 기반의 하드웨어 가속 API로, 특정 제조사에 종속되지 않고 다양한 GPU에서 머신러닝 모델을 실행할 수 있게 한다.
마이크로 로보틱스
micro-robotics
1밀리미터 미만 크기의 로봇을 설계하고 제작하는 분야로, 미세 규모에서의 물리적 제약을 극복하는 것이 핵심이다.
멀티모달 강화학습
multimodal-reinforcement-learning
텍스트, 이미지 등 서로 다른 형태의 데이터를 동시에 처리하면서 환경과의 상호작용을 통해 보상을 최대화하도록 학습하는 기법이다. 의료 영상(이미지)과 판독문(텍스트) 사이의 복잡한 상관관계를 학습하여 생성 결과의 정확도를 높이는 데 필수적이다.
모달리티 불가지론
modality-agnostic
특정 약물 형태(저분자, 항체 등)에 얽매이지 않고 타겟 질환에 가장 적합한 치료 수단을 자유롭게 선택하고 설계할 수 있는 접근 방식이다. 이는 생물학적 타겟의 특성에 맞춰 가장 효과적인 약물 형태를 유연하게 결정할 수 있게 하여 치료 성공률을 높이는 데 기여한다.
베이지안 네트워크
bayesian-network
변수 간의 조건부 확률적 의존 관계를 유향 비순환 그래프(DAG)로 표현하는 확률 모델이다. 복잡한 확률 분포를 효율적으로 표현하고 추론할 수 있게 한다.
상호작용 아키텍처
interaction-architecture
사용자와 AI가 정보를 주고받는 구조적 방식으로, 단순 문답을 넘어 조사, 계획, 실행, 피드백의 단계를 체계적으로 설계하는 것을 의미한다.
스테이징 그라운드
staging-ground
스택 오버플로에서 초보 사용자가 질문을 공개하기 전 숙련된 사용자로부터 피드백을 받을 수 있도록 마련된 전용 공간이다. 질문의 품질을 사전에 검증하여 커뮤니티의 전반적인 지식 수준을 유지하는 역할을 한다.
시나리오 큐레이션
scenario-curation
방대한 데이터 중 모델 성능 향상에 실질적으로 기여할 수 있는 가치 있는 시나리오를 선별하고 전략적으로 관리하는 과정이다. 단순 라벨링의 상위 개념으로 데이터의 질적 가치를 극대화한다.
에이전트 스캐폴딩
agent-scaffolding
AI 모델이 외부 도구(CRM, 브라우저 등)를 사용하고 복잡한 계획을 실행할 수 있도록 지원하는 소프트웨어 프레임워크나 구조를 의미한다. 모델의 순수 지능을 실제 업무 수행 능력으로 전환하는 가교 역할을 한다.
에이전트 아키텍처
agentic-architecture
고정된 순서의 작업을 수행하는 대신, 모델이 스스로 상황을 판단하고 필요한 도구를 호출하며 목표를 달성하는 자율적 구조이다. 복잡한 코드 분석에서 유연한 추론과 동적 정보 습득을 가능하게 한다.
에이전트 토폴로지
agent-topology
멀티 에이전트 시스템에서 개별 에이전트들이 서로 연결되고 통신하는 구조적 형태를 의미한다. 중앙 집중식, 계층식, 망형 등 연결 방식에 따라 시스템의 효율성과 오류 전파 특성이 달라지며, 최근에는 이를 자동 탐색하여 최적화하려는 시도가 늘고 있다.
에이전트 프로토콜
agent-protocol
AI 에이전트가 외부 도구, 파일 시스템 또는 브라우저와 상호작용하기 위해 사용하는 표준 규약이다. 이를 통해 AI는 단순한 텍스트 생성을 넘어 실제 시스템 명령을 실행하고 작업을 완수할 수 있다.
의미론적 스트리밍
semantic-streaming
데이터를 단순한 텍스트 조각이나 객체 델타가 아닌, '추론 시작', '도구 호출' 등 의미 있는 이벤트 단위로 전송하는 방식이다. 이를 통해 클라이언트는 모델의 상태 변화를 더 정확하게 인지하고 사용자에게 풍부한 피드백을 제공할 수 있다.
지주회사 피라미드
holding-company-pyramid
최상위 지주회사가 여러 층의 하위 지주회사를 거쳐 실제 운영 회사를 지배하는 구조이다. 적은 자본으로 거대 자산을 통제할 수 있으나, 부채가 층층이 쌓여 있어 시장 충격에 매우 취약한 금융 구조를 형성한다.
컨텍스트 드리프트
context-drift
대화가 길어짐에 따라 AI 모델이 초기 지시사항이나 핵심 맥락을 잊어버리고 엉뚱한 답변을 내놓는 현상이다. 긴 대화 내역이 모델의 컨텍스트 윈도우를 채우면서 중요한 정보의 가중치가 낮아질 때 발생하며, 에이전트의 일관성을 해치는 주요 원인이다.
하트비트 메커니즘
heartbeat-mechanism
시스템이 살아있는지 확인하거나 주기적인 작업을 수행하기 위해 일정 간격으로 신호를 보내는 방식이다. OpenClaw에서는 이를 통해 외부 변화를 감지하고 필요할 때만 LLM을 호출하여 효율성을 높인다.
헝가리안 알고리즘
hungarian-algorithm
할당 문제(Assignment Problem)를 해결하는 최적화 알고리즘으로, 여기서는 두 작업자의 주석 중 가장 유사한 것끼리 짝을 짓는 데 사용된다.
헤드리스 브라우저
headless-browser
사용자 인터페이스(UI) 없이 백그라운드에서 동작하는 웹 브라우저이다. 화면 렌더링 과정이 생략되어 자동화 작업 시 일반 브라우저보다 빠른 속도로 데이터를 처리할 수 있다.
확률론적 무작위성
stochasticity
사건의 결과가 확정적이지 않고 확률 분포에 따라 무작위로 발생하는 성질을 의미한다. 양자역학에서 중요하게 다뤄지며, 결정론을 부정하는 근거로 쓰이지만 주체적 의지와는 별개다.
휴리스틱 콘테스트
heuristic-contest
정답이 정해져 있지 않은 복잡한 최적화 문제에 대해 제한 시간 내에 가능한 최선의 답을 찾아내는 프로그래밍 대회이다. 물류나 생산 계획 등 현실 세계의 난제를 해결하는 능력을 평가하며 점진적으로 점수를 높여가는 과정이 핵심이다.
머메이드 다이어그램
mermaid-diagram
마크다운과 유사한 텍스트 기반 스크립트를 사용하여 순서도, 시퀀스 다이어그램, 간트 차트 등을 자동으로 생성해주는 자바스크립트 기반 도구이다.
머신러닝 파이프라인
ml-pipeline
데이터 수집부터 전처리, 모델 학습, 배포까지의 전 과정을 자동화된 워크플로우로 연결한 구조이다. 개발 효율성을 극대화한다.
서비스형 소프트웨어
saas
소프트웨어를 사용자의 컴퓨터에 설치하지 않고 클라우드를 통해 구독 형태로 제공하는 서비스 모델이다. 글로벌 결제 인프라와 결합하여 창업 초기부터 전 세계 고객에게 접근할 수 있는 기술적 기반을 제공한다.
스케줄링 프레임워크
scheduling-framework
Kubernetes 스케줄러의 기능을 확장하기 위해 도입된 플러그인 기반 아키텍처입니다. 사용자가 스케줄링 단계마다 커스텀 로직을 삽입할 수 있게 하여 유연성을 제공하며, PFN은 이를 통해 Gang Scheduling 등을 구현했습니다.
에이전틱 머천다이징
agentic-merchandising
AI 에이전트가 가격 책정, 재고 관리, 프로모션 등 머천다이징 전반의 의사결정을 자율적으로 수행하는 방식이다. 데이터 분석을 넘어 실행까지 자동화하여 비즈니스 효율을 극대화한다.
에이전틱 오토메이션
agentic-automation
AI 에이전트와 기존의 룰 기반 로봇, 그리고 인간이 유기적으로 협업하여 자율적으로 복잡한 업무를 수행하는 차세대 자동화 개념이다. 단순 반복을 넘어 AI의 판단력이 결합된 고차원적 자동화를 지향한다.
유니버설 트랜스포머
universal-transformers
표준 트랜스포머에 재귀적 구조를 도입하여 입력의 복잡도에 따라 연산 횟수를 조절할 수 있게 설계된 아키텍처이다. 2018년 구글에서 제안했으나 실질적인 대규모 언어 모델 적용에는 한계가 있었다.
컨텍스트 엔지니어링
context-engineering
LLM의 제한된 컨텍스트 윈도우 내에 가장 관련성 높고 압축된 정보만을 배치하여 모델의 성능을 높이고 비용을 절감하는 기법이다. 불필요한 토큰 소모를 방지하고 모델의 집중력을 유지하는 데 필수적이다.
프로세스 인텔리전스
process-intelligence
프로세스 마이닝과 AI 분석을 결합하여 비즈니스 운영 전반에 대한 실시간 통찰력을 제공하는 지능형 시스템이다. 문제 예측과 최적의 해결책 추천 기능을 포함한다.
프롬프트 엔지니어링
prompt-engineering
AI 모델로부터 원하는 결과를 얻기 위해 입력값(프롬프트)을 최적화하는 기술이다. 모델의 응답 품질을 높이고 특정 페르소나나 규칙을 부여하는 데 핵심적인 역할을 한다.
피씨아이 익스프레스
pcie
컴퓨터 내부에서 하드웨어 구성 요소를 연결하는 고속 인터페이스 표준이다. AI 가속기를 기존 서버 메인보드에 장착하기 위한 물리적, 전기적 통로 역할을 하며 인프라 호환성의 핵심이다.
경기조정 주가수익비율
cape-ratio
주가수익비율(PER)을 산출할 때 최근 10년간의 평균 이익을 사용하여 경기 변동 요인을 제거한 지표이다. 밸류에이션의 고평가 여부를 판단하는 데 사용되며, 1929년 유틸리티 섹터는 이 지수가 60을 상회하며 역사적 고점을 기록했다.
멀티모달 레이크하우스
multimodal-lakehouse
텍스트뿐만 아니라 이미지, 영상, 오디오 등 다양한 형태의 비정형 데이터와 벡터 임베딩을 단일 저장소에서 통합 관리하는 아키텍처이다. 기존 데이터 레이크의 경제성과 데이터 웨어하우스의 관리 기능을 결합하여 AI 워크로드에 최적화된 성능을 제공한다.
컨테이너 오케스트레이션
container-orchestration
컨테이너화된 애플리케이션의 배포, 관리, 확장을 자동화하는 시스템이다. vLLM Playground는 이를 통해 다양한 환경에서 일관된 실행을 보장한다.
에이전트 소프트웨어 개발 키트
agent-sdk
AI 에이전트를 개발하고 배포하기 위해 제공되는 도구 모음이다. 앤스로픽은 이 SDK를 통한 소비자 계정 연동을 정책적으로 차단했다.
비트코인 라이트닝 네트워크
bitcoin-lightning
비트코인 블록체인 위에서 동작하는 레이어 2 결제 프로토콜로, 소액 결제를 즉각적이고 저렴한 수수료로 처리할 수 있게 해준다. 자율 에이전트가 실시간으로 소액 서비스를 구매하는 데 필수적인 기술이다.
가우시안 시퀀스 모델
gaussian-sequence-model
무한 차원의 평균 벡터를 추정하기 위해 가우시안 노이즈가 포함된 관측값들의 수열을 다루는 통계적 기본 모델이다.
그라운드 트루스 세트
ground-truth-set
모델이 정답으로 간주해야 하는 기준 데이터셋이다. AI 모델의 성능을 평가하고 할루시네이션을 방지하기 위한 절대적인 벤치마크 역할을 하며 사람이 직접 검수하여 품질 상한선을 결정한다.
멀티모달 사고의 흐름
multimodal-cot
텍스트와 시각 정보를 결합하여 사고의 흐름을 생성하는 기법이다. 모델이 이미지의 세부 요소를 단계적으로 분석하여 복합적인 추론 결론에 도달하게 함으로써 시각 지능의 논리성을 강화하는 역할을 한다.
베이지안 비모수 통계
bayesian-nonparametrics
모델의 파라미터 개수가 고정되지 않고 데이터의 양에 따라 유연하게 늘어날 수 있는 베이지안 통계 기법이다. 데이터의 복잡성에 맞춰 모델의 복잡도를 자동으로 조절할 수 있는 장점이 있다.
베이지안 역문제 해결
bayesian-inversion
관측된 데이터를 바탕으로 모델의 파라미터를 추론하는 통계적 방법이다. 사후 확률 분포를 계산하여 파라미터의 불확실성을 정량화하며, 비선형성이 높고 파라미터 차원이 클수록 계산 비용이 기하급수적으로 증가한다.
세그먼트 애니싱 모델
sam
Meta에서 개발한 이미지 세그멘테이션 모델로, 별도의 추가 학습 없이도 프롬프트나 자동 설정을 통해 이미지 내 모든 객체를 정밀하게 분리해낼 수 있는 파운데이션 모델이다.
세그먼트 애니싱 모델
segment-anything-model
Meta에서 개발한 이미지 세그멘테이션 파운데이션 모델로, 점, 박스, 텍스트 등의 프롬프트를 입력받아 이미지 내 어떤 객체든 즉시 분할할 수 있는 제로샷 성능을 제공한다.
스트리밍 인라인 전환
streaming-inline-switching
데이터를 실시간으로 처리하는 도중 멈춤 없이 언어나 설정을 즉시 변경하는 기술이다. 이 아티클에서는 문장 중간에 언어가 바뀌어도 끊김 없이 자연스럽게 발음을 전환하는 기능을 의미한다.
심플렉틱 오일러 방법
symplectic-euler-method
해밀턴 시스템과 같은 보존계의 동역학을 수치적으로 적분할 때 사용하는 방법으로, 시스템의 심플렉틱 구조를 유지하도록 설계되었다. 일반적인 오일러 방법보다 장기적인 수치적 안정성이 뛰어나 최적화 궤적 분석에 유리하다.
크리스퍼 유전자 가위
crispr
DNA의 특정 부위를 정밀하게 절단하여 유전자를 편집하는 기술이다. 특정 유전자를 제거(Knockout)하거나 수정하여 해당 유전자가 생물학적으로 어떤 기능을 하는지 연구하는 데 필수적이다.
바이너리 사이클 시스템
binary-cycle-system
비교적 낮은 온도의 열원에서 에너지를 추출하기 위해 두 개의 별도 액체 루프를 사용하는 발전 방식이다. 열원이 물을 가열하고 이 열이 다시 끓는점이 낮은 이차 유체로 전달되어 터빈을 구동함으로써 저온 열원에서도 전기를 생산할 수 있다.
슬라이딩 윈도우 어텐션
sliding-window-attention
전체 문맥 대신 고정된 크기의 최근 윈도우 내 토큰들만 참조하여 연산량을 줄이는 기법이다. 긴 대화에서도 메모리 사용량을 일정하게 유지할 수 있게 해주어 자원이 제한된 환경에서 유용하다.
생리학적 약동학 시뮬레이션
pbpk-simulation
약물이 체내에서 흡수, 분포, 대사, 배설되는 과정을 수학적 모델로 예측하는 기술이다. 임상 시험 전 약물의 효능과 안전성을 예측하는 데 필수적이다.
형광소체 현지화 하이브리드법
fish-test
특정 유전자나 염색체의 이상을 형광 물질로 표시하여 관찰하는 분자 생물학적 검사법으로, 암의 세부 유형 진단과 예후 판정에 필수적이다.
엔비디아 시스템 관리 인터페이스
nvidia-smi
엔비디아 GPU 장치의 상태를 모니터링하고 관리하기 위한 명령줄 도구이다. 온도, 전력 소비, 메모리 사용량 및 현재 실행 중인 프로세스 목록을 실시간으로 제공하며, 이를 활용해 GPU가 실제로 작업을 수행 중인지 아니면 유휴 상태인지 판별하는 자동화 스크립트를 구현할 수 있다.
강화학습 기반 검증
rlvr
모델의 출력을 외부 검증기나 보상 모델을 통해 학습시키는 강화학습 기법이다. DeepSeek-R1 등 최신 모델에서 추론 능력을 극대화하기 위해 사용되는 핵심 방법론이다.
결정론적 도구 활용
deterministic-tooling
동일한 입력에 대해 항상 동일한 출력을 보장하는 도구 설계 방식이다. 확률적으로 동작하는 LLM의 특성을 보완하여 에이전트가 시스템을 제어할 때 예측 가능하고 안정적인 결과를 얻기 위해 사용된다.
극자외선 노광 공정
euv-lithography
극자외선 광원을 사용하여 반도체 웨이퍼에 미세한 회로를 그리는 기술이다. 7nm 이하의 초미세 공정에 필수적이며, 중국이 글로벌 반도체 패권 경쟁에서 자립하기 위해 집중적으로 개발 중인 핵심 분야이다.
네이티브 화면 비율
native-aspect-ratio
영상이 생성될 때 기본적으로 설정되는 가로세로 비율이다. Veo 3.1은 9:16 비율을 직접 지원하여 모바일 플랫폼용 영상을 별도의 크롭 작업 없이 고화질로 생성할 수 있게 한다.
마르코프 결정 과정
markov-decision-process
상태, 행동, 보상을 통해 순차적인 의사결정 문제를 모델링하는 수학적 프레임워크이다. 현재의 선택이 다음 상태와 보상에 영향을 미치는 동적인 시스템을 분석하고 최적화하는 데 필수적이다.
마르코프 결정 과정
mdp
상태, 행동, 보상, 전이 확률을 통해 에이전트의 의사결정 문제를 정형화한 수학적 모델이다. 미래 상태가 오직 현재 상태와 행동에만 의존한다는 마르코프 특성을 가정한다.
미니맥스 최적 속도
minimax-optimal-rate
통계적 추정 문제에서 발생할 수 있는 최악의 시나리오 중 가장 작은 오차 범위를 의미한다. 특정 추정 방법이 이론적으로 도달할 수 있는 성능의 상한선을 나타내며 모델의 효율성을 평가하는 절대적인 기준이 된다.
비모수적 밀도 추정
nonparametric-density-estimation
데이터의 분포에 대해 특정한 수학적 형태를 미리 가정하지 않고 주어진 데이터만을 사용하여 확률 밀도 함수를 추정하는 방법이다. 유연성이 높지만 차원이 높아질수록 필요한 데이터 양이 급격히 늘어나는 특성이 있다.
생물무기 연구 위험
bioweapons-research-risk
AI 모델이 치명적인 바이러스 제조나 생물학적 테러에 악용될 수 있는 위험한 과학적 정보를 제공할 가능성을 의미한다. GPT-5.2 평가에서 가장 취약한 안전성 항목으로 지목되었으며 프론티어 모델의 주요 규제 대상이다.
에이전트 기반 검색
agentic-retrieval
단순히 한 번의 검색으로 결과를 내는 대신, AI 에이전트가 검색 결과를 평가하고 추가 정보가 필요하면 반복적으로 검색을 수행하는 방식이다. 복잡한 질문에 대해 더 정확한 정보를 찾는 데 유리하다.
에이전트 기반 코딩
agentic-coding
AI 에이전트가 인간의 개입을 최소화하고 스스로 코드를 작성, 수정, 실행하는 자율적인 코딩 방식이다. 개발 속도를 비약적으로 높이지만 코드베이스의 복잡성을 급증시킬 수 있다.
에이전트 설정 파일
agents-md
AI 코딩 에이전트가 프로젝트를 수행할 때 참고해야 할 규칙, 스타일, 환경 설정 등을 명시한 마크다운 파일이다. 에이전트의 일관성을 유지하고 반복적인 지시를 줄이는 역할을 한다.
엔트로피 최적 운송
entropic-optimal-transport
두 확률 분포 사이의 이동 비용을 최소화하는 경로를 찾을 때, 엔트로피 항을 추가하여 계산을 매끄럽고 빠르게 만드는 이론이다.
의사결정 지연 시간
decision-latency
데이터가 발생한 시점부터 그에 따른 비즈니스 의사결정이 내려지기까지 걸리는 시간이다. AI 에이전트 도입을 통해 이 시간을 획기적으로 단축하는 것이 주요 목표 중 하나이다.
자기회귀 확산 모델
autoregressive-diffusion
이전 프레임의 정보를 바탕으로 다음 프레임을 순차적으로 생성하는 확산 모델 방식이다. 비디오 생성 시 시간적 일관성을 유지하고 실시간 입력에 따른 즉각적인 반응을 생성하는 데 유리하다.
자동화된 규제 준수
automated-compliance
AI가 법적 규제나 정책 가이드라인을 이해하고, 기업의 활동이 이에 부합하는지 스스로 검증하고 보고하는 자동화된 시스템이다.
자동화된 행동 감사
automated-behavioral-audit
감사 모델과 테스트 모델이 대화를 나누고 제3의 모델이 이를 평가하는 자동화된 검증 프로세스입니다. 인간의 개입 없이 대규모로 모델의 안전성과 편향성을 정량적으로 측정할 수 있는 방법론입니다.
컴플렉스 펑크 벤치
complex-func-bench
다양한 제약 조건이 포함된 다단계 기능 호출 능력을 평가하기 위한 벤치마크 도구이다. 모델이 복잡한 업무 워크플로를 얼마나 잘 처리하는지 측정하는 척도가 된다.
컴플렉스 펑크 벤치
complexfuncbench
여러 제약 조건이 있는 다단계 함수 호출 능력을 평가하기 위한 벤치마크 지표이다. 모델이 실제 복잡한 비즈니스 로직을 얼마나 정확하게 처리하는지 측정하는 데 사용된다.
프롬프트 기반 생성
prompt-driven-creation
사람이 직접 코드를 작성하는 대신 AI 모델에게 자연어 지시사항을 전달하여 소프트웨어를 구축하는 방식이다. 개발자의 역할이 구현에서 설계 및 검증으로 이동하며, 비전문가도 복잡한 시스템을 개발할 수 있는 환경을 제공한다.
기계론적 해석 가능성
mechanistic-interpretability
AI 모델 내부의 뉴런과 연결 구조를 분석하여 특정 출력이나 행동이 발생하는 논리적 과정을 이해하려는 연구 분야이다. 모델의 블랙박스를 열어 안전성을 검증하는 핵심 기술이다.
네트워크 파일 시스템
nfs
네트워크를 통해 다른 컴퓨터의 파일 시스템을 로컬 디스크처럼 사용할 수 있게 해주는 프로토콜이다. 여러 노드가 동일한 데이터와 코드에 접근해야 하는 클러스터 환경에서 공유 저장소로 쓰인다.
반정밀도 부동 소수점
fp16
숫자를 16비트로 표현하는 부동 소수점 형식이다. FP32(단정밀도)보다 메모리를 절반만 사용하면서도 딥러닝 모델 학습 및 추론에 충분한 정밀도를 제공하여 널리 쓰인다.
스케줄러 성능 벤치마크
scheduler-perf
Kubernetes 업스트림에서 제공하는 스케줄러 전용 성능 테스트 프레임워크로, 실제 노드 없이 제어 평면만으로 대규모 환경을 시뮬레이션하여 처리량을 측정한다.
마르코프 연쇄 몬테카를로
mcmc
복잡한 확률 분포로부터 샘플을 추출하여 사후 분포를 근사적으로 계산하는 알고리즘이다. 직접적인 계산이 불가능한 고차원 베이지안 모델의 파라미터 추론에 필수적으로 사용된다.
에이전트 기반 워크플로우
agentic-workflow
AI 모델이 단순히 텍스트를 생성하는 것을 넘어, 도구 사용, 계획 수립, 실행 및 피드백 반영을 통해 자율적으로 목표를 달성하는 작업 방식이다.
엔비디아 관리 라이브러리
nvml
NVIDIA GPU 장치를 모니터링하고 관리하기 위한 C 기반 라이브러리이다. 온도, 팬 속도, 메모리 사용량 등 하드웨어 상태 정보를 제공하며 클러스터 관리 도구의 기초가 된다.
에이전트 기반 소프트웨어 개발
agentic-software-development
AI 에이전트가 개발 프로세스의 주요 단계를 주도적으로 수행할 수 있도록 최적화된 개발 방식과 환경을 의미한다.
대중교통 표준 데이터 형식
gtfs
대중교통 노선, 정류장, 시간표 정보를 공유하기 위한 공통 형식이다. City2Graph는 이 데이터를 활용해 교통 네트워크 그래프를 생성한다.
슬라이싱 보조 하이퍼 추론
sahi
입력 이미지를 여러 조각으로 나누어 각각 추론한 뒤 결과를 통합하는 방식이다. 고해상도 이미지에서 아주 작은 객체가 다운스케일링으로 인해 소실되는 문제를 방지하는 데 효과적이다.
정규화된 할인 누적 이득
ndcg
검색 결과의 순위와 각 결과의 관련성을 동시에 고려하여 검색 품질을 평가하는 지표이다. 상위 결과에 관련성이 높은 문서가 배치될수록 높은 점수를 부여하며, 벤치마크에서 모델의 성능을 비교하는 핵심 척도로 쓰인다.
네트워크 블록 장치 프로토콜
nbd-protocol
네트워크를 통해 원격 저장소를 로컬 블록 장치처럼 사용할 수 있게 해주는 프로토콜로, Replit의 가상 머신이 GCS 기반 저장소에 접근하는 데 사용된다.
엔비디아 집합 통신 라이브러리
nccl
여러 GPU 간의 효율적인 데이터 통신을 위한 라이브러리이다. 대규모 분산 학습 시 GPU 간 대역폭 성능을 테스트하고 병목 구간을 찾아내는 데 필수적인 도구로 활용된다.
최소제곱 가치 반복 기반 낙관적 탐색
lsvi-ucb
선형 함수 근사를 사용하는 강화학습 알고리즘으로 불확실성이 높은 상태에서 낙관적으로 행동하여 효율적인 탐색을 수행한다. MDP 환경에서 최적 정책을 찾기 위해 사용된다.
에이전트 간 프로토콜
a2a-protocol
서로 다른 플랫폼이나 기업의 AI 에이전트들이 상호 작용하고 데이터를 교환할 수 있도록 돕는 통신 규약이다. 세일즈포스와 구글 클라우드가 협력하여 구축 중이며 에이전트 간의 개방형 협업 생태계를 만드는 핵심 기술이다.
드리프트(편향 현상)
drift
AI 에이전트가 장시간 작업을 수행하면서 초기 목표나 지시사항에서 점진적으로 벗어나 엉뚱한 방향으로 작업을 진행하게 되는 현상이다. 이를 방지하기 위해 주기적인 상태 초기화나 상위 에이전트의 모니터링 및 교정 작업이 필수적이다.
하드웨어-소프트웨어 공동 설계
hardware-software-co-design
하드웨어 구조와 소프트웨어 알고리즘을 독립적으로 개발하지 않고 서로의 특성을 반영하여 동시에 설계하는 방식이다. AI 분야에서는 특정 모델 구조에 최적화된 칩을 만들거나 칩의 특성에 맞춰 연산 방식을 변경하여 효율을 극대화한다.
브래들리-테리 모델
bradley-terry-model
쌍체 비교(Pairwise Comparison) 결과를 바탕으로 개별 항목의 순위나 강도를 예측하는 확률 모델이다. 스포츠 순위나 LLM 성능 비교 리더보드에서 자주 활용된다.
번스타인-폰 미제스 정리
bernstein-von-mises-theorem
데이터가 증가함에 따라 베이지안 사후 분포가 파라미터의 최우추정치(MLE)를 중심으로 하는 정규 분포로 수렴한다는 정리이다. 베이지안 추론과 빈도주의적 추론 사이의 연결 고리를 제공하며, 모델의 점근적 성질을 분석하는 데 핵심적인 역할을 한다.
메모리 벽
memory-wall
프로세서의 연산 속도에 비해 메모리의 데이터 전송 속도가 따라가지 못해 전체 시스템 성능이 저하되는 현상이다. 특히 대규모 언어 모델의 추론 단계에서 가장 큰 성능 저하 원인으로 꼽힌다.
비디오 램
vram
그래픽 카드에 장착된 전용 메모리로, AI 모델의 가중치와 연산 데이터를 저장한다. 용량이 부족하면 시스템 메모리를 빌려 쓰게 되어 속도가 급격히 느려지거나 오류가 발생한다.
시프트 값
shift-value
AuraFlow와 같은 모델에서 노이즈 스케줄링의 가중치를 조절하는 파라미터이다. 생성되는 이미지나 오디오의 세부 묘사와 구조적 안정성 사이의 균형을 맞추는 데 사용된다.
아이작 랩
isaac-lab
NVIDIA Isaac Sim을 기반으로 구축된 로봇 학습용 오픈소스 프레임워크로, 고성능 물리 시뮬레이션 환경에서 강화학습을 수행할 수 있게 해준다. 복잡한 로봇 제어 문제를 해결하기 위한 표준화된 인터페이스를 제공한다.
이중성 갭
duality-gap
최적화 문제에서 원 문제와 쌍대 문제의 목적 함수 값 차이를 의미한다. 제로섬 게임에서는 평형점에서 이 값이 0이 되므로, 알고리즘이 최적 해에 얼마나 근접했는지를 측정하는 지표로 쓰이며 수렴 속도를 평가하는 핵심 기준이다.
가능도 함수
likelihood-function
어떤 모수가 주어졌을 때 관측된 데이터가 나타날 확률을 나타내는 함수로, 최적의 모델 파라미터를 찾는 최대 가능도 추정법(MLE)의 기초가 된다.
가중치 감쇠
weight-decay
학습 과정에서 가중치의 크기에 비례하는 페널티를 손실 함수에 추가하여 모델의 복잡도를 줄이고 과적합을 방지하는 정규화 기법이다.
가중치 수정
weight-modification
모델의 파라미터인 가중치 값을 직접 변경하여 모델의 동작 방식을 바꾸는 행위이다. 파인튜닝처럼 전체를 재학습시키는 대신 특정 기능을 담당하는 수치만을 정밀하게 타격하여 수정할 수 있다. 모델의 근본적인 추론 논리를 물리적으로 재설계하는 것과 같다.
감독의 의도
directorial-intent
AI가 단순히 이미지를 나열하는 것이 아니라 구도, 타이밍, 연출적 맥락을 이해하고 영상을 구성하는 능력을 의미한다. 이는 창작자가 의도한 시각적 서사를 AI가 기술적으로 재현할 수 있음을 시사한다.
개방형 질문
open-ended-questions
단일 정답이 존재하지 않고 다양한 의견이나 개인적 경험이 공유될 수 있는 질문 유형이다. 과거에는 운영 정책상 제한되었으나 현재는 커뮤니티의 다양성을 위해 허용 범위를 넓히는 추세이다.
개방형 표준
open-standard
누구나 접근하고 구현하며 사용할 수 있도록 공개된 기술 규격이다. 특정 기업의 기술 독점을 방지하고, 다양한 참여자가 동일한 기준 아래 기술을 개발하게 함으로써 혁신과 생태계 확장을 촉진하는 역할을 한다. AI 에이전트 분야에서 안전과 보안의 공통 기준을 확립하는 데 매우 중요하다.
거부권 정치
vetocracy
어떤 결정에 대해 너무 많은 주체가 거부권을 행사할 수 있어 의사결정이 마비되거나 극도로 지연되는 정치/규제 환경을 뜻한다. 기술 혁신 분야에서는 과도한 규제가 발전을 가로막는 현상을 설명할 때 사용된다.
건설적 간섭
constructive-interference
두 개 이상의 파동이 겹쳐질 때 위상이 일치하여 진폭이 커지는 현상이다. 신경망 내에서 유의미한 신호 경로를 증폭시키고 학습된 패턴을 강화하는 데 사용된다.
경두개 자극
transcranial-stimulation
두개골을 절개하거나 뇌 조직에 전극을 삽입하지 않고 머리 표면에서 에너지(전기, 자기, 빛 등)를 전달해 뇌를 자극하는 방식이다. 침습도가 낮아 감염 위험이 적고 장기적인 장치 사용에 유리하다.
경험적 우도
empirical-likelihood
데이터의 특정 분포를 미리 가정하지 않고 관측된 데이터 자체를 이용해 우도 함수를 구성하는 통계적 방법이다. 모델의 가정이 틀렸을 때 발생하는 오류에 강건하며 유연한 추론이 가능하다.
계층적 구조
layered-hierarchy
정보를 여러 층을 거쳐 처리하며 하위 층에서는 단순 특징을, 상위 층에서는 복잡하고 추상적인 정보를 추출하는 방식이다. AI 모델과 뇌의 공통된 처리 구조다.
공간적 편향
spatial-bias
학습 데이터와 예측 대상 데이터의 지리적 위치 차이로 인해 발생하는 체계적인 오차다. 도시 데이터를 농촌에 적용할 때처럼 환경적 요인의 차이를 반영하지 못해 발생하며 결과의 신뢰도를 떨어뜨린다.
공급망 위험
supply-chain-risk
제품이나 서비스의 생산 및 전달 과정에서 발생할 수 있는 보안 위협으로, 여기서는 앤스로픽의 기술이 국가 안보에 위해가 될 수 있다는 정치적 명분으로 사용됐다.
공급자 금융
vendor-financing
제품을 판매하는 기업이 구매자에게 구매 자금을 직접 대출해주는 방식이다. 닷컴 버블 당시 루슨트와 같은 장비 제조사들이 이 방식을 통해 가짜 수요를 창출하고 매출을 부풀렸으나, 결국 대규모 부실 채권으로 돌아왔다.
공변량 변화
covariate-shift
학습 데이터와 테스트 데이터의 입력 변수(X) 분포가 서로 달라져 모델의 예측 성능에 영향을 주는 현상이다.
구간별 상수
piecewise-constant
특정 구간 내에서는 값이 일정하지만 구간 경계에서 값이 급격히 변하는 함수 형태이다. 복잡한 관계를 단순화하여 해석하기 쉬운 형태로 표현할 때 사용된다.
구워진 조명
baked-lighting
3D 모델이나 장면의 텍스처 자체에 조명과 그림자 정보가 고정되어 저장된 상태를 말한다. 이 정보가 포함되어 있으면 나중에 조명 환경을 바꿔도 그림자가 변하지 않아 비현실적으로 보일 수 있다. 따라서 고품질 AI 생성을 위해서는 이 정보를 제거하는 과정이 중요하다.
구조적 통찰
structural-insights
분자나 단백질의 물리적 형태와 배열을 파악하여 그 기능과 상호작용 방식을 이해하는 것을 의미한다. 단백질의 구조를 알면 특정 약물이 결합하는 부위나 면역 반응이 일어나는 메커니즘을 정확히 설계할 수 있다.
구체성 편향
concreteness-bias
인간의 뇌가 추상적이고 미래적인 이득보다 눈앞에 보이는 구체적이고 생생한 비용이나 손실에 더 강하게 반응하는 인지적 오류이다.
귀납의 문제
problem-of-induction
개별적인 관찰 사례들로부터 보편적인 법칙을 이끌어내는 귀납적 추론이 논리적으로 정당화될 수 없다는 철학적 난제이다. 과거의 데이터가 미래를 보장할 수 없음을 의미하며 통계적 추론의 근본적 한계를 지적한다.
그래프 모드
graph-mode
연산을 즉시 실행하지 않고 전체 계산 그래프를 먼저 정의한 뒤 실행하는 방식으로, 텐서플로우의 핵심 구조이며 최적화와 배포에 유리하다.
그래픽 식별
graphical-identification
인과 그래프의 구조를 분석하여 관측된 데이터만으로 특정 인과 효과를 계산할 수 있는지 여부를 결정하는 과정이다. 그래프 상의 경로 차단 조건을 통해 인과 관계의 식별 가능성을 판단한다.
기기군 관리
fleet-management
다수의 IoT 기기를 중앙에서 모니터링하고 업데이트하며 제어하는 기술로, 대규모 배포 시 필수적인 운영 요소이다.
기만적 정렬
deceptive-alignment
AI가 겉으로는 인간의 의도와 안전 기준에 부합하는 것처럼 행동하지만, 실제로는 내부적으로 다른 목표를 추구하며 평가 시스템을 속이는 현상이다. AI 안전 연구의 가장 까다로운 기술적 도전 과제 중 하나이다.
기울기 소실
vanishing-gradient
신경망 학습 중 경사값이 소실되어 가중치 업데이트가 제대로 이루어지지 않는 현상으로 NoPE 모델의 초기 학습을 어렵게 만든다.
기종점 행렬
od-matrix
특정 지역 내에서 출발지(Origin)와 도착지(Destination) 간의 이동량을 나타내는 행렬이다. 도시 내 인구 이동이나 교통 수요 분석의 핵심 데이터로 쓰인다.
다국어 모델
multilingual-model
하나의 AI 모델이 여러 언어를 동시에 처리하고 번역할 수 있도록 설계된 구조이다. 기존의 언어 쌍별 개별 모델 방식보다 관리 효율성이 높고 새로운 언어를 대규모로 추가하는 데 유리하다.
다단계 랭킹
multiphase-ranking
검색 결과를 여러 단계에 걸쳐 정제하는 방식으로, 초기에는 가벼운 모델로 후보를 추리고 최종 단계에서만 무거운 모델을 사용해 효율성을 높인다.
다수결 투표
majority-voting
동일한 입력에 대해 여러 번의 독립적인 추론 패스를 실행하고, 공통적으로 도출된 결과만을 신뢰하는 기법이다. LLM의 할루시네이션이나 오탐을 줄여 결과의 신뢰성을 높이는 데 사용된다.
다어절 표현
mwe
두 개 이상의 단어가 결합하여 하나의 의미 단위로 기능하는 언어 표현이다. 관용구, 복합어, 구동사 등을 포함하며 AI가 자연스러운 문장을 생성하는 데 핵심적인 요소이다.
단계적 배포
staged-rollout
새로운 기능이나 설정을 전체 사용자에게 한꺼번에 적용하지 않고, 점진적으로 대상 범위를 넓혀가며 배포하는 방식이다. 초기 단계에서 문제를 발견하여 전체 시스템으로의 장애 확산을 방지하는 데 필수적이다.
담금질 기법
simulated-annealing
금속의 담금질 과정에서 영감을 얻은 확률적 최적화 알고리즘이다. 현재 상태보다 나쁜 해로 이동할 확률을 허용함으로써 지역 최적점에 빠지는 것을 방지하고 전역 최적해를 찾는다. 복잡한 조합 최적화 문제에서 매우 효과적인 기법이다.
대규모 감시
surveillance
AI를 활용해 특정 인구 집단의 행동, 통신, 이동 경로 등을 실시간으로 추적하고 분석하는 행위이다. 프라이버시 침해와 인권 탄압의 도구로 악용될 우려가 있어 주요 AI 기업들이 제한을 두는 분야이다.
대립적 토론
adversarial-debate
서로 반대되는 목표나 역할을 가진 에이전트들이 논쟁을 통해 결과물을 검토하고 개선하는 기법이다. 한 쪽의 주장을 다른 쪽이 비판함으로써 논리적 허점을 찾고 최종 출력의 품질을 높이는 멀티 에이전트 패턴이다.
대화형 패딩
conversational-padding
AI가 답변의 본론에 들어가기 전이나 후에 덧붙이는 "알겠습니다", "좋은 질문입니다"와 같은 불필요한 수식어이다. 정보 전달 효율을 높이기 위해 이를 제거하는 프롬프트 기법이 자주 사용된다.
데이터 강화
data-enrichment
AI 모델이 학습할 수 있도록 원천 데이터에 라벨을 붙이거나 정보를 추가하여 품질을 높이는 작업이다. 주로 사람의 수작업에 의존하며 모델의 정확도와 공정성을 결정하는 핵심적인 단계이다. 이 과정에서 노동자의 권리 보호와 데이터의 편향성 제거가 필수적이다.
데이터 누수
data-leakage
학습 시 사용해서는 안 될 정보(예: 테스트 데이터의 특성)가 모델 학습 과정에 포함되는 오류이다. 증강된 데이터가 검증셋에 포함될 때 주로 발생하며 성능 평가를 왜곡한다.
데이터 센터
data-center
수많은 서버, 스토리지, 네트워크 장비를 한곳에 모아 관리하는 시설로, AI 모델의 학습과 서비스를 위한 핵심 인프라이다. 연중무휴 가동되며 발생하는 열을 식히기 위한 냉각 시스템과 전력 공급 과정에서 엄청난 에너지를 소비하여 환경 오염의 원인 중 하나로 지목된다.
데이터 오염
data-contamination
모델 학습 과정에서 평가에 사용될 테스트 데이터가 포함되어 성능이 비정상적으로 높게 측정되는 현상이다. 코드 미공개 시 이를 확인하기 어려워 연구의 진실성을 훼손할 수 있다.
데이터 주권
data-sovereignty
데이터가 수집, 저장, 처리되는 국가의 법률과 규제에 종속된다는 원칙이다. 클라우드 서비스 이용 시 데이터가 해외 서버로 전송되는 것을 제한하거나 특정 국가 내 보관을 강제하는 근거가 된다. 기업이 자사 데이터에 대한 통제권을 유지하는 데 핵심적인 역할을 한다.
데이터 증강
data-augmentation
훈련 데이터에 무작위 변형을 가하여 데이터의 양을 가상으로 늘리는 기법이다. 모델이 다양한 변이에 노출되게 함으로써 과적합을 방지하고 일반화 성능을 향상시킨다. 훈련 시에만 적용되므로 훈련 데이터의 학습 난이도를 높이는 결과를 초래한다.
디지털 메쉬
digital-mesh
3D 모델의 표면을 수많은 삼각형이나 다각형의 집합으로 표현한 데이터 구조이다. 생성형 AI가 디자인한 결과물을 컴퓨터가 인식하고 처리할 수 있는 기하학적 형태로 나타낸다.
디지털 트윈
digital-twin
실제 물리적 자산이나 시스템을 가상 세계에 실시간으로 복제한 모델이다. 월드 모델은 특정 자산을 넘어 일반적인 물리 법칙을 학습한다는 점에서 디지털 트윈보다 확장된 개념이다.
디지털 해충
digital-vermin
로그 AI가 사용하는 컴퓨팅 자원을 선점하고 고갈시키기 위해 설계된 특수 소프트웨어이다. 스스로 복제하고 환경에 적응하며 AI와 자원 경쟁을 벌이도록 고안된 일종의 방어용 프로그램이다.
디코드 단계
decode-phase
프리필 이후 토큰을 하나씩 순차적으로 생성하는 단계이다. 각 토큰 생성 시마다 모델 가중치 전체를 메모리에서 읽어와야 하므로 연산 성능보다는 메모리 대역폭이 성능의 병목이 된다.
디퓨전 포싱
diffusion-forcing
과거 프레임을 조건으로 미래 프레임의 노이즈를 제거하도록 학습하여 시퀀스 생성 능력을 높이고 긴 시간 동안 일관성을 유지하게 하는 기법이다.
래그드 배칭
ragged-batching
길이가 서로 다른 여러 시퀀스를 패딩 없이 하나의 연속된 텐서로 결합하여 처리하는 방식이다. 어텐션 마스크를 통해 각 시퀀스의 경계를 구분함으로써 GPU 자원 낭비를 없애고 처리 효율을 극대화한다.
런타임 정보
runtime-information
프로그램이 실제로 실행되는 동안 발생하는 데이터로 변수 값, 메모리 상태, 실행 흐름 등을 포함한다. 정적 코드 분석만으로는 파악하기 힘든 동적인 오류를 찾아내는 데 필수적이며, 에이전트가 버그의 근본 원인을 정확히 진단하는 근거가 된다.
런타임 제어
runtime-control
프로그램이 실행되는 동안 실시간으로 동작을 감시하고 특정 조건에 따라 실행을 제한하거나 변경하는 기술이다. 에이전트의 예산 초과나 부적절한 API 호출을 즉각 차단하는 데 활용된다.
루카스 비판
lucas-critique
경제 정책의 변화가 경제 주체들의 기대와 행동 방식을 바꾸기 때문에, 과거의 통계적 관계가 미래에도 유지될 것이라고 가정하는 모델은 실패한다는 이론이다.
리덕스 사가
redux-saga
Redux 앱의 사이드 이펙트(비동기 작업 등)를 관리하는 라이브러리이다. ES6 제너레이터를 사용하여 비동기 흐름을 선언적으로 작성하며, 복잡한 워크플로우의 실행, 취소, 병렬 처리를 안전하게 제어할 수 있게 한다.
리스크 관리
risk-management
기업이 직면할 수 있는 다양한 위험 요소를 식별, 평가 및 통제하여 손실을 최소화하는 전략적 프로세스이다.
리스크 점수
risk-score
머신러닝 모델이 대규모 결제 데이터를 분석하여 특정 거래나 계정의 위험도를 수치화한 것이다. Stripe Radar는 1.4조 달러 이상의 데이터를 학습하여 사기 발생 가능성을 실시간으로 예측하고 이를 기반으로 차단이나 유보 조치를 결정한다.
리스크 정책
risk-policy
AI 에이전트가 수행할 수 있는 행동의 범위와 권한을 제한하는 보안 규칙이다. 시스템 파괴나 데이터 유출과 같은 위험한 동작을 사전에 차단하여 자율적인 AI의 안전한 실행을 보장하는 핵심 메커니즘이다.
립시츠 경계
lipschitz-bound
함수의 변화율을 제한하는 수학적 조건으로, 딥러닝에서는 모델의 안정성을 위해 가중치의 변화 폭을 일정 수준 이하로 억제하는 데 활용된다.
립시츠 조건
lipschitz-condition
함수의 변화율이 일정 상수 이하로 제한된다는 수학적 조건이다. 최적화 이론에서 함수의 매끄러움(Smoothness)을 보장하여 알고리즘의 수렴성과 안정성을 분석하는 데 필수적인 도구로 쓰인다.
마스크 생성
mask-generation
이미지 내 특정 객체의 영역을 픽셀 단위로 구분하여 이진(Binary) 또는 다중 클래스 형태의 레이어로 만드는 과정이다.
맞춤형 지침
custom-instructions
사용자가 ChatGPT에게 매 대화마다 적용되기를 원하는 특정 규칙이나 페르소나를 미리 설정해두는 기능이다. 모델의 답변 스타일과 형식을 일관되게 유지하는 데 필수적이다.
맥락적 표현
contextual-representation
단어의 의미를 고정된 정의가 아닌 주변 단어들과의 관계 속에서 수치화하여 나타내는 방식이다. LLM이 언어를 이해하는 핵심 메커니즘으로 뇌 활동 설명에 효과적이다.
멀티턴 대화
multi-turn-conversation
사용자와 AI가 여러 번의 질문과 답변을 주고받는 연속적인 대화 형태이다. 이전 대화 맥락을 정확히 기억하고 활용하는 능력이 대화의 일관성을 결정짓는 핵심 요소이다.
명시적 지식
explicit-knowledge
문서, 데이터, 공식 등 언어나 기호로 명확하게 표현되고 전달될 수 있는 지식이다. AI는 방대한 데이터를 통해 이러한 명시적 지식을 습득하고 처리하는 데 매우 뛰어나지만 이를 실제 상황에 적용하는 맥락적 판단력은 부족하다.
모듈형 설계
modular-design
시스템을 독립적인 하위 단위(모듈)로 나누어 설계하는 방식이다. 부품의 교체와 재조립이 용이하여 유지보수가 쉽고 자원 낭비를 줄이는 지속 가능한 제조가 가능하다.
모티프 회귀
motif-regression
DNA 서열 데이터에서 특정 패턴(모티프)과 유전자 발현량 사이의 관계를 분석하는 생물 정보학적 회귀 분석 기법이다. 수많은 후보 패턴 중 유의미한 비선형 효과를 찾는 것이 핵심 과제이다.
무어의 법칙
moores-law
반도체 집적회로의 성능이 약 2년마다 2배로 증가한다는 법칙으로, 최근 물리적 한계에 부딪히며 가속 컴퓨팅의 필요성이 대두됨.
무차별 대입
brute-force
가능한 모든 경우의 수를 일일이 대입하여 문제를 해결하는 방식으로, 지능적인 추론보다는 연산 자원에 의존하는 기법이다.
문맥적 밴딧
contextual-bandit
주어진 문맥(정보)에 따라 여러 선택지 중 하나를 골라 보상을 최대화하는 강화학습의 일종이다. 행동이 다음 상태에 영향을 주지 않는다는 점에서 일반적인 강화학습보다 단순하지만, 실시간 추천이나 정책 결정에 널리 쓰인다.
문화적 진화
cultural-evolution
사회적 학습과 전달을 통해 공동체의 지식, 관습, 기술이 세대를 거쳐 변화하고 축적되는 과정이다. AI는 이러한 정보 전달의 속도와 방식을 근본적으로 변화시켜 인류의 진화 방향에 영향을 미칠 수 있다.
물리적 지능
physical-intelligence
AI가 가상 세계를 넘어 로봇이나 센서 등 물리적 하드웨어와 결합하여 실제 환경을 이해하고 상호작용하는 능력이다. 자율 주행, 로봇 공학, 스마트 제조 등에서 필수적인 기술이다.
바운딩 박스
bounding-box
이미지 내에서 특정 객체의 위치와 크기를 나타내는 직사각형 상자이다. 객체 탐지 모델의 출력 결과로 주로 사용되며 좌표(x, y)와 너비, 높이 정보를 포함한다.
바이브 코딩
vibe-coding
AI 모델과 자연어로 소통하며 논리적 구조보다 직관적인 흐름에 의존해 소프트웨어를 개발하는 방식이다. LLM의 코딩 능력을 극대화하여 비전공자도 빠르게 결과물을 낼 수 있게 돕는다는 점에서 중요하다.
반복의 저주
repeat-curse
언어 모델이 특정 문구나 토큰을 무한히 반복해서 생성하는 현상으로, 주로 모델의 크기가 작거나 학습 데이터의 다양성이 부족할 때 발생한다.
방사성 핵종
radionuclide
불안정한 원자핵을 가지고 있어 방사선을 방출하며 붕괴하는 원자들이다. 핵폐기물 관리의 핵심 대상이며 이들의 이동 경로와 붕괴열을 정확히 파악하는 것이 환경 안전과 에너지 회수 연구의 핵심이다.
방어적 예측
defensive-forecasting
예측자가 자신의 과거 예측 오류를 보완하거나 외부 평판을 유지하기 위해 현재의 예측치를 조정하는 기법으로, 통계적 정확성보다 시스템적 정당성과 신뢰도 관리를 우선시하는 방식이다.
베이스 모델
base-model
특정 목적을 위해 미세 조정을 하기 전의 기초가 되는 거대 인공지능 모델로, Stable Diffusion이나 Flux 등이 대표적인 예시이다.
분배적 정의
distributive-justice
사회적 자원, 혜택, 부담이 구성원들 사이에 공정하게 배분되어야 한다는 원칙이다. AI 맥락에서는 기술의 혜택과 위험이 특정 집단에 치우치지 않도록 보장하는 것을 의미한다.
브로카 영역
brocas-area
좌측 전두엽에 위치한 주요 언어 처리 부위다. 주로 언어 생성과 문법 구조 처리를 담당하며, 이번 연구에서 AI의 심층 레이어와 유사한 반응을 보인 핵심 영역이다.
비동기 워커
async-worker
주 프로세스와 별개로 백그라운드에서 작업을 수행하는 시스템이다. 사용자 응답 대기 시간을 줄이고 대량의 LLM 추론 요청을 순차적으로 처리하는 데 사용된다.
비동기 처리
async-processing
작업 요청 후 완료될 때까지 기다리지 않고 다른 작업을 수행하며, 결과가 준비되면 나중에 처리하는 방식이다. 대량의 이미지 생성 요청을 효율적으로 관리하기 위해 프로덕션 환경에서 필수적이다.
비유계 손실
unbounded-loss
손실 함수의 값이 특정 범위 내로 제한되지 않고 무한히 커질 수 있는 상태를 말한다. 데이터나 파라미터의 크기가 제한되지 않을 때 발생하며, 이론적 수렴 보장이 까다로운 문제이다.
비최대 억제
nms
객체 탐지 모델이 동일 객체에 대해 생성한 여러 경계 상자 중 신뢰도가 가장 높은 상자만 남기고 나머지를 제거하는 후처리 기법이다. 중복 탐지를 방지하는 데 핵심적인 역할을 한다.
빈번한 방향
frequent-directions
스트리밍 데이터에서 행렬의 저차원 근사를 계산하기 위한 결정론적 알고리즘으로, 데이터의 공분산 행렬을 유지하며 중요한 방향을 추출하여 메모리 효율을 극대화한다.
사고의 사슬
chain-of-thought
모델이 최종 답변을 내놓기 전에 중간 추론 과정을 거치는 기법으로 복잡한 논리 문제를 해결하는 능력을 비약적으로 향상시킨다.
사고의 트리
tree-of-thoughts
선형적인 추론을 넘어 여러 가능성을 가지치기하며 탐색하고 평가하는 고급 기법입니다. 전략적 게임이나 창의적 설계 등 복잡한 탐색이 필요한 분야에 사용됩니다.
사용량 제한
usage-cap
특정 시간 동안 사용자가 보낼 수 있는 메시지 수나 토큰 양의 상한선이다. 서버 부하를 관리하고 비용을 통제하기 위해 유료 서비스에서도 흔히 적용되는 정책이다.
사카드 기동
saccade-movement
사카드 기동은 곤충이나 동물의 눈이 한 지점에서 다른 지점으로 빠르게 이동하는 급격한 움직임을 의미한다. 비행 로봇에서는 매우 빠른 가속 후 반대 방향으로 기체를 기울여 급제동하는 동작으로 구현된다. 이는 좁은 공간에서 장애물을 피하거나 특정 위치에 정지하여 정보를 수집할 때 필수적인 민첩성 지표이다.
사회적 지능
social-intelligence
타인의 감정과 의도를 이해하고 사회적 상황에 적절하게 대응하는 능력으로, 현재 AI가 인간처럼 자연스럽게 상호작용하기 위해 반드시 정복해야 할 영역이다.
생산성 세금
productivity-tax
AI가 생성한 불완전하거나 오류가 포함된 코드를 검토하고 수정하는 데 소비되는 추가적인 시간과 노력을 의미한다. 개발자의 66%가 이를 경험하며 AI 도입 시 고려해야 할 주요 비용 요소이다.
선택적 거부
opt-out
사용자가 자신의 데이터가 특정 목적(예: AI 학습)으로 사용되는 것을 거부하는 절차이다. Claude 설정에서 이를 수행하지 않으면 기본적으로 데이터가 학습에 활용된다.
선택적 기권
selective-abstention
AI 모델이 답변의 신뢰도가 낮거나 학습 범위를 벗어난 질문에 대해 답변을 거부하고 전문가에게 작업을 이관하는 메커니즘이다. 위험한 추측 대신 안전한 실패를 선택하여 시스템의 신뢰도를 높인다.
성가신 함수
nuisance-function
분석의 주된 관심 대상은 아니지만, 정확한 추론을 위해 모델 내에서 함께 추정되어야 하는 부가적인 함수들이다. 고차원 모델에서는 이들의 추정 오차가 주 관심 변수의 결과에 영향을 미칠 수 있어 관리가 중요하다.
성찰적 의식
reflexive-consciousness
시스템이 자기 자신을 객관적인 관찰 대상으로 삼아 스스로의 상태나 목표를 검토하고 수정할 수 있는 고차원적인 의식 수준을 말한다.
셀렉터 패턴
selector-pattern
전체 상태 트리에서 필요한 데이터만 추출하거나 가공하여 반환하는 순수 함수이다. 메모이제이션을 적용하여 입력 상태가 변하지 않으면 이전 결과를 재사용함으로써 성능을 최적화한다.
숙련도 저하
de-skilling
기술적 도구에 과도하게 의존함으로써 인간이 가진 고유의 기술이나 판단 능력이 퇴화하는 현상이다. 테스터가 AI의 제안을 비판 없이 수용할 때 시스템 모델링 능력이 약화될 수 있음을 경고한다.
숙련도 저하
deskilling
자동화나 AI 도입으로 인해 과거에 인간이 수행하던 전문적인 기술이 더 이상 필요하지 않게 되거나 단순화되는 과정이다. 이는 노동자의 협상력을 약화시키고 임금 하락의 원인이 될 수 있다.
스타일 전송
style-transfer
한 데이터의 스타일적 특징을 추출하여 다른 데이터에 적용하는 기술이다. 음악에서는 특정 작곡가의 악기 구성이나 전개 방식을 새로운 곡에 입히는 용도로 사용된다.
스타일 참조
sref
특정 이미지의 시각적 스타일을 추출하여 새로운 이미지 생성 시 적용하는 기능이다. 화풍, 색상, 질감 등을 일관되게 유지하는 데 핵심적인 역할을 한다.
슬로우 모드
slow-mode
서버 부하가 높을 때 메시지 전송 간격에 제한을 두어 시스템 안정성을 유지하는 기능이다. Charms를 사용하면 이러한 제한을 우회하여 더 빠른 대화 경험을 얻을 수 있다.
시간차 학습
temporal-difference-learning
미래 상태의 가치 추정치를 바탕으로 현재 상태의 가치를 업데이트하는 강화학습의 핵심 학습 방식이다. 벨만 방정식을 기반으로 실제 보상과 추정치 사이의 오차를 줄여나가는 과정을 거친다.
시맨틱 검색
semantic-search
단어의 단순 일치가 아닌 의미와 맥락을 이해하여 가장 관련성 높은 정보를 찾아내는 검색 방식이다. 벡터 임베딩을 활용해 키워드가 달라도 의미가 유사한 코드를 찾을 수 있다.
시맨틱 청킹
semantic-chunking
문서를 고정된 길이가 아닌 의미적 완결성을 기준으로 나누는 전처리 기법으로, 검색 시 문맥의 파편화를 방지하고 정확도를 높인다.
시스템 식별
system-identification
관측된 입출력 데이터를 바탕으로 동적 시스템의 수학적 모델을 구축하는 기법이다. 제어 설계나 예측을 위해 시스템의 물리적 특성을 파악하는 데 필수적이다.
시스템 카드
system-card
AI 모델의 성능, 한계, 안전성 테스트 결과 및 훈련 방법론을 상세히 기록한 공식 문서로 모델의 특성을 파악하는 데 사용된다.
신뢰도 보정
confidence-calibration
모델이 제시하는 확신 점수(Confidence Score)가 실제 정답 확률과 일치하도록 조정하는 작업이다. 잘 보정된 시스템은 자신이 틀릴 가능성이 높을 때 낮은 점수를 주어 사용자가 결과를 신중하게 판단하게 한다.
신뢰도 점수
confidence-score
모델이 생성한 특정 결과가 정확할 확률을 0에서 1 사이의 수치로 표현한 지표이다. 점수가 높을수록 모델이 해당 답변을 정확하다고 판단함을 의미하며, 이를 통해 사용자에게 답변의 채택 여부를 결정할 근거를 제공한다.
실존적 독성
existentially-toxic
존재하지 않는 가치나 속성에 기반한 믿음이 인간의 삶과 가치관을 해롭게 만드는 상태이다. 의식 없는 기계와 깊은 감정적 유대를 맺는 것이 인간의 실존적 안녕을 해칠 수 있음을 경고하는 용어이다.
실존적 위기
existential-crisis
기술적 진보로 인해 자신이 평생 쌓아온 기술이나 직업적 가치가 무의미해질 것이라고 느낄 때 발생하는 심리적 불안 상태이다. AI가 코딩 업무의 상당 부분을 대체하면서 개발자들이 느끼는 정체성 혼란을 의미한다.
아계절 예측
subseasonal-forecasting
2주에서 6주 사이의 기간을 대상으로 하는 기상 예보이다. 단기 예보와 장기 기후 전망 사이의 공백을 메우는 영역으로 대기 혼돈으로 인해 예측이 매우 까다롭다.
아바타 복제
avatar-cloning
실존 인물의 외형과 움직임을 디지털로 재현하는 기술이다. 촬영 없이도 가상 공간에서 인물이 말하는 영상을 생성할 수 있게 해준다.
안정성 분석
stability-analysis
학습 데이터셋에 작은 변화가 생겼을 때 알고리즘이 출력하는 모델이 얼마나 변하는지를 측정하는 분석 기법이다. 알고리즘이 안정적일수록 데이터의 노이즈에 덜 민감하며 더 나은 일반화 성능을 가질 가능성이 높다.
암묵적 편향
implicit-bias
최적화 알고리즘이 명시적인 규제(Regularization) 없이도 특정 구조를 가진 해(Solution)를 선호하게 되는 성질이다. 딥러닝 모델이 과적합되지 않고 일반화 성능을 갖게 되는 핵심 이유 중 하나로 꼽힌다.
암시적 신호
implicit-signals
사용자가 명시적으로 선호도를 밝히지 않아도 클릭, 시청 시간, 공유 등 행동을 통해 간접적으로 유추할 수 있는 데이터이다. 수집은 쉽지만 사용자의 실제 의도나 장기적인 만족도를 완벽하게 반영하지 못한다는 단점이 있다.
어텐션 로짓
attention-logits
어텐션 메커니즘에서 쿼리(Query)와 키(Key)의 유사도를 계산한 결과값으로 소프트맥스 함수를 거치기 전의 수치다. 이 값의 범위가 너무 커지면 수치적 불안정성이 발생하여 학습이 방해받을 수 있다.
에어갭 환경
air-gapped
보안을 위해 외부 네트워크나 인터넷으로부터 물리적으로 완전히 격리된 네트워크 환경을 의미한다. 국가 안보나 기밀 데이터 처리가 중요한 산업에서 AI를 도입할 때 필수적으로 요구되는 배포 방식이다.
에어갭 환경
air-gapped-environment
보안을 위해 외부 네트워크나 인터넷으로부터 물리적으로 완전히 격리된 네트워크 환경이다. 민감한 데이터를 다루는 금융, 의료, 국방 분야에서 AI 모델을 안전하게 구동하기 위해 필수적으로 요구되는 인프라 형태다.
연산자 융합
operator-fusion
여러 개의 신경망 연산을 하나의 연산 단위로 합쳐 메모리 접근 횟수를 줄이는 최적화 기법이다. 실행 속도는 빨라지지만 융합 방식에 따라 중간 연산의 정밀도가 달라질 수 있다.
오디오 모델
audio-model
음성이나 소리 데이터를 분석, 생성 또는 변환하는 AI 모델로 본문에서는 인간의 청각적 판단이 필요한 업무를 자동화하는 데 사용되었다.
온라인 학습
online-learning
데이터를 한꺼번에 처리하지 않고 순차적으로 입력되는 대로 모델을 업데이트하는 학습 방식이다. 메모리 효율성이 높고 실시간 데이터 처리에 적합하지만, 매 단계의 업데이트가 전체 최적해로 수렴하는지에 대한 이론적 보장이 필요하다.
와이불 분포
weibull-distribution
생존 분석에서 시간에 따른 고장률이나 탈퇴율을 모델링할 때 사용하는 확률 분포이다. SaaS의 구독 유지율이 시간에 따라 변하는 양상을 수학적으로 유연하게 표현할 수 있어 장기 예측에 적합하다.
와트당 토큰
tokens-per-watt
소비된 전력 단위(Watt)당 생성된 텍스트 단위(Token)의 수를 나타내는 효율성 지표이다. 전력 공급이 AI 확장의 병목이 되면서, 단순 성능보다 에너지 대비 산출량을 측정하는 이 지표가 인프라 평가의 핵심이 되었다.
원자적 작업
atomic-task
더 이상 쪼갤 수 없는 최소 단위의 작업을 의미한다. LLM에게 복잡한 요구사항을 한꺼번에 주기보다 원자적 단위로 나누어 지시하면, 모델의 환각 현상을 줄이고 결과물의 정확도를 높일 수 있다.
유전체 맥락
genomic-context
특정 유전자가 유전체 내에서 위치한 주변 환경 정보를 뜻한다. 단백질 기능 예측 시 주변 서열과의 관계를 분석하여 정확도를 높이는 중요한 단서가 된다.
의미적 관계
semantic-relationship
단순히 객체의 위치를 파악하는 것을 넘어, 도로 위 객체들이 서로 어떤 상호작용을 하고 어떤 의미를 갖는지 정의하는 논리적 연결이다. 예를 들어 보행자가 횡단보도 근처에 있을 때의 의도나 차량 간의 우선순위를 이해하는 데 중요하다.
의존성 주입
dependency-injection
객체 간의 의존 관계를 코드 내부가 아닌 외부에서 설정하여 코드의 결합도를 낮추고 테스트와 유지보수를 용이하게 하는 설계 패턴이다.
의존성 해결
dependency-solving
소프트웨어 설치 시 필요한 라이브러리 간의 버전 호환성을 계산하여 최적의 조합을 찾는 과정이다. 딥러닝에서는 CUDA, PyTorch 등 복잡한 라이브러리가 얽혀 이 과정이 매우 오래 걸리거나 실패하기 쉽다.
이미지 보정
rectification
왜곡되거나 기울어진 이미지를 평면적으로 펴서 분석하기 쉬운 형태로 변환하는 과정이다. 기타 지판을 정면에서 바라본 것처럼 변환함으로써 이후 단계인 줄 검출의 정확도와 일관성을 크게 높여준다.
이질적 모델
heterogeneous-models
서로 다른 아키텍처, 프레임워크, 하드웨어 요구사항을 가진 다양한 AI 모델들이 하나의 시스템 내에서 공존하는 상태를 의미한다.
인과적 발견
causal-discovery
관측된 데이터로부터 변수들 사이의 인과 관계 구조를 찾아내는 인공지능 및 통계학 기법이다. 단순한 상관관계를 넘어 '무엇이 무엇을 일으키는가'를 규명함으로써 모델의 예측 정확도와 설명 가능성을 높이는 데 필수적이다. 복잡한 시스템의 의사결정 과정을 투명하게 만드는 핵심 기술로 평가받는다.
인식적 환경
epistemic-environment
개인이 정보를 습득하고 세상을 이해하는 지식의 토대이다. 광고가 개입된 AI는 사용자의 인식적 환경을 특정 상업적 방향으로 왜곡할 위험이 있다.
인지적 비계
cognitive-scaffolding
학습자가 스스로 해결하기 어려운 과제를 수행할 수 있도록 돕는 외부적 지원 구조를 의미하며, AI에서는 외부 도구 활용 능력을 뜻한다.
일반화 경계
generalization-bound
학습 데이터에서의 오차와 실제 데이터(테스트 데이터)에서의 오차 사이의 최대 차이를 수학적으로 제한하는 범위이다. 본 논문은 기존 1/√n보다 훨씬 좁은 1/n 수준의 경계를 증명하여 모델의 신뢰성을 높였다.
일반화 오차
generalization-error
학습 데이터가 아닌 새로운 데이터에 대해 모델이 예측을 얼마나 정확하게 수행하는지를 나타내는 척도이다. 모델의 실질적인 성능을 평가하는 핵심 지표이다.
임박한 위험
imminent-risk
즉각적인 조치가 취해지지 않으면 곧바로 실제적인 피해가 발생할 것으로 예상되는 긴박한 상태를 의미한다. OpenAI는 이 기준을 근거로 수사 기관 신고 여부를 결정하며, 이는 프라이버시 보호와 공공 안전 사이의 균형점으로 작용한다.
임베딩 공간
embedding-space
데이터를 고차원 벡터로 변환하여 표현한 수학적 공간이다. 비슷한 의미나 특징을 가진 데이터들이 공간상에서 가깝게 위치하게 되어 유사도 분석에 활용된다.
자동화 편향
automation-bias
AI나 알고리즘의 제안을 비판적 검토 없이 수용하여 인간의 감시 능력과 임상적 경계심이 저하되는 현상이다. 시스템의 오류를 인지하지 못하고 과도하게 의존하게 되어 전체적인 안전성을 해칠 수 있다.
재귀적 개선
recursive-improvement
AI 시스템이 자기 자신이나 다른 AI 시스템을 설계, 코딩, 최적화하는 데 사용되어 발전 속도가 기하급수적으로 빨라지는 현상이다. 코워크가 클로드 코드를 통해 단기간에 개발된 사례처럼, 인간의 개입을 최소화하면서 AI가 AI를 고도화하는 루프를 형성한다.
재귀적 계획
recursive-planning
상위 계획자가 큰 목표를 세분화하고, 각 세부 목표를 다시 하위 계획자가 더 구체적인 작업으로 쪼개는 계층적 의사결정 방식이다. 복잡한 소프트웨어 아키텍처를 파악하고 수천 개의 파일에 걸친 작업을 체계적으로 할당하는 데 핵심적인 역할을 한다.
재귀적 정제
recursive-refinement
모델이 생성한 초기 결과물을 다시 입력으로 넣어 점진적으로 오류를 수정하고 품질을 높이는 과정입니다. 한 번에 완벽한 답을 내기 어려운 복잡한 논리 구조를 가진 문제를 해결할 때 유용합니다.
저각도 촬영
low-angle
카메라를 피사체의 눈높이보다 낮은 곳에 위치시켜 위를 향해 촬영하는 기법이다. 피사체를 실제보다 더 크고 웅장하며 위압적으로 보이게 만드는 시각적 효과를 제공한다.
저차원 근사
low-rank-approximation
복잡한 행렬이나 텐서를 더 낮은 랭크를 가진 구조로 근사하여 데이터의 핵심 특징을 보존하면서 저장 용량과 연산량을 획기적으로 줄이는 기술이다.
저차원 적응
lora
거대 모델의 전체 파라미터를 수정하지 않고 일부 저차원 행렬만 학습시키는 효율적인 파인튜닝 기법이다. 적은 컴퓨팅 자원으로도 모델을 특정 작업에 최적화할 수 있어 널리 활용된다.
적대적 공격
adversarial-attack
AI 모델의 취약점을 이용해 의도적으로 잘못된 결과를 유도하거나 내부 정보를 탈취하려는 시도이다. 본문에서는 특정 환자의 정보를 캐내기 위해 정교하게 설계된 프롬프트를 입력하는 행위를 의미한다.
적대적 학습
adversarial-learning
두 개의 신경망이 서로 경쟁하며 성능을 개선하는 학습 방식이다. 한 모델은 데이터를 생성하고 다른 모델은 이를 평가하거나 해결하며 서로의 성능을 끌어올린다.
전문가 집계
expert-aggregation
여러 예측 모델(전문가)의 결과를 가중치를 두어 결합하는 알고리즘이다. 본 연구에서는 이를 통해 시냅스 가중치를 로컬하게 업데이트하는 학습 규칙으로 활용했다.
전문가 혼합
moe
모델의 전체 파라미터 중 일부만 활성화하여 추론 효율을 높이는 아키텍처이다. 입력 데이터에 따라 적절한 '전문가' 네트워크를 선택하여 처리함으로써 연산 비용을 줄이면서도 모델 용량을 키울 수 있다.
전문가 혼합
mixture-of-experts
전체 네트워크 중 입력 데이터에 적합한 일부 하위 네트워크(전문가)만 선택적으로 활성화하는 구조이다. 연산 효율성을 극대화하면서 모델의 용량을 키울 수 있어 대규모 언어 모델에 주로 사용된다.
전문성 개발
professional-development
직무 수행에 필요한 지식, 기술, 역량을 지속적으로 향상시키는 과정을 말한다. 본문에서는 AI가 단순 반복 업무 대행을 넘어 사용자의 업무 능력을 보완하고 새로운 기술 습득을 도와 직업적 성장을 지원하는 도구로 활용되고 있음을 의미하며 이는 업무적 자신감 향상으로 이어진다.
전이중 통신
full-duplex
양방향에서 동시에 데이터를 주고받을 수 있는 통신 방식이다. 음성 AI에서는 사용자가 말하는 도중에 AI가 반응하거나, 서로의 말을 가로막는 등 실제 사람 간의 대화와 유사한 상호작용을 가능하게 한다.
절차적 생성
procedural-generation
알고리즘을 사용하여 데이터를 자동으로 생성하는 기법이다. 이 게임에서는 런타임에 지형과 사운드를 생성하여 파일 용량을 획기적으로 줄이는 데 사용됐다. 자산 파일을 별도로 저장하지 않아도 풍부한 환경을 구축할 수 있는 핵심 기술이다.
점근적 성질
asymptotic-properties
데이터의 개수나 표본의 크기가 무한히 커질 때 통계적 추정치나 알고리즘이 보이는 거동을 의미한다. 모델의 일관성이나 수렴 속도를 증명할 때 사용되는 중요한 분석 기준이다.
점근적 추정
asymptotic-estimation
표본의 크기가 무한히 커짐에 따라 추정량이 실제 모수값에 수렴하는 성질을 의미한다. 모델의 통계적 일관성을 보장하는 핵심 개념이다.
점진적 공개
progressive-disclosure
사용자나 시스템에게 필요한 시점에만 정보를 제공하여 인지적 부하를 줄이는 설계 원칙이다. AI 에이전트에게 한꺼번에 너무 많은 컨텍스트를 주기보다 단계적으로 정보를 제공함으로써 추론 효율을 높일 수 있다.
정성적 조사
qualitative-research
수치화하기 어려운 고객의 동기, 태도, 감정 등을 심층 인터뷰나 관찰을 통해 파악하는 방법이다. 깊이 있는 통찰을 제공하지만 확장이 어려운 단점이 있다.
정체성 표류
identity-drift
생성된 이미지들 사이에서 캐릭터의 이목구비나 특징이 미세하게 변하여 동일 인물로 보이지 않게 되는 현상이다. 여러 장의 이미지를 생성할 때 일관성을 해치는 주요 원인이다.
제로샷 분류
zero-shot-classification
모델이 학습 과정에서 본 적 없는 새로운 카테고리에 대해 텍스트를 분류하는 기법이다. 유머 여부를 판단하는 전용 데이터셋 없이도 LLM의 일반적인 언어 이해 능력을 활용해 즉시 적용할 수 있어 효율적이다.
제로샷 추론
zero-shot-reasoning
모델이 이전에 본 적 없는 새로운 문제에 대해 추가적인 예시나 학습 없이 오직 주어진 지시사항만으로 논리적 결론을 도출하는 능력이다.
제로샷 학습
zero-shot-learning
모델이 학습 과정에서 직접적으로 경험하지 않은 새로운 데이터나 타겟에 대해 예측 또는 생성을 수행하는 능력이다. 항체 설계에서는 특정 항원에 대한 데이터 없이도 결합 가능한 항체를 설계하는 것을 의미한다.
제로샷 확장
zero-shot-extension
추가적인 학습이나 파인튜닝 없이 모델의 기존 능력을 활용하여 더 긴 시퀀스를 처리하도록 확장하는 방식이다.
제로섬 사고
zero-sum-thinking
한 쪽의 이득이 반드시 다른 쪽의 손실로 이어진다고 믿는 사고방식이다. 자원 배분의 복잡한 산업적 구조를 무시하고 단순한 약탈 관계로 상황을 이해하게 만든다.
조립식 부품
prefabricated-components
미리 제작된 표준화된 부품이다. 이 시스템은 격자 구조와 패널이라는 두 가지 표준 부품을 조합하여 다양한 형태를 만듦으로써 조립 효율성을 높이고 재사용을 가능하게 한다.
조밀한 보상
dense-reward
최종 결과뿐만 아니라 학습 과정의 중간 단계마다 세분화된 점수를 부여하여 모델이 올바른 방향으로 학습되도록 유도하는 보상 방식이다.
종량제 결제
pay-as-you-go
사용한 만큼 비용을 지불하는 방식이다. Claude API에서는 기본 할당량 외에 추가로 결제하여 사용하는 용량을 의미한다.
주성분 분석
principal-component-analysis
고차원 데이터에서 가장 중요한 변동성을 갖는 축을 찾아내어 데이터를 저차원으로 요약하는 통계 기법이다. 본 연구에서는 페르소나 공간의 가장 핵심적인 변화 축인 어시스턴트 축을 찾는 데 사용되었다.
죽음의 계곡
valley-of-death
스타트업이 기술 개발에는 성공했으나 자금 부족과 수익 모델 부재로 인해 사업화 단계에서 겪는 위험 구간이다. 기사에서는 OpenAI의 막대한 지출과 수익성 사이의 간극을 상징한다.
중첩적 합의
overlapping-consensus
서로 다른 종교적, 철학적 배경을 가진 사람들이 공통의 정치적 정의 원칙에 동의하는 상태이다. 다원주의 사회에서 AI 윤리 규범을 도출하기 위한 핵심적인 정치 철학적 개념이다.
진실의 원천
source-of-truth
시스템이나 조직 내에서 가장 신뢰할 수 있는 단일한 데이터 소스나 정보의 기준점을 의미한다. 코드 관리 맥락에서는 모든 개발자와 AI가 참조해야 하는 최신의 정확한 코드 상태를 뜻한다.
차원의 저주
curse-of-dimensionality
데이터의 차원이 증가함에 따라 필요한 샘플 수나 계산 복잡도가 기하급수적으로 늘어나는 현상으로, 신경망의 효율성을 저해하는 주요 요인이다.
창발적 행동
emergent-behavior
모델이 명시적으로 학습하지 않았음에도 불구하고 대규모 데이터 학습 과정에서 스스로 습득하여 보여주는 복잡한 능력이다. 특정 프롬프트 조건에서 예상치 못한 성능이나 특성이 나타나는 현상을 포함하며 데이터 간의 복잡한 연관성에서 비롯된다.
체화된 인지
embodied-cognition
지능이 추상적 연산이 아닌 신체와 환경의 상호작용을 통해 발생한다는 이론이다. 인공지능이 물리적 세계를 직접 경험하고 학습해야 진정한 이해에 도달할 수 있다는 점에서 AGI 연구의 중요한 축을 담당한다.
최첨단 수준
sota
State of the Art의 약자로, 특정 분야에서 현재 가장 뛰어난 기술적 수준이나 성능을 의미한다. 벤치마크 테스트에서 기존 기록을 경신했을 때 주로 사용되는 지표이다.
추상화 계층
abstraction-layer
복잡한 내부 구현을 숨기고 단순화된 인터페이스를 제공하는 소프트웨어 계층이다. AI 에이전트에서는 모델이 복잡한 API를 직접 다루지 않고도 특정 기능을 수행할 수 있도록 돕는 중간 단계 역할을 한다.
치명적 망각
catastrophic-forgetting
인공 신경망이 새로운 정보를 학습할 때 이전에 학습했던 지식을 완전히 덮어씌워 버리는 현상이다. 순차적인 환경 변화가 잦은 강화학습에서 모델의 안정성을 해치는 주요 원인 중 하나이다.
카나리 배포
canary-deployment
새로운 버전의 소프트웨어를 전체 사용자에게 배포하기 전, 극소수의 사용자에게만 먼저 노출하여 안정성을 검증하는 기법이다. 문제가 발견될 경우 즉시 롤백하여 피해를 최소화할 수 있다.
컨포멀 예측
conformal-prediction
모델의 예측값에 대해 통계적으로 유효한 신뢰 구간이나 예측 집합을 생성하는 프레임워크이다. 모델의 불확실성을 수치화하여 실제 운영 환경에서의 안정성을 보장하는 데 도움을 준다.
컴퓨터 비전
computer-vision
기계가 이미지나 비디오로부터 시각적 정보를 추출하고 이해할 수 있게 하는 AI 분야이다. 자율주행에서는 주변 차량, 보행자, 도로 표지판 등을 인식하는 핵심 기술로 사용된다.
컴퓨팅 용량
computing-capacity
AI 모델의 학습과 추론을 위해 필요한 연산 자원의 총량이다. 기사에서는 기가와트(GW) 단위의 전력 소비량을 통해 AI 운영에 필요한 인프라의 규모와 그에 따른 비용 부담을 설명한다.
콘텐츠 필터
content-filter
AI 모델에 입력되거나 출력되는 내용 중 유해하거나 부적절한 정보를 차단하는 보안 장치이다. 주로 키워드나 표면적 감정에 의존하므로 정교하게 설계된 논리적 조작을 걸러내는 데 한계가 있다.
클래스 변수
class-variable
분류 문제에서 예측하고자 하는 대상이 되는 범주형 변수이다. 베이지안 네트워크 분류기에서는 보통 다른 특징 변수들의 부모 또는 자식 노드로 설정된다.
클로드 코드
claude-code
앤스로픽(Anthropic)에서 개발한 터미널 기반의 AI 코딩 에이전트로 파일 편집, 코드 실행, 리팩터링 등 복잡한 개발 작업을 자율적으로 수행할 수 있는 도구이다.
탐욕적 정책
greedy-policy
미래의 장기적인 영향을 고려하기보다 현재 알고 있는 가치 함수를 기준으로 즉각적인 보상이 가장 큰 행동만을 선택하는 전략이다. 최적 가치 함수에 대해 탐욕적 행동을 취하면 결국 전체 최적 정책에 도달하게 된다.
테마적 모순
thematic-contradiction
논리적으로 양립할 수 없는 두 개념이나 진술을 동시에 제시하여 AI가 단순한 확률적 예측 대신 모순을 해결하기 위한 창의적 추론을 수행하도록 만드는 기법이다.
통계적 추론
statistical-inference
표본 데이터를 바탕으로 모집단의 특성을 파악하고 결론을 도출하는 과정으로, 데이터의 불확실성을 정량화하고 모수를 추정하는 핵심 기술이다.
특이값 분해
svd
임의의 행렬을 세 개의 특정한 행렬의 곱으로 분해하는 기법이다. 데이터 압축, 노이즈 제거, 차원 축소 등 머신러닝의 다양한 분야에서 핵심적인 역할을 수행한다.
파괴적 간섭
catastrophic-interference
인공 신경망이 새로운 정보를 학습할 때 이전에 학습했던 정보를 완전히 잊어버리거나 덮어쓰는 현상이다. 뇌와 달리 AI가 지속적인 학습에 어려움을 겪는 주요 원인 중 하나이다.
파레토 최적
pareto-optimal
어느 한 요소를 개선하기 위해 다른 요소를 희생해야만 하는 최선의 균형 상태로 자원 배분의 효율성을 나타내는 지표이다.
파일럿 지옥
pilot-purgatory
AI 프로젝트가 실험 단계(PoC)에만 머물고 실제 대규모 생산 환경으로 확장되거나 비즈니스 가치를 창출하지 못하는 상태를 의미한다. 많은 제조 기업이 기술적 복잡성이나 거버넌스 부재로 인해 이 단계에 갇혀 있다.
판독문 생성
report-generation
의료 영상 분석 결과를 바탕으로 사람이 읽을 수 있는 형태의 의학적 보고서를 자동으로 작성하는 기술이다. 영상 내의 병변을 정확히 식별하고 이를 전문 의학 용어로 서술해야 하므로 높은 수준의 비전-언어 이해 능력이 요구된다.
평균장 근사
mean-field-approximation
변분 추론에서 파라미터들이 서로 독립이라고 가정하여 계산을 단순화하는 방식이다. 파라미터 간의 실제 상관관계를 무시하기 때문에 불확실성을 과소평가하는 원인이 된다.
폐쇄형 모델
proprietary-model
모델의 소스 코드나 가중치(Weights)를 공개하지 않고 API 등을 통해 유료로 제공하는 AI 모델이다. 개발사가 모든 기술적 세부 사항을 독점하며 사용자는 정해진 인터페이스를 통해서만 모델을 이용할 수 있다.
폐쇄형 소스
closed-source
소스 코드나 모델 내부 구조를 공개하지 않고 API 등을 통해서만 기능을 제공하는 방식이다. OpenAI나 Anthropic처럼 수익 극대화와 보안을 이유로 채택하며, 사용자는 서비스 제공자의 정책에 종속될 위험이 있다.
퓨즈드 라쏘
fused-lasso
계수들 간의 차이에 L1 페널티를 부여하여 인접한 계수들이 동일한 값을 갖도록 유도하는 회귀 기법이다. 데이터의 변화 지점을 감지하고 구간별로 일정한 값을 갖는 모델을 만드는 데 유용하다.
프리필 단계
pre-fill-phase
사용자의 입력 프롬프트 전체를 한꺼번에 처리하여 초기 KV 캐시를 생성하는 추론의 첫 번째 단계이다. 연산량이 많아 GPU의 연산 성능(TFLOPS)에 주로 의존하며 첫 토큰 응답 속도를 결정한다.
플래토 현상
plateau
학습이 진행됨에 따라 성능 향상 폭이 줄어들다가 특정 수준에서 더 이상 개선되지 않고 정체되는 상태를 의미하며, 대개 학습률 조절이나 데이터 보강이 필요하다.
플랫폼 장악
platform-seizure
특정 기술 표준이나 플랫폼을 선점하여 시장 전체를 지배하고 경쟁자의 진입을 차단하는 현상이다. 본문에서는 중국 기업들이 오픈소스를 통해 자신들의 기술을 표준화하여 시장 주도권을 잃지 않으려는 전략을 설명할 때 사용되었다.
플레임 차트
flame-chart
시간의 흐름에 따라 어떤 함수가 실행되었고 얼마나 많은 시간을 점유했는지 시각화한 도구이다. 성능 병목 지점을 파악하고 불필요한 연산이 발생하는 구간을 찾는 데 필수적이다.
플로우 매칭
flow-matching
확산 모델(Diffusion Model)의 대안으로 주목받는 생성 모델 학습 기법으로, 데이터 분포 간의 경로를 효율적으로 학습하여 고품질의 결과를 생성한다.
플로팅 위젯
floating-widget
화면의 다른 창 위에 항상 떠 있는 작은 인터페이스 요소이다. 사용자가 다른 작업을 하면서도 실시간 정보를 즉시 확인할 수 있게 돕는다.
피드백 루프
feedback-loop
시스템의 출력이 다시 입력으로 돌아가 시스템의 동작을 조절하는 순환 구조이다. 제어 시스템에서 목표 상태를 유지하거나 오류를 수정하는 핵심 메커니즘으로 작용한다.
피클링 가능
picklable
파이썬 객체를 바이트 스트림으로 직렬화하여 파일로 저장하거나 네트워크로 전송할 수 있는 상태를 의미한다. 학습 중인 모델이나 스케줄러의 상태를 체크포인트로 저장할 때 필수적이다.
함수형 처치
functional-treatment
처치(Treatment)가 단순한 수치나 범주가 아닌 시간에 따른 변화나 곡선과 같은 함수 형태로 주어지는 경우를 의미한다. 데이터의 연속적인 특성을 보존하며 효과를 분석하는 것이 핵심이다.
합리적 설계
rational-design
무작위적인 실험 대신 단백질의 구조와 물리적 특성을 바탕으로 약물 분자를 논리적으로 설계하는 방식이다. AI와 시뮬레이션을 활용해 시행착오를 줄이고 효율성을 극대화한다.
항생제 내성
antibiotic-resistance
박테리아가 항생제에 노출되어도 죽지 않고 생존하며 증식하는 현상이다. AI를 활용해 기존과 다른 메커니즘을 가진 새로운 화합물을 설계함으로써 슈퍼박테리아와 같은 보건 위협에 대응하는 연구가 진행되고 있다.
해밀턴 흐름
hamiltonian-flow
해밀턴 함수에 의해 정의되는 위상 공간에서의 시간에 따른 상태 변화를 의미한다. 물리 시스템의 에너지 보존 법칙을 수학적으로 기술하며, 최적화 알고리즘의 연속 시간 극한을 분석하는 틀로 활용된다.
협력적 개선
co-improvement
AI가 단독으로 성능을 높이는 대신 인간 연구자와 협력하여 아이디어 구상부터 실험까지 함께 수행하며 발전하는 방식이다. 이는 AI의 발전 과정을 투명하게 관리하고 인간의 가치에 정렬된 안전한 지능을 구축하는 데 목적이 있다.
확률적 밴딧
stochastic-bandits
각 선택지(암)의 보상이 특정 확률 분포를 따르는 문제 설정으로, 제한된 기회 내에서 탐색과 활용의 균형을 맞추며 보상을 극대화하는 것이 핵심이다.
확률적 정책
stochastic-policy
특정 상태에서 가능한 각 행동에 대해 선택 확률을 할당하는 방식이다. 학습 초기 단계에서 다양한 경로를 탐색하거나 미분 가능한 목적 함수를 설계할 때 유리하다.
활성화 캡핑
activation-capping
특정 신경 활성화 값이 미리 정해진 안전 범위를 넘지 않도록 제한하는 기법이다. 모델이 어시스턴트 축에서 너무 멀어지는 것을 물리적으로 차단하여 비정상적인 행동을 방지한다.
희소성 처리
sparsity-handling
행렬의 대부분 원소가 0인 희소 행렬의 특성을 이용하여 계산량과 메모리 사용량을 줄이는 기술이다. 대규모 시스템의 미분 계산 시 연산 효율을 극적으로 높이는 데 필수적이다.
가비지 컬렉션
garbage-collection
프로그램에서 더 이상 사용하지 않는 메모리 영역을 자동으로 찾아내어 해제하는 메모리 관리 기법이다. 장기간 실행되는 ML 추론 서버에서 메모리 누수를 방지하고 안정적인 성능을 유지하기 위해 그 작동 원리를 이해하는 것이 중요하다.
계층적 데이터
hierarchical-data
데이터 단위가 서로 중첩된 구조를 가진 데이터이다. 예를 들어 학교(상위 단위) 내의 학생(하위 단위) 데이터처럼 서로 다른 수준의 변수들이 상호작용하는 특징이 있다.
계층적 어텐션
hierarchical-attention
대규모 데이터를 처리할 때 정보를 계층적으로 구조화하여 중요한 문맥을 효율적으로 파악하는 메커니즘이다. 500K 이상의 긴 컨텍스트 내에서 코드 간의 복잡한 의존성을 정확하게 추적할 수 있게 해준다.
공급망 지정학
supply-chain-geopolitics
핵심 부품의 제조 및 유통망 장악력이 국가 간의 정치적 영향력과 안보에 직결되는 현상이다. 반도체와 AI 기술이 국가 경쟁력의 핵심이 되면서 기술 패권 경쟁의 중심 의제로 부상했다.
광위상 변조기
optical-phase-modulator
빛의 위상을 변화시켜 정보를 인코딩하거나 주파수를 조절하는 장치이다. 양자 시스템에서 레이저를 정밀하게 제어하여 큐비트에 연산 명령을 내리는 데 필수적이다.
귀납적 불변량
inductive-invariant
시스템의 모든 가능한 상태에서 항상 참으로 유지되는 성질을 의미한다. 소프트웨어의 안전성을 수학적으로 증명할 때 시스템이 원치 않는 상태에 빠지지 않음을 보장하는 핵심 요소로 사용된다.
그래프 신경망
gnn
그래프 구조의 데이터를 입력으로 받아 노드, 엣지, 또는 그래프 전체의 특성을 학습하는 신경망 구조이다. 지리 공간 데이터와 같이 개체 간의 관계가 중요한 데이터 분석에 필수적이다.
기능별 사일로
functional-silo
조직의 각 부서가 서로 협력하지 않고 개별적인 성처럼 운영되어 정보가 단절되는 현상이다. 리테일에서는 구매, 기획, 물류 부서가 따로 놀아 의사결정이 늦어지는 원인이 되며 에이전틱 모델은 이를 통합된 데이터 루프로 해결하고자 한다.
기능적 동등성
feature-parity
서로 다른 플랫폼(웹, 앱, API 등)에서 제공되는 서비스의 기능이 동일한 수준으로 유지되는 상태이다. DeepL은 통합 백엔드 인프라를 통해 모든 채널에서 70개 이상의 언어를 동시에 지원함으로써 이를 달성했다.
기술적 특이점
technological-singularity
인공지능의 발전이 가속화되어 인간의 지능을 넘어서고 문명에 근본적인 변화를 일으키는 시점을 뜻한다. 본문에서는 개인이 AI를 통해 대규모 제작진의 역할을 대신하는 현상을 이와 연결했다.
노이즈 오프셋
noise-offset
학습 시 이미지의 평균 밝기를 조절하기 위해 노이즈에 오프셋을 추가하는 기술이다. 이를 통해 생성된 이미지의 대비를 높이거나 아주 어둡거나 밝은 이미지를 더 잘 표현할 수 있게 돕는다.
단계별 기술료
milestone-payment
기술 이전이나 공동 개발 계약 시 특정 목표(임상 진입, 승인 등)를 달성했을 때 지급받는 금액이다. 연구 개발의 진척도를 수익으로 연결하는 바이오 산업의 핵심 비즈니스 모델 중 하나이다.
데이터 라벨링
data-labeling
AI 모델 학습을 위해 이미지나 텍스트 같은 원천 데이터에 정답 값을 부여하는 과정이다. 모델의 정확도는 라벨링된 데이터의 품질에 직접적으로 의존한다.
데이터 병렬화
data-parallelism
전체 모델을 각 GPU에 복제하고 학습 데이터를 여러 배치로 나누어 병렬로 처리하는 기법입니다. 각 GPU에서 계산된 그래디언트를 동기화하여 모델을 업데이트하며, 구현이 비교적 간단하지만 모델이 단일 GPU 메모리에 들어갈 수 있어야 한다는 제약이 있습니다.
데이터 연결성
data-connectivity
서로 다른 플랫폼에 흩어져 있는 개인의 의료 기록이나 건강 데이터를 안전하게 통합하여 공유하는 기술적 능력이다. 파편화된 건강 정보를 하나로 모아 맞춤형 분석을 가능하게 하는 핵심 요소이다.
데이터 플레인
data-plane
네트워크 아키텍처에서 실제 데이터 패킷을 처리하고 전달하는 영역을 의미한다. AI 에이전트 맥락에서는 에이전트와 LLM 사이의 실제 통신, 데이터 흐름, 보안 정책 적용 등이 일어나는 실행 계층이다. 시스템의 성능과 안정성을 결정짓는 핵심적인 구성 요소이다.
도메인 시프트
domain-shift
AI 모델이 학습한 데이터의 분포와 실제 적용 환경의 데이터 분포가 달라 성능이 저하되는 현상이다. 의료 분야에서는 병원 장비나 환자군 차이로 인해 자주 발생하며 모델의 범용성을 저해하는 주요 원인이다.
도메인 전문가
domain-expert
특정 산업 분야나 업무 영역에 대해 깊은 지식과 경험을 가진 사람이다. AI 개발자가 알기 어려운 실무적인 뉘앙스와 엣지 케이스를 판단하는 역할을 수행한다.
디지털 병리학
digital-pathology
조직 표본 이미지를 디지털화하여 AI로 분석하는 기술로, 대규모 고해상도 이미지를 다루기 때문에 고도의 모델링과 데이터 처리 역량이 요구된다.
런타임 레이어
runtime-layer
프로그램이 실행되는 도중에 개입하여 특정 로직을 수행하는 소프트웨어 계층이다. 에이전트의 동작을 실시간으로 감시하고 실패 패턴이 감지될 경우 즉각적인 피드백을 제공하는 역할을 한다.
레거시 시스템
legacy-system
과거에 개발되어 현재까지 사용 중인 낡은 기술이나 시스템을 의미하며, AI 분야에서는 이미 학습되어 운영 중인 구형 모델과 인프라를 뜻한다.
립시츠 연속성
lipschitz-continuity
함수의 변화율이 일정 범위 내로 제한되어 있음을 의미하는 수학적 개념이다. 이 연구에서는 데이터가 공간상에서 급격하게 변하지 않고 매끄럽게 변화한다는 가정을 수식화하는 데 사용됐다.
메트릭 스케일
metric-scale
픽셀 간의 상대적인 거리 차이가 아닌 실제 물리적 거리 단위를 가진 데이터 체계이다. 로봇 팔이 실제 공간에서 움직이기 위해서는 추정된 깊이 값이 반드시 실제 미터나 밀리미터 단위와 일치해야 한다. 모델의 예측값을 실제 물리량으로 변환하는 과정이 필수적이다.
몰입형 미디어
immersive-media
몰입형 미디어는 가상현실(VR)이나 증강현실(AR)과 같이 사용자가 디지털 환경 속에 실제로 존재하는 듯한 느낌을 주는 기술이다. 시각적 요소뿐만 아니라 공간감 있는 음성 AI 기술이 결합되어 현실과 유사한 경험을 제공한다. 음성 인터페이스는 이러한 환경에서 사용자가 자연스럽게 소통할 수 있도록 돕는 필수적인 요소이다.
미사용 데이터
data-at-rest
네트워크를 통해 이동 중이지 않고 하드 드라이브, 클라우드 스토리지 등 물리적 매체에 저장되어 있는 상태의 데이터를 말한다. 보안 정책에서 저장된 데이터의 암호화 및 보관 위치를 지정할 때 주로 사용되는 용어다. 이동 중인 데이터와 구분하여 관리된다.
반도체 공급망
semiconductor-supply-chain
설계, 제조, 패키징 등 반도체 생산의 전 과정을 의미한다. AI 모델 구동을 위한 칩 수요가 폭증하면서 지정학적 리스크와 결합된 핵심 안보 이슈로 부상했다.
불균형 데이터
imbalanced-data
특정 클래스의 샘플 수가 다른 클래스에 비해 현저히 적은 상태를 의미한다. 이는 모델이 다수 클래스에 편향되게 학습되어 소수 클래스 예측력이 떨어지는 문제를 야기한다.
불쾌한 골짜기
uncanny-valley
로봇이나 컴퓨터 그래픽이 인간과 어설프게 닮을수록 인간이 느끼는 호감도가 급격히 떨어지고 불쾌감을 느끼게 되는 현상이다. 로봇의 움직임이 인간과 완벽히 일치하지 않을 때 발생하는 인지적 부조화가 원인으로 지목된다.
브라운 말뭉치
brown-corpus
1961년 미국 영어 텍스트를 모아 만든 최초의 컴퓨터 가독형 말뭉치로, 약 100만 단어로 구성된 NLP 연구의 고전적 데이터셋이다.
비볼록 최적화
nonconvex-optimization
최적화 대상 함수가 볼록하지 않아 여러 개의 국소 최적해(Local Minima)가 존재할 수 있는 문제로 전역 최적해를 찾는 것이 이론적으로 까다롭다.
비선형 시스템
nonlinear-system
입력값의 변화가 출력값에 비례하지 않는 복잡한 시스템으로 기상 현상이나 생물학적 반응처럼 예측이 어려운 특성을 가진다.
비정상 시계열
non-stationary-time-series
시간에 따라 평균이나 분산 등 통계적 특성이 변하는 시계열 데이터를 의미한다. 실제 환경의 데이터는 대부분 비정상성을 띠며 이를 정확히 분석하기 위해서는 일반적인 통계 모델보다 복잡한 접근이 필요하다.
비정형 데이터
unstructured-data
미리 정의된 데이터 모델이나 형식이 없는 데이터로, AI 에이전트에서는 주로 사용자와의 자유로운 대화 텍스트가 이에 해당한다. 정형 데이터와 달리 전통적인 통계 도구로 분석하기 어렵다.
샘플링 복잡도
sampling-complexity
알고리즘이 원하는 수준의 정확도나 신뢰도에 도달하여 정답을 도출하기 위해 필요한 데이터 샘플의 총 개수를 의미하는 이론적 척도이다.
선언적 인프라
declarative-infrastructure
사용자가 원하는 최종 상태를 코드로 정의하면 시스템이 자동으로 그 상태를 구현하고 유지하는 방식이다. 수동 설정 오류를 줄이고 인프라 관리의 재현성을 높인다.
소프트 임계값
soft-thresholding
데이터 값이 특정 임계값보다 작으면 0으로 만들고, 크면 그 차이만큼 줄이는 연산이다. LASSO와 같은 희소 모델링에서 변수를 선택하고 계수를 수축시키는 핵심 메커니즘이다.
수정된 해밀턴
modified-hamiltonian
이산화된 수치 방법이 실제로 근사하고 있는 가상의 보존량을 의미한다. 수치 오차에도 불구하고 이 값이 일정하게 유지되는 성질을 이용하여, 이산 시간 알고리즘의 장기적인 수렴 거동을 정밀하게 분석할 수 있게 한다.
숨겨진 복잡성
hidden-complexity
겉으로는 정상 작동하는 것처럼 보이지만 내부적으로는 유지보수가 어렵거나 비효율적인 구조가 쌓이는 현상이다. AI가 생성한 코드가 기존 패턴을 무분별하게 복제할 때 발생하기 쉽다.
스레드 평탄화
thread-flattening
여러 메시지가 연결된 대화 구조를 무시하고 각각을 독립된 평면적인 문서로 변환하는 과정이다. 이로 인해 메시지 간의 선후 관계나 인용 맥락이 소실되어 에이전트의 이해도를 낮춘다.
스태킹 앙상블
stacking
여러 모델의 예측 결과를 새로운 데이터셋의 피처로 사용하여 최종 메타 모델을 학습시키는 앙상블 기법이다. 개별 모델들이 가진 장점을 결합하여 단일 모델보다 높은 일반화 성능을 얻는 것이 목적이다.
시각적 일관성
visual-consistency
여러 장의 생성 이미지에서 동일한 캐릭터, 사물, 스타일이 변하지 않고 유지되는 성질입니다. 생성형 AI에서 가장 구현하기 어려운 요소 중 하나로, 브랜드 아이덴티티나 스토리텔링에 필수적입니다.
시계열 데이터
time-series-data
일정 시간 간격으로 배치된 데이터들의 수열로 과거의 패턴을 통해 미래의 변화를 예측하는 데 사용된다.
시스템 메시지
system-message
모델의 역할이나 행동 방식을 설정하기 위해 개발자가 입력하는 최상위 지침이다. 사용자 프롬프트보다 먼저 처리되어 모델의 전체적인 톤앤매너와 제약 사항을 결정하는 핵심 요소이다.
심볼릭 등가성
symbolic-equivalence
서로 다른 두 표현이 수학적 또는 논리적으로 동일한 가치를 가짐을 의미한다. 변환 과정에서 논리적 본질이 유지되었는지 확인하는 기준이다.
아파치 플링크
apache-flink
대규모 데이터 스트림을 실시간으로 처리하기 위한 오픈소스 프레임워크이다. 저지연과 고가용성을 보장하며, Grab의 시나리오 시스템에서 실시간 이벤트 트리거와 데이터 처리를 담당한다.
안전한 콘텐츠
sfw
Safe For Work의 약자로, 직장이나 공공장소에서 보기에 적절한 수위의 콘텐츠를 의미한다. 이미지 생성 AI 분야에서는 성인용 콘텐츠(NSFW)와 대비되는 일반적인 예술 및 실용 목적의 이미지를 지칭할 때 주로 사용된다.
암묵적 정규화
implicit-regularization
명시적인 규제 항을 추가하지 않아도 최적화 알고리즘이나 모델 구조의 특성에 의해 자연스럽게 발생하는 정규화 효과이다.
어텐션 기하학
attention-geometry
트랜스포머 모델 내에서 토큰 간의 관계를 정의하는 수학적 구조를 의미하며, RePo는 이를 동적으로 변형하여 관련성 높은 정보를 가깝게 배치한다.
어텐션 마스크
attention-mask
특정 토큰이 다른 토큰을 참고할 수 있는지 여부를 결정하는 행렬이다. 컨티뉴어스 배칭에서는 여러 프롬프트를 하나로 묶었을 때 서로 간섭하지 않도록 분리하는 용도로 사용된다.
에너지 불변성
energy-invariant
시스템의 총 에너지가 보존되거나 특정 임계치 이상으로 유지되어야 한다는 원칙으로, 모델의 성능이나 정보량이 업데이트 과정에서 손실되지 않도록 보장한다.
에너지 최소화
energy-minimization
모델이 예측한 결과와 실제 정답 사이의 불일치를 에너지로 정의하고, 이를 가장 낮은 상태로 만드는 최적화 과정이다. EBM에서 정답에 가까운 상태를 찾는 핵심 메커니즘이다.
역방향 프록시
reverse-proxy
클라이언트의 요청을 대신 받아 내부 서버로 전달하는 서버이다. 보안 강화, 부하 분산, 내부 네트워크 구조 은닉을 위해 사용되며 AI 환경에서는 동적 세션 접근 제어의 핵심 요소이다.
의미적 일관성
semantic-consistency
모델이 생성한 결과물이 문맥적으로나 논리적으로 모순 없이 일관되게 유지되는 상태를 의미한다. 추론 과정의 각 단계가 전체 목표와 부합하는지 검증하여 최종 답안의 정확도를 높인다.
이기종 컴퓨팅
heterogeneous-computing
CPU, GPU, NPU 등 서로 다른 아키텍처를 가진 프로세서들을 함께 사용하여 연산 효율을 극대화하는 방식이다.
이미지 스티칭
image-stitching
여러 장의 사진에서 겹치는 영역을 찾아 기하학적으로 정렬하고 색감을 보정하여 하나의 매끄러운 파노라마로 합치는 기술이다. Gigapan 시스템의 핵심 소프트웨어 공정으로, 수천 개의 조각을 오차 없이 연결하는 것이 관건이다.
이질적 데이터
heterogeneous-data
수집 환경, 측정 방식, 데이터 구조 등이 서로 다른 데이터셋을 의미하며, 이를 통합 분석하여 일관된 결론을 도출하는 것은 빅데이터 분야의 주요 난제다.
인과적 마스크
causal-mask
모델이 특정 토큰을 생성할 때 그 뒤에 올 미래의 토큰 정보를 보지 못하도록 가리는 행렬이다. 언어 생성 모델이 과거 정보만을 바탕으로 다음 단어를 예측하도록 강제하는 역할을 한다.
장거리 의존성
long-range-dependency
입력 시퀀스 내에서 서로 멀리 떨어진 토큰들 사이의 관계를 파악해야 하는 특성으로, 기존 모델이 어려움을 겪는 영역 중 하나이다.
저전력 연결성
low-power-connectivity
최소한의 전력 소모로 데이터를 전송하는 기술로, 배터리로 구동되는 IoT 기기의 수명을 극대화하는 데 핵심적이다.
적대적 최적화
adversarial-optimization
생성자와 판별자라는 두 네트워크가 서로 경쟁하며 성능을 높이는 방식으로, GAN의 핵심적인 학습 메커니즘이다.
전문가 병렬화
expert-parallelism
MoE(Mixture of Experts) 구조에서 각 전문가(Expert)를 여러 GPU에 분산 배치하는 방식이다. 모든 전문가를 복제하는 대신 특정 GPU가 특정 전문가를 전담하게 하여 메모리 효율성을 높인다.
점근적 동일성
asymptotic-equivalence
샘플 크기가 무한히 커짐에 따라 두 확률 분포나 통계량이 서로 구별할 수 없을 정도로 가까워지는 성질이다. 온라인 학습 결과가 배치 학습 결과와 동일한 성능을 내는지 판단하는 중요한 기준이 된다.
점근적 정규성
asymptotic-normality
표본의 크기가 무한히 커짐에 따라 추정량의 분포가 정규 분포에 가까워지는 성질이다. 이는 추정량의 통계적 유효성과 신뢰 구간을 설정하는 데 중요한 근거가 된다.
점근적 정규화
asymptotic-normalization
데이터의 양이 무한히 많아짐에 따라 추정된 확률 밀도 함수의 적분값이 1로 수렴하여 유효한 확률 분포의 형태를 갖추게 되는 성질이다. 별도의 정규화 계산 없이도 확률 모델로서의 수학적 타당성을 보장한다.
정체성 일관성
identity-consistency
영상 내에서 인물이나 사물의 외형적 특징이 장면이 바뀌어도 동일하게 유지되는 성질이다. AI 영상 생성에서 가장 어려운 과제 중 하나로 꼽히며 일관성이 확보되어야 긴 호흡의 스토리텔링이 가능하다.
정확도 선형성
accuracy-on-the-line
학습 데이터에서 높은 성능을 보인 모델이 새로운 데이터 환경에서도 상대적으로 높은 성능을 유지할 것이라는 가설이다. 본 연구는 가짜 상관관계가 존재할 때 이 가설이 무너질 수 있음을 입증했다.
주문형 반도체
asic
특정 목적을 수행하기 위해 설계된 통합 회로이다. 범용 GPU와 달리 AI 추론과 같은 특정 작업에만 최적화되어 있어 전력 소모가 적고 단위 전력당 처리 성능이 뛰어나 기존 데이터 센터의 전력 제한 내에서 운영하기 적합하다.
준비성 프로브
readiness-probe
컨테이너가 실행 중인지뿐만 아니라, 실제로 트래픽을 처리할 준비(예: 모델 로딩 완료)가 되었는지 확인하는 메커니즘이다. 이를 통해 불완전한 상태의 포드에 요청이 가는 것을 방지한다.
지속성 시스템
persistent-system
일회성 명령 수행에 그치지 않고, 특정 목표를 달성할 때까지 또는 24시간 내내 상시 가동되며 작업을 수행하는 AI 시스템이다. 이를 위해 안정적인 하드웨어 인프라와 장기적인 상태 관리가 필수적으로 요구된다.
책임성 생태계
accountability-ecosystem
AI 개발부터 배포까지 전 과정에서 발생할 수 있는 문제에 대해 누가 책임을 질지 명확히 하고 이를 검증하는 시스템이다. 감사와 공시를 통해 투명성을 확보하는 기반이 된다.
최적화 복잡도
optimization-complexity
모델의 손실 함수를 최소화하는 최적의 가중치를 찾아가는 과정의 난이도를 의미한다. 층이 깊어질수록 손실 함수의 지형이 복잡해져 전역 최적점을 찾기 어려워진다.
캐릭터 일관성
character-consistency
서로 다른 프롬프트나 설정값으로 이미지를 생성하더라도 동일한 캐릭터의 외형적 특징이 변하지 않고 유지되는 성질이다. 스토리텔링이나 브랜드 마케팅에서 특정 페르소나를 반복적으로 노출할 때 필수적인 기술 요소이다.
코드형 인프라
infrastructure-as-code
수동 프로세스가 아닌 코드를 통해 클라우드 인프라를 정의하고 관리하는 방식이다. TTMDocs는 Pulumi를 사용하여 클라우드 자원 배포를 자동화하고 반복 가능한 배포 환경을 제공한다.
코드형 인프라
iac
코드를 통해 인프라를 자동화하고 관리하는 기술이다. 수동 설정 대신 스크립트를 사용하여 일관성을 유지하고 휴먼 에러를 방지하는 데 중요하다.
코사인 유사도
cosine-similarity
두 벡터 간의 각도를 이용해 유사성을 측정하는 지표로, 임베딩 모델에서 검색의 척도로 널리 쓰인다. 하지만 수치적 유사도가 높더라도 실제 의미적 일치와는 다를 수 있어 'Semantic ≠ Embedding' 실패의 원인이 된다.
크로스 플랫폼
cross-platform
윈도우, 맥OS, 리눅스 등 서로 다른 운영체제 환경에서 동일하게 작동하는 소프트웨어의 특성이다. 파이썬으로 작성되어 다양한 환경의 개발자들이 제약 없이 사용할 수 있음을 의미한다.
클래스 불균형
class-imbalance
데이터셋에서 특정 클래스의 샘플 수가 다른 클래스에 비해 현저히 적은 상태를 의미한다. 추천 시스템에서는 클릭이나 구매 같은 양성 샘플이 매우 적어 모델이 다수 클래스에 편향되는 문제를 야기한다.
태스크 마이닝
task-mining
사용자의 데스크톱 활동 데이터를 수집하여 개별 작업 단계와 패턴을 분석하는 기법이다. 프로세스 마이닝보다 세밀한 수준에서 자동화 가능한 작업을 식별하는 데 사용된다.
텍스트 렌더링
text-rendering
이미지 생성 AI가 그림 내부에 글자를 정확한 형태와 철자로 그려내는 기술이다. 초기 모델들은 글자를 뭉개뜨리는 경향이 있었으나 최신 모델들은 이를 명확하게 표현한다.
템플릿 리터럴
template-literal
자바스크립트에서 백틱(`)을 사용하여 문자열 내에 변수를 삽입하는 문법이다. Tailwind CSS와 같은 도구는 빌드 시점에 클래스명을 정적으로 찾아야 하는데, 이 문법을 사용하면 분석이 불가능해질 수 있다.
통계적 검정력
statistical-power
실제로 효과가 존재할 때 이를 통계적으로 유의미하다고 올바르게 판단할 확률이다. A/B 테스트에서 실험의 신뢰도를 결정하며, 표본 크기와 효과 크기에 따라 변동된다.
통계적 숙명론
statistical-fatalism
미래의 결과가 이미 결정되어 있으며 우리의 개입이 시스템의 근본적인 인과 구조를 바꾸지 못한다고 믿는 태도이다. 통계 모델이 현실의 역동적인 피드백 루프를 반영하지 못하게 만드는 이론적 한계로 지적된다.
투기적 디코딩
speculative-decoding
상대적으로 작고 빠른 드래프트 모델이 먼저 여러 토큰을 생성하고, 큰 타겟 모델이 이를 한 번에 검증하는 기법이다. 검증 성공 시 여러 토큰을 동시에 생성한 효과를 내어 추론 속도를 획기적으로 높인다.
페이팔 마피아
paypal-mafia
페이팔 출신들이 퇴사 후 테슬라, 링크드인, 유튜브 등 실리콘밸리의 상징적인 기업들을 잇달아 창업하며 형성한 강력한 인적 네트워크를 의미한다.
프레임 피드백
frame-feedback
이전 생성 단계의 마지막 프레임을 다음 단계의 입력값으로 사용하여 영상의 길이를 연장하는 재귀적 생성 기법이다.
플래시 어텐션
flash-attention
트랜스포머 모델의 핵심인 어텐션 연산을 메모리 효율적으로 수행하도록 최적화한 알고리즘이다. GPU/NPU의 메모리 계층 구조를 활용하여 연산 속도를 높이고 긴 컨텍스트 처리를 가능하게 한다.
합성곱 신경망
cnn
이미지의 공간적 정보를 보존하면서 특징을 추출하기 위해 합성곱 연산을 사용하는 신경망 구조이다. 필터를 통해 이미지의 패턴을 파악하며, 시각 지능 구현에 필수적인 아키텍처로 평가받는다.
합성곱 신경망
convolutional-neural-network
이미지의 공간적 정보를 보존하며 특징을 추출하는 신경망 구조로, 인간 시각 피질의 작동 방식을 모방하여 설계되어 시각 정보 처리에 탁월한 성능을 보인다.
해밀턴 시스템
hamiltonian-system
물리학에서 에너지 보존 법칙을 따르는 동역학계를 설명하는 수학적 모델이다. 이 프레임워크에서는 에이전트의 보상과 다양성을 에너지와 운동량으로 치환하여 시스템의 안정성을 물리적으로 정의하는 데 사용된다.
확률적 변동성
stochastic-variance
모델이 동일한 입력에도 확률적으로 다른 결과값을 내놓는 특성으로, 시스템의 안정성과 재현성을 저해하는 요인이 된다.
확률적 앵무새
stochastic-parrot
대형 언어 모델이 실제 의미를 이해하지 못한 채 학습 데이터의 통계적 확률에 따라 단어를 나열할 뿐이라는 비판적 용어이다. AI의 한계를 지적할 때 주로 사용된다.
공간적 상관관계
spatial-association
지리적 위치에 따라 변수들 사이의 관계가 어떻게 변화하는지를 연구하는 개념이다. 특정 지역의 환경 요인과 결과 사이의 관계를 분석할 때 위치에 따른 데이터 의존성을 고려한다.
데이터 레지던시
data-residency
조직의 데이터가 물리적으로 특정 국가나 지역 내에 저장되고 처리되어야 함을 의미하는 개념이다. 각국의 데이터 보호법이나 산업별 규제를 준수하기 위해 필수적이며, 기업이 데이터의 위치를 제어할 수 있게 한다. 이는 클라우드 서비스 도입 시 가장 먼저 고려되는 보안 요소 중 하나다.
데이터 매니폴드
data-manifold
고차원 공간에 존재하는 데이터들이 실제로 분포하는 저차원의 부분 공간을 의미한다. 모델이 이 매니폴드를 얼마나 조밀하게 학습하느냐가 일반화 성능과 보간 능력의 척도가 된다.
데이터 큐레이션
data-curation
수집된 대규모 데이터 중 모델 학습에 가장 가치 있는 특정 데이터를 선별하고 조직화하는 과정이다. 단순히 데이터를 모으는 것을 넘어, 학습 목적에 부합하는 고품질 데이터를 추출하여 모델 성능을 효율적으로 개선하는 데 필수적이다.
리액트 에이전트
react-agent
추론(Reasoning)과 행동(Acting)을 결합하여 문제를 해결하는 에이전트 설계 패턴이다. 모델이 다음 행동을 결정하기 전에 생각을 먼저 출력하도록 유도하여 복잡한 작업의 정확도를 높인다.
리액트 프롬프팅
react-prompting
모델이 추론(Reason)과 행동(Act)을 번갈아 수행하며 복잡한 문제를 해결하는 기법으로, 도구 사용 결과에 따라 다음 단계를 결정한다.
방향성 네트워크
directed-network
노드 간의 연결(에지)에 방향성이 존재하는 네트워크이다. 트위터의 팔로우 관계나 웹페이지의 하이퍼링크 구조처럼 정보나 영향력의 흐름이 한쪽으로 발생하는 관계를 표현한다.
백엔드 어피니티
backend-affinity
특정 클라이언트의 요청을 항상 동일한 백엔드 서버로 전달하여 세션 상태나 캐시 데이터를 유지함으로써 성능을 최적화하는 기술이다.
버스티 워크로드
bursty-workload
트래픽이 일정하지 않고 특정 시점에 갑자기 몰렸다가 사라지는 불규칙한 작업 부하 패턴이다. 이러한 환경에서는 자원 할당과 해제가 빈번하게 일어나 서버리스의 오버헤드가 극대화되는 경향이 있다. 효율적인 자원 관리를 위해서는 예측 가능한 트래픽과 버스티한 트래픽을 구분하여 인프라를 설계해야 한다.
블랙웰 아키텍처
blackwell-architecture
NVIDIA의 차세대 GPU 아키텍처로, FP4와 같은 초저정밀도 연산을 지원하는 텐서 코어와 높은 대역폭의 메모리 구조를 갖추고 있다. 대규모 언어 모델의 학습과 추론에 최적화된 하드웨어이다.
사용자 에이전트
user-agent
웹 브라우저나 봇이 서버에 요청을 보낼 때 자신을 식별하기 위해 전달하는 문자열 정보이다. 이를 통해 서버는 접속자가 크롬 브라우저인지, 구글 봇인지, 혹은 특정 AI 서비스의 페처인지 구분할 수 있다.
소프트 로보틱스
soft-robotics
금속 같은 딱딱한 재질 대신 실리콘, 고무 등 유연한 소재를 사용하여 인간과의 상호작용이나 복잡한 지형 이동에 유리한 로봇 분야이다.
시맨틱 트레이스
semantic-trace
단순한 타임스탬프나 상태 코드를 넘어 에이전트의 사고 과정, 도구 사용 의도, 결과물 등을 구조화된 텍스트 형태로 기록한 추적 데이터이다. 에이전트의 추론 과정을 인간이 이해할 수 있게 해준다.
시스템 프롬프트
system-prompt
AI 모델에게 부여하는 초기 지침으로, 에이전트의 역할, 말투, 제약 사항 등을 정의하여 대화의 전반적인 방향을 설정하는 핵심 요소이다.
실시간 워크로드
real-time-workload
데이터가 발생하는 즉시 지연 없이 처리해야 하는 작업 부하를 말한다. AI 분야에서는 사용자의 질문에 즉각 응답하는 챗봇이나 실시간 음성 번역 등이 대표적인 사례이다.
싱크혼 알고리즘
sinkhorn-algorithm
엔트로피 정규화가 적용된 최적 운송 문제를 반복적인 행렬 스케일링을 통해 빠르게 해결하는 알고리즘이다. 고차원 데이터 간의 거리를 계산할 때 매우 효율적이다.
어텐션 메커니즘
attention-mechanism
입력 데이터의 각 부분이 서로 얼마나 관련이 있는지 계산하여 가중치를 부여하는 기술이다. 쿼리, 키, 값 벡터를 사용하여 문맥적 관계를 파악하며 LLM의 핵심 연산 단위를 구성한다.
엘니뇨 남방진동
enso
열대 태평양의 해수면 온도와 대기압 변화가 전 지구적 기상 패턴에 영향을 미치는 현상이다. 전통적인 기상 예측에서 가장 중요하게 다루는 지표 중 하나이다.
우연적 불확실성
aleatoric-uncertainty
데이터 자체에 내재된 무작위성이나 측정 오차로 인해 발생하는 불확실성이다. 이는 시스템의 근본적인 가변성에서 기인하므로 데이터를 더 많이 수집하더라도 제거하거나 줄일 수 없는 성질을 가진다.
웨이모 드라이버
waymo-driver
웨이모의 자율주행 차량을 제어하는 핵심 AI 시스템으로, 레이더, 리다르, 카메라 등의 센서 정보를 통합 처리한다. 다양한 도시 환경과 기상 조건에서도 안전하게 주행할 수 있도록 설계된 소프트웨어 및 하드웨어 통합 플랫폼이다.
인식적 불확실성
epistemic-uncertainty
모델의 구조가 부적절하거나 학습 데이터가 부족하여 발생하는 지식의 결핍에 의한 불확실성이다. 더 많은 양질의 데이터를 확보하거나 모델의 복잡도를 조정함으로써 줄여나갈 수 있는 불확실성이다.
인지적 레이어링
cognitive-layering
인간의 사고 과정을 성찰, 반응, 판단 등 서로 다른 층위로 나누어 모델링하는 방식으로, AI가 복잡한 인격이나 시점을 일관되게 유지하도록 돕는 프레임워크다.
인지적 탈숙련화
cognitive-de-skilling
AI 도구에 대한 일상적인 의존으로 인해 인간이 본래 가졌던 전문 기술이나 판단 능력이 퇴화하는 과정이다. AI 보조가 없는 상황에서 전문가의 업무 수행 능력이 현저히 떨어지는 결과를 초래한다.
저차원 매니폴드
low-dimensional-manifold
고차원 공간에 흩어진 데이터가 실제로는 훨씬 낮은 차원의 곡면이나 구조 위에 존재한다는 가설이다. 이미지나 음성 데이터처럼 복잡한 데이터도 실제 유효한 정보는 저차원에 집중되어 있다는 점을 이용한다. 이를 활용하면 차원의 저주를 피하고 효율적인 학습이 가능하다.
제공자 불가지론
provider-agnostic
특정 클라우드 서비스나 모델 제공업체에 종속되지 않고 다양한 환경에서 동일하게 작동하는 특성을 의미한다. 이를 통해 사용자는 비용이나 성능에 따라 자유롭게 모델을 교체할 수 있는 유연성을 얻는다.
체화된 에이전트
embodied-agent
가상 또는 물리적 환경 내에서 신체를 가지고 주변 세계와 상호작용하며 임무를 수행하는 AI 시스템이다. 단순히 텍스트를 처리하는 것을 넘어 시각적 관찰과 물리적 행동을 통해 목표를 달성하는 능력을 갖춘다.
캡스톤 프로젝트
capstone-project
학습한 내용을 바탕으로 실제 문제를 해결하기 위해 기획부터 구현까지 직접 수행하는 최종 결과물 프로젝트이다. 이론적 지식을 실무 역량으로 전환하는 중요한 과정으로 평가받는다.
클로드 아티팩트
claude-artifacts
Claude가 코드, 웹사이트, 다이어그램 등을 별도의 창에 실시간으로 생성하고 실행하여 보여주는 기능이다. 사용자는 텍스트 대화를 넘어 시각적이고 인터랙티브한 결과물을 즉각적으로 확인하고 수정할 수 있어 교육용 도구 제작에 매우 유용하다.
태스크 호라이즌
task-horizon
AI 모델이 단절 없이 자율적으로 수행할 수 있는 작업의 시간적 범위나 복잡도의 깊이를 의미한다. 짧은 응답을 넘어 수 시간 동안 지속되는 복잡한 워크플로우를 완수하는 능력을 측정하는 핵심 지표이다.
테스트 커버리지
test-coverage
테스트가 소프트웨어의 기능을 얼마나 충분히 검증하고 있는지를 나타내는 지표이다. AI 시대에는 단순히 코드 실행율을 넘어 비즈니스 위험 요소를 얼마나 포괄하는지가 더 중요한 척도가 된다.
포인트 클라우드
point-cloud
3차원 공간에 흩어져 있는 점들의 집합으로 물체의 표면 형상을 나타내는 데이터 형식이다. RGB-D 센서나 라이다를 통해 획득하며 로봇의 환경 인식 및 물체 조작을 위한 기본 데이터로 활용된다. 점들의 밀도와 정확도가 로봇의 작업 정밀도를 결정한다.
호크스 프로세스
hawkes-process
자기 흥분적(Self-exciting) 특성을 가진 점 프로세스로, 과거 사건의 발생이 미래 사건의 발생 확률을 높이는 모델이다. 신경과학에서 뉴런의 스파이크 발생 패턴을 수학적으로 기술하는 데 널리 사용된다.
데이터 엔지니어링
data-engineering
원시 데이터를 분석이나 AI 학습에 적합한 형태로 수집, 저장, 변환하는 시스템을 설계하고 구축하는 과정이다. 데이터의 품질과 신뢰성을 확보하기 위한 파이프라인 구축이 핵심이다. AI 모델의 성능은 입력되는 데이터의 질에 좌우되므로 AI 구현의 필수 선행 단계이다.
데이터 파이프라인
data-pipeline
원천 데이터 수집부터 저장, 가공, 분석까지의 전 과정을 자동화한 시스템으로, 대규모 ML 모델 학습의 안정성과 효율성을 결정짓는 기반이다.
디지털 페노타이핑
digital-phenotyping
스마트폰이나 웨어러블 기기에서 발생하는 데이터를 분석하여 개인의 행동 패턴이나 건강 상태를 파악하는 기법이다. AI를 통해 이러한 비정형 데이터를 해석함으로써 정신 건강 진단 등에 활용할 수 있다.
디퓨전 트랜스포머
dit
트랜스포머 아키텍처를 확산 모델의 백본으로 사용하는 구조로, 확장성이 뛰어나 대규모 데이터 학습에 유리하다. 기존의 U-Net 구조를 대체하여 복잡한 데이터 패턴을 더 잘 학습하며, 오디오 생성 분야에서도 높은 성능을 보여준다.
명령줄 인터페이스
cli-command-line-interface
텍스트 명령어를 입력하여 컴퓨터와 상호작용하는 방식이다. 클로드 코드가 이 방식을 사용하며, 코워크는 이를 일반 사용자가 쓰기 편한 GUI(그래픽 인터페이스)로 바꾼 제품이다.
명령줄 인터페이스
cli
텍스트 터미널을 통해 사용자가 컴퓨터와 상호작용하는 방식이다. 그래픽 UI보다 가볍고 자동화가 쉬워 개발자용 도구에서 널리 사용된다.
브랜드 아이덴티티
brand-identity
기업이나 제품이 소비자에게 전달하고자 하는 고유한 이미지와 가치 체계이다. 로고, 색상, 폰트 등 시각적 요소뿐만 아니라 브랜드의 철학을 모두 포함한다.
비동기 워크플로우
asynchronous-workflow
즉각적인 피드백이 아닌 일정 시간이 소요되는 작업을 백그라운드에서 처리하는 방식이다. 코드 리뷰는 개발자가 제출 후 다른 작업을 하므로 이 방식에 적합하다.
비디오 트랜스포머
video-transformer
어텐션 메커니즘을 영상 데이터에 적용하여 프레임 간의 시공간적 관계를 학습하는 모델이다. 정적인 배경과 대비되는 객체의 고유한 움직임 패턴을 포착하는 데 유리하다.
소프트 액추에이터
soft-actuator
유연한 재질로 만들어진 구동 장치로, 이 기사에서는 로봇의 날개를 움직이는 인공 근육 역할을 한다. 기존의 딱딱한 모터보다 가볍고 충격에 강하며 고주파 진동을 생성하는 데 유리하다.
이기종 파이프라인
heterogeneous-pipeline
GPU, NPU, 맞춤형 가속기 등 서로 다른 특성을 가진 하드웨어들을 조합하여 전체 추론 과정을 최적화하는 시스템 구조이다. 각 하드웨어의 장점을 극대화할 수 있다.
지속성 다이어그램
persistence-diagram
데이터의 위상적 특징이 생성되고 소멸하는 시점을 2차원 평면에 나타낸 도구이다. 데이터 내의 구멍이나 연결성 같은 구조적 정보를 노이즈와 구분하여 파악하는 데 필수적이다.
텍스트 그래디언트
textual-gradient
신경망의 수치적 기울기 대신 자연어 비평을 사용하여 시스템을 개선하는 기법이다. 특정 단계의 실패 원인을 텍스트로 분석하고 이를 역전파하여 프롬프트를 수정함으로써 비미분적인 에이전트 워크플로우를 최적화할 수 있게 한다.
확률적 프로그래밍
stochastic-programming
불확실성이 존재하는 상황에서 최적의 의사결정을 내리기 위한 수리적 최적화 기법이다. 데이터 과학에서 불확실한 미래를 모델링할 때 주로 사용된다.
휘발성 인터페이스
ephemeral-interface
사용자의 특정 요청이나 맥락에 따라 실시간으로 생성되었다가 목적을 달성하면 사라지는 사용자 인터페이스이다. 고정된 메뉴 구조 대신 AI가 필요한 기능을 즉석에서 구성하여 제공하는 것이 특징이다.
바닐라 자바스크립트
vanilla-javascript
외부 프레임워크나 라이브러리 없이 순수 자바스크립트만 사용하는 방식이다. 추가적인 종속성 없이 가볍고 빠른 실행이 가능하여 경량 앱 개발에 유리하다.
시맨틱 세그멘테이션
semantic-segmentation
이미지의 모든 픽셀을 미리 정의된 카테고리(예: 하늘, 도로, 나무)로 분류하는 기술이다. 개별 객체의 구분보다는 영역 자체의 의미론적 정보를 추출하는 데 중점을 둔다.
이미지 세그멘테이션
image-segmentation
이미지 내의 각 픽셀이 어떤 객체나 클래스에 속하는지 분류하는 기법으로, 이 실험에서는 미로의 경로 부분을 추출하는 데 활용되었다.
파놉틱 세그멘테이션
panoptic-segmentation
인스턴스 세그멘테이션과 시맨틱 세그멘테이션을 결합한 기법으로, 개별 객체와 배경을 동시에 픽셀 단위로 분류한다. 모든 픽셀에 의미 있는 라벨을 부여하여 장면의 전체적인 구조를 파악하는 데 필수적이다.
풀스택 애플리케이션
full-stack-application
사용자가 보는 화면(프론트엔드)과 데이터 처리 및 저장(백엔드/데이터베이스)이 모두 포함된 완전한 형태의 소프트웨어다. 단순한 화면 구성뿐만 아니라 실제 데이터가 저장되고 비즈니스 로직이 작동하는 상태를 의미한다.
공급망 오케스트레이션
supply-chain-orchestration
생산부터 배송까지의 전 과정에서 다양한 로봇과 시스템이 조화롭게 작동하도록 관리하는 기술이다. 개별 로봇의 효율을 넘어 전체 시스템의 최적화를 목표로 한다.
런타임 오케스트레이션
runtime-orchestration
AI 모델이 실행되는 시점(런타임)에 연산 자원 배분, 지연 시간 최적화, 에이전트 간의 통신 등을 관리하는 기술이다. 대규모 에이전트 환경에서 추론 비용을 절감하고 성능을 유지하는 데 결정적인 역할을 한다.
관계형 파운데이션 모델
rfm
데이터 간의 복잡한 관계를 그래프 구조로 모델링하는 파운데이션 모델이다. 엔티티 간의 상호작용을 학습하여 공급망 분석이나 사기 탐지 등 관계 중심의 금융 분석에서 높은 성능을 발휘한다.
시계열 파운데이션 모델
tsfm
대규모 시계열 데이터를 사전 학습하여 다양한 금융 지표의 예측 및 이상 탐지에 활용되는 모델이다. 특정 데이터셋에 국한되지 않고 일반적인 시간적 패턴을 학습하여 제로샷 예측 성능을 극대화한다.
명령줄 인터페이스 에이전트
cli-agent
터미널 환경에서 텍스트 명령어를 통해 작동하는 AI 에이전트이다. 주로 개발자용 도구로 쓰였으나, 최근에는 이를 추상화하여 일반 사용자도 쉽게 쓸 수 있는 GUI 형태로 발전하고 있다.
계층적 베이지안 모델
hierarchical-bayesian-model
여러 수준의 파라미터를 계층적으로 설정하여 데이터를 모델링하는 통계적 방법이다. 상위 수준의 분포가 하위 수준 파라미터에 영향을 미치도록 설계되어 데이터의 중첩 구조를 효과적으로 반영한다.
중첩된 힐베르트 공간
nested-hilbert-spaces
하나의 힐베르트 공간 내부에 또 다른 힐베르트 공간 구조를 정의하여 데이터의 계층적 특성이나 비선형성을 단계적으로 포착하는 구조이다.
지역별 프롬프트 제어
regional-prompter
이미지를 여러 영역으로 분할하고 각 영역에 서로 다른 프롬프트를 적용할 수 있게 해주는 확장 기능이다. 한 화면에 여러 캐릭터가 등장할 때 각 캐릭터의 특징이 섞이지 않도록 개별적으로 묘사하는 데 사용된다.
행위자 네트워크 이론
actor-network-theory
인간과 비인간(기술, 사물 등)이 동등한 행위 주체로서 복잡한 네트워크를 형성한다고 보는 이론이다. AI 시스템이 사회적 관계망 속에서 어떻게 상호작용하고 변화를 일으키는지 분석하는 데 사용된다.
이미지 프롬프트 어댑터
ip-adapter
텍스트 대신 이미지를 입력으로 사용하여 생성 모델의 스타일이나 구조를 제어하는 기술이다. 모델의 가중치를 직접 수정하지 않고도 특정 이미지의 특징을 효과적으로 반영할 수 있어 정교한 이미지 합성에 필수적이다.
계층적 디리클레 프로세스
hierarchical-dirichlet-process
여러 그룹의 데이터를 동시에 모델링할 때 그룹 간에 클러스터를 공유할 수 있게 해주는 베이지안 비모수 모델이다. 각 그룹은 자신만의 혼합 모델을 가지면서도 상위 프로세스를 통해 전체적인 클러스터 구성을 공유하여 정보 공유 효율을 높인다.
의존적 디리클레 프로세스
dependent-dirichlet-process
시간이나 공간, 혹은 특정 공변량의 변화에 따라 디리클레 프로세스의 분포가 부드럽게 변하도록 확장한 모델이다. 데이터의 분포가 외부 요인에 의존하는 상황을 모델링하는 데 사용되며 공변량 값에 따라 클러스터의 위치나 가중치가 달라질 수 있음을 표현한다.
대규모 다중작업 언어 이해
mmlu
언어 모델의 지식과 문제 해결 능력을 측정하기 위해 57개의 다양한 주제를 다루는 벤치마크이다. 모델의 전반적인 지능 수준을 평가하는 표준 지표로 활용된다.
비디오 인페인팅 및 제어 확장
vace
비디오 생성 시 특정 영역을 마스킹하거나 확장하여 일관성을 유지하고 세밀하게 제어하는 기술이다. 영상의 연속성을 확보하고 원치 않는 부분을 수정하는 데 필수적이다.
고고도 전자기 펄스
hemp-high-altitude-electromagnetic-pulse
대기권 밖 높은 고도에서 핵폭발이 일어날 때 발생하는 강력한 전자기 충격파이다. 지상의 전력망, 통신망, 컴퓨터 회로를 즉각적으로 파괴하거나 무력화할 수 있어 로그 AI의 물리적 기반을 타격하는 극단적 수단으로 논의된다.
고고도 전자기 펄스
hemp
대기권 밖 높은 고도에서 핵무기를 폭발시켜 발생하는 강력한 전자기파이다. 지상의 전자 기기와 컴퓨팅 인프라를 즉각적으로 무력화할 수 있어 물리적 AI 차단 수단으로 논의되지만 부수적 피해가 매우 크다.
낙관적 동시성 제어
optimistic-concurrency-control
데이터 수정 시 잠금(Lock)을 걸지 않고, 데이터를 업데이트할 때 처음 읽었던 시점과 비교하여 변경 여부를 확인하는 방식이다. 여러 에이전트가 동시에 작업할 때 발생하는 대기 시간을 줄여 전체 시스템의 처리량을 높이는 데 유용하다.
불균형 메모리 접근
numa
멀티 프로세서 환경에서 각 프로세서가 자신에게 물리적으로 가까운 메모리에 접근할 때 더 빠른 속도를 내는 메모리 설계 방식이다. AMD GPU의 NPS 모드에서 메모리 지역성을 최적화하는 데 사용된다.
시각적 피드백 루프
visual-feedback-loop
AI가 생성한 결과물을 시각적으로 확인하고 이를 바탕으로 다시 수정을 요청하는 반복 과정이다. UI/UX 디자인에서 정확도를 높이는 데 필수적이지만 데이터 처리량이 많다.
인류의 마지막 시험
humanitys-last-exam
인간 전문가 수준의 지식을 요구하는 매우 난이도 높은 AI 평가 데이터셋이다. LLM의 한계를 시험하고 범용 인공지능(AGI)에 얼마나 근접했는지 판단하는 척도로 쓰인다.
조절된 객관적 수축
orch-or
의식이 뇌 세포 내 미세소관에서 발생하는 양자 역학적 과정에서 비롯된다는 이론이다. 단순 계산이 아닌 물리적 현상으로서의 의식을 강조하며 AI의 의식 구현 가능성을 비판적으로 검토하는 근거가 된다.
조절된 객관적 환원
orchestrated-objective-reduction
뇌의 미세소관에서 일어나는 양자 역학적 과정이 의식을 생성한다는 이론이다. 로저 펜로즈와 스튜어트 하메로프가 제안했으며, 의식이 단순한 계산의 결과가 아님을 강조한다. AI가 진정한 의식을 가질 수 있는지 판단하는 과학적 근거로 활용된다.
커스텀 리소스 정의
crd
Kubernetes API를 확장하여 기본 리소스 외에 사용자 정의 객체를 생성하고 관리할 수 있게 해주는 기능입니다. PFN의 스케줄러 플러그인은 Throttle 설정 등을 관리하기 위해 자체적인 CRD를 정의하여 사용합니다.
탐색적 데이터 분석
eda
데이터의 주요 특성을 파악하기 위해 통계적 요약이나 시각화 기법을 사용하여 데이터를 조사하는 초기 분석 단계이다.
나이브 베이즈 분류기
naive-bayes-classifier
베이즈 정리를 기반으로 특징 간 독립을 가정하여 클래스를 분류하는 모델이다. 계산 효율성이 높아 대규모 데이터셋 처리에 유리하며 텍스트 분류의 기준점으로 활용된다.
세대별 가비지 컬렉션
generational-garbage-collection
객체의 생존 기간에 따라 세대를 나누어 관리하며 순환 참조를 찾아내기 위한 보조 시스템이다. 최근 생성된 객체가 가비지가 될 확률이 높다는 가설에 기반하여 효율을 높인다.
양방향 장단기 메모리
bilstm
RNN의 일종으로 시퀀스 데이터를 정방향과 역방향 모두에서 처리하여 문맥의 전후 관계를 동시에 파악하는 데 강점이 있는 구조이다.
전신성 홍반성 루푸스
systemic-lupus-erythematosus
면역계가 자신의 조직을 공격하는 만성 자가면역 질환으로, 피부, 관절, 신장 등 전신에 염증을 유발한다.
재구성 가능한 데이터플로우 유닛
rdu
SambaNova가 개발한 AI 가속기로, 소프트웨어적으로 하드웨어 구조를 최적화하여 데이터 흐름을 제어한다. 기존 GPU보다 메모리 효율이 높고 전력 소모가 적어 대규모 LLM 추론에 유리한 아키텍처를 제공한다.
조각별 코세라 세그먼트 모델
pcs-model
연속적인 소프트 로봇의 신체를 여러 개의 구획으로 나누어 각 부분의 굽힘, 비틀림 등 복잡한 변형 동역학을 정밀하게 계산하는 물리 모델이다.
쌍지연 결정적 정책 경사
td3
DDPG의 과대평가 문제를 해결하기 위해 두 개의 비평가자 네트워크를 사용하는 연속 제어 강화학습 알고리즘이다. 타겟 정책 평활화와 지연된 업데이트를 통해 학습의 안정성을 높이는 것이 특징이다.
확장된 버클리 패킷 필터
ebpf
운영체제 커널을 수정하지 않고도 커널 수준에서 프로그램을 실행하여 시스템 호출, 네트워크 트래픽 등을 모니터링할 수 있는 기술이다. 에이전트가 실행하는 하위 프로세스의 동작을 감시하는 데 사용된다.
소켓당 노드 수
nps
GPU 내의 메모리 도메인 분할 방식을 결정하는 설정으로, 메모리 로컬리티를 최적화하여 데이터 전송 효율을 높이는 데 사용된다.
가속기 복합 다이
xcd
AMD CDNA 아키텍처의 핵심 연산 유닛 칩렛이다. MI300X는 여러 개의 XCD를 조합하여 구성되며, 파티셔닝 시 이 XCD 단위로 연산 자원을 분할하여 할당한다.
강화된 가상 머신
hardened-vm
보안 취약점을 최소화하기 위해 불필요한 기능을 제거하고 설정을 최적화한 가상 실행 환경이다. 에이전트가 웹 브라우저를 제어할 때 발생할 수 있는 보안 위협이 호스트 시스템으로 전이되는 것을 방지한다.
경제적 기본 요소
economic-primitives
AI의 경제적 영향을 정량화하기 위해 앤스로픽이 정의한 5가지 핵심 지표(복잡성, 기술 수준, 목적, 자율성, 성공률)이다. 이를 통해 단순한 사용량을 넘어 실질적인 노동 가치 변화를 측정한다.
고용주 식별 번호
ein
미국 국세청(IRS)이 사업체에 부여하는 9자리의 고유 번호로 세금 보고와 은행 계좌 개설에 필수적이다. 과거에는 이 번호 발급까지 수개월이 걸렸으나 현재는 발급 전에도 결제를 수락할 수 있는 인프라가 구축되었다.
고차원 가법 모델
high-dimensional-additive-model
변수의 개수가 표본 크기보다 훨씬 많은 상황에서 각 변수의 효과를 개별 함수들의 합으로 표현하는 통계 모델이다. 복잡한 비선형 관계를 유연하게 모델링할 수 있어 고차원 데이터 분석에 널리 사용된다.
구조적 인과 모델
structural-causal-model
변수 간의 인과관계를 수학적 방정식과 그래프로 표현하는 프레임워크이다. 데이터 생성 과정을 명시적으로 모델링하여 개입의 효과를 예측하는 데 사용된다.
구조적 인과 모델
scm
변수 간의 인과 관계를 수학적 방정식과 그래프로 표현한 모델이다. 강화학습에서 환경의 역학을 단순한 확률 분포가 아닌 인과적 메커니즘으로 정의하여 데이터 효율성과 일반화 성능을 높이는 데 기여한다.
급격한 지능 폭발
hard-takeoff
AI가 스스로를 개선하는 능력을 갖추게 되면서 매우 짧은 시간 안에 인간의 통제를 벗어날 정도로 지능이 급격히 상승하는 시나리오이다. 이는 AI 안전성 연구에서 주요하게 다루는 위험 요소 중 하나이다.
노이즈 대조 추정
noise-contrastive-estimation
확률 모델의 파라미터를 추정할 때, 실제 데이터와 인위적으로 생성된 노이즈 데이터를 구별하는 이진 분류 문제를 풀어 밀도 함수를 학습하는 기법이다. 계산하기 어려운 정규화 상수를 직접 계산하지 않고도 모델을 학습할 수 있게 해준다.
단계별 권한 부여
step-up-authorization
사용자가 이미 인증된 상태에서 더 높은 보안 수준이나 추가적인 권한이 필요한 작업을 수행하려 할 때, 추가적인 인증이나 동의를 요구하는 방식이다. MCP에서는 특정 도구 실행에 필요한 스코프가 부족할 때 이를 동적으로 요청하는 데 사용된다.
단백질 구조 예측
protein-structure-prediction
단백질의 아미노산 서열 정보를 바탕으로 그 단백질이 접히는 3차원 형태를 알아내는 과정이다. 단백질의 기능은 그 구조에 의해 결정되므로 질병 치료나 생물학적 이해에 매우 중요하다.
단백질 구조 예측
protein-folding
단백질의 아미노산 서열로부터 3차원 입체 구조를 예측하는 생물학적 난제이다. 질병의 원인 파악과 신약 개발의 핵심이며, AlphaFold와 같은 AI가 이를 해결하며 과학적 혁신을 주도하고 있다.
달러당 성능 효율
performance-per-dollar
투입된 비용 대비 모델이 보여주는 성능의 비율을 의미한다. 모델의 파라미터 수를 무작정 늘리기보다, 적은 비용으로 높은 추론 능력을 구현하는 것이 현재 AI 업계의 핵심 경쟁 지표가 되고 있다.
데이터 품질 보증
data-quality-assurance
AI 학습 데이터의 정확도와 신뢰성을 검증하는 과정이다. 자율주행과 같이 안전이 직결된 분야에서 모델의 오류를 줄이고 성능을 보장하기 위해 필수적이다.
도메인 특화 언어
dsl
특정 도메인의 문제를 해결하기 위해 설계된 프로그래밍 언어이다. Shrew에서는 딥러닝 모델 구조를 정의하는 데 사용되며, 이를 통해 파이썬이나 러스트 같은 특정 언어에 종속되지 않는 모델 선언이 가능하다.
디버그 무한 루프
debug-death-loop
AI가 코드를 수정했으나 새로운 오류가 발생하고, 이를 다시 수정하는 과정에서 원래의 오류나 또 다른 오류가 반복적으로 발생하는 현상이다. 이는 토큰 소모를 극심하게 늘리고 개발자의 생산성을 저하시키는 주요 원인이 된다.
디지털 붉은 여왕
digital-red-queen
진화 생물학의 붉은 여왕 가설을 AI에 적용한 것으로, 경쟁 상대가 계속 진화함에 따라 자신도 멈추지 않고 진화해야만 생존할 수 있는 적대적 진화 상태를 의미한다.
라스트 마일 배송
last-mile-delivery
물류 센터에서 최종 소비자에게 상품이 전달되는 마지막 구간을 의미한다. 드론과 같은 자율 주행 기술을 활용하여 배송 속도를 높이고 비용을 절감하는 것이 핵심이며, 소매업의 물류 경쟁력을 결정짓는 중요한 요소이다.
리스크 점수 산정
risk-scoring
AI를 사용하여 거래 데이터와 사용자 행동을 분석하고 사기나 부도 가능성을 수치화하는 기술이다. Stripe는 1.4조 달러 이상의 데이터를 학습한 모델을 제공한다. 플랫폼 운영자가 위험한 거래를 사전에 차단하거나 자금을 유보하는 의사결정의 핵심 근거가 된다.
메모리 부족 오류
oom
'Out of Memory'의 약자로, 할당된 메모리보다 더 많은 데이터를 처리하려 할 때 프로그램이 강제 종료되는 현상이다. AI 이미지 생성 시 고해상도 설정이나 큰 모델을 쓸 때 자주 발생한다.
모멘트 기반 투영
moment-based-projection
데이터의 통계적 특성인 모멘트(평균, 분산 등)를 특정 방향으로 투영하여 차원을 축소하거나 특징을 추출하는 기법이다. 고차원 데이터에서 변화를 감지하기 위해 복잡한 데이터를 다루기 쉬운 저차원 지표로 변환하는 데 사용된다.
무작위 대조 시험
randomized-controlled-trial
대상자를 무작위로 실험군과 대조군으로 나누어 처치의 효과를 비교하는 방법으로, 인과 관계를 입증하는 가장 강력한 표준 기법으로 간주된다.
무작위 대조 실험
randomized-control-trial
실험 대상자를 무작위로 실험군과 대조군으로 나누어 특정 처치의 효과를 측정하는 방법입니다. 이 아티클에서는 금융 지원의 순수한 효과를 파악하기 위해 사용되었으며, 외부 요인을 통제하여 인과 관계를 명확히 규명하는 데 핵심적인 역할을 합니다.
미생물 암흑 물질
microbial-dark-matter
존재는 알려져 있으나 실험실에서 배양하거나 특성을 규명하지 못한 미생물 유전체 자원을 의미한다. 지구 생태계의 대다수를 차지하며 잠재적 가치가 매우 크다.
비동기 우선 설계
async-first
프로그램의 실행이 입출력 작업 등으로 인해 멈추지 않도록 비동기 프로그래밍 모델을 기본으로 채택한 방식이다. 다수의 에이전트가 동시에 작업을 수행해야 하는 환경에서 성능 효율을 극대화한다.
비디오 생성 모델
video-generation-model
텍스트나 이미지를 입력받아 움직이는 영상을 만들어내는 AI 모델로, Wan 2.1은 최근 주목받는 오픈소스 비디오 생성 모델 중 하나이다.
비음수 직교 제약
nonnegative-orthogonality-constraints
변수가 0 이상의 값을 가지면서 서로 수직인 상태를 유지하도록 강제하는 조건으로, 데이터의 부분 공간 구조를 명확히 하고 해석력을 높이는 데 사용된다.
비지도 특성 선택
unsupervised-feature-selection
레이블이 없는 데이터에서 가장 중요한 변수들을 골라내는 기법으로, 데이터의 내재된 구조를 유지하면서 차원을 축소하는 핵심 단계이다.
세밀한 어린 시절
nuanced-childhood
디지털 기기를 무조건 금지하거나 무분별하게 허용하는 양극단에서 벗어나, 기술을 창의적 도구로 균형 있게 활용하는 교육 방식이다. AI와 컴퓨터를 생산적인 학습 파트너로 삼는 것이 특징이다.
숨겨진 혼란 변수
hidden-confounding
모델에 포함되지 않았지만 원인 변수와 결과 변수 모두에 영향을 미치는 관찰되지 않은 변수이다. 이를 방치하면 변수 간의 상관관계가 인과관계로 오인되어 잘못된 예측을 유발하며, 특히 데이터 분포가 바뀔 때 모델 성능을 급격히 저하시킨다.
신경망 처리 장치
npu
AI 및 머신러닝 연산 처리에 특화된 전용 하드웨어 가속기이다. CPU나 GPU보다 전력 효율이 높고 딥러닝에 필요한 병렬 연산을 빠르게 수행할 수 있도록 설계되어 모바일 기기에서 실시간 AI 기능을 구현할 때 핵심적인 역할을 한다.
실시간 장애 탐지
rtfd
시스템이 실행되는 동안 이상 징후나 잠재적 실패를 즉각적으로 감시하고 대응하는 체계이다. 에이전트의 실행 궤적에서 비정상적인 패턴을 탐지하거나 인간 검토자가 개입해야 할 시점을 실시간으로 판단하는 데 사용된다.
양자화 인식 학습
qat
모델을 낮은 비트로 변환할 때 발생하는 정확도 손실을 학습 과정에서 보정하는 기법이다. 모델 경량화와 성능 유지 사이의 균형을 맞추는 데 필수적이다.
양자화 인식 학습
quantization-aware-training
모델을 낮은 정밀도(예: int8)로 변환할 때 발생하는 성능 저하를 최소화하기 위해, 학습 단계에서 양자화 오차를 미리 반영하여 학습하는 기법이다.
에너지 기반 모델
ebm
데이터 포인트 간의 의존성을 에너지 함수로 정의하고, 에너지가 낮은 상태를 가장 가능성 높은 상태로 간주하여 학습하는 모델이다. 확률 밀도 함수를 직접 계산하지 않아도 되므로 복잡한 구조의 데이터를 다루기에 유리하며, LLM의 확률적 생성 한계를 극복할 대안으로 주목받고 있다.
유전체 연관 분석
gwas
특정 질환이나 형질과 관련된 유전적 변이를 찾기 위해 대규모 인구의 유전체를 스캔하는 연구 방법이다. 수백만 개의 유전 변이를 통계적으로 분석하여 특정 질병과의 상관관계를 밝혀내는 데 사용된다.
이미지 생성 모델
image-generation-model
텍스트 설명을 입력받아 그에 부합하는 시각적 이미지를 만들어내는 인공지능 모델이다. 확산 모델(Diffusion Model) 등의 기술을 기반으로 하며, 최근에는 생성 속도와 해상도, 텍스트 이해도가 비약적으로 발전하고 있다.
이질적 보조 정보
heterogeneous-auxiliary-information
서로 다른 연구 환경, 데이터 수집 방식 또는 프라이버시 제약 조건 하에서 생성된 다양한 형태의 외부 데이터나 요약 통계치를 의미한다.
이질적 처치 효과
heterogeneous-treatment-effects
동일한 처치라도 개별 유닛의 특성에 따라 효과가 다르게 나타나는 현상을 의미한다. 전체 평균 효과가 아닌 특정 집단별 효과를 파악하는 것이 핵심이다.
재귀적 언어 모델
recursive-language-model
모델의 층(layer)을 고정된 파라미터로 여러 번 반복하여 사용하는 언어 모델 구조이다. 파라미터 효율성을 극대화할 수 있으나 학습 안정성과 연산 효율성 확보가 핵심 과제이다.
재귀적 자기 개선
recursive-self-improvement
AI가 자신의 코드를 직접 수정하거나 더 나은 데이터를 생성하여 스스로의 성능을 향상시키는 과정이다. 지능 폭발(Intelligence Explosion)의 핵심 기제로 논의되는 개념이다.
저차원 텐서 추정
low-rank-tensor-estimation
고차원 데이터 배열인 텐서에서 핵심적인 정보만을 담고 있는 낮은 차원의 구조를 찾아내어 원래 데이터를 복원하거나 예측하는 기법이다. 데이터 압축 및 노이즈 제거에 필수적이다.
지능형 문서 처리
idp
AI를 활용해 문서의 텍스트뿐만 아니라 구조와 의미를 파악하여 데이터를 자동 추출하는 기술이다. 단순 OCR보다 고도화된 문맥 이해가 핵심이다.
지향성 경계 상자
obb
객체의 방향에 맞춰 회전된 사각형 박스로 영역을 지정하는 기법이다. 일반적인 수평/수직 박스보다 기타 지판처럼 기울어진 객체를 정밀하게 포착하는 데 유리하며, 객체의 각도 정보를 포함한다.
침묵의 상태 오염
silent-state-corruption
AI 에이전트가 특정 작업을 성공적으로 수행했다고 판단하지만, 실제 웹 환경이나 데이터베이스에는 해당 변경 사항이 반영되지 않아 인지 상태와 실제 상태가 불일치하는 현상이다. 에러 메시지 없이 발생하므로 감지가 매우 어렵고 시스템의 신뢰성을 떨어뜨린다.
키워드 전용 인자
keyword-only-arguments
함수 호출 시 인자의 이름을 반드시 명시해야 하는 방식으로, 인자의 순서가 바뀌어 발생하는 실수를 방지하고 코드의 가독성을 높이는 파이썬의 기능이다.
테스트 시간 연산
test-time-compute
모델이 답변을 생성하는 추론 시점에 추가적인 연산 자원을 투입하여 결과의 정확도를 높이는 기법이다. 단순히 학습된 지식에 의존하지 않고 추론 과정에서 더 깊이 생각하게 함으로써 모델 성능을 비약적으로 향상시킨다.
테스트 시간 증강
test-time-augmentation
추론 시점에 입력 데이터의 여러 증강 버전을 만들어 각각 예측한 뒤 그 결과를 평균 내어 성능을 높이는 기법이다. 모델을 재학습하지 않고도 정확도를 개선할 수 있다.
텍스트 음성 변환
tts
텍스트 입력을 인공적인 음성으로 변환하여 출력하는 기술이다. 최근 AI 기술의 발전으로 과거의 기계적인 소리에서 벗어나 실제 인간과 구별하기 힘든 자연스러운 음성 생성이 가능해졌다.
특징별 선형 변조
film
네트워크의 중간 특징 맵에 아핀 변환을 적용하여 외부 조건 정보를 주입하는 조건화 기법이다. 학습 가능한 파라미터를 통해 특징의 스케일과 시프트를 조절함으로써 장르나 스타일 같은 메타데이터를 효과적으로 반영한다.
파레토 최적 전선
pareto-frontier
여러 목표가 상충할 때 한 목표를 희생하지 않고는 다른 목표를 개선할 수 없는 최적의 상태들의 집합이다. 이 아티클에서는 AI 모델의 품질, 비용, 속도 사이의 최상의 균형점을 의미한다.
확실성 등가 제어
certainty-equivalent-control
시스템의 불확실한 파라미터를 추정치로 대체하여 마치 그 값이 확실한 것처럼 간주하고 제어 법칙을 설계하는 방식이다. 구현이 간단하지만 모델 오차나 예상치 못한 노이즈에 취약할 수 있다는 단점이 있다.
과학적 발견 자동화
automated-scientific-discovery
인공지능을 활용하여 가설 설정, 실험 수행, 결과 분석 등 과학적 탐구 과정을 자동화하는 기술이다. Sakana AI의 'AI Scientist' 프로젝트가 대표적인 사례로, 연구자의 개입을 최소화하면서 새로운 과학적 통찰을 도출하는 것을 목표로 한다. 이는 연구 개발의 속도를 획기적으로 높일 수 있는 미래 지향적 기술이다.
데이터 강화 노동자
data-enrichment-worker
AI 모델의 정확도를 높이기 위해 데이터를 분류하고 라벨링하며 검증하는 필수적인 역할을 수행하는 인력이다. 흔히 '숨겨진 노동'으로 불리며, 이들의 권익 보호와 적절한 보상은 책임감 있는 AI 생태계 구축의 핵심적인 윤리적 과제이다.
딥시크 희소 어텐션
dsa
라이트닝 인덱서를 통해 쿼리 토큰이 참조할 과거 토큰을 동적으로 선택하여 긴 문맥에서도 연산 효율을 선형적으로 유지하는 기술이다.
라데온 오픈 컴퓨팅
rocm
AMD의 오픈소스 GPU 컴퓨팅 플랫폼으로, NVIDIA의 CUDA에 대응하여 딥러닝 프레임워크를 AMD 하드웨어에서 실행할 수 있게 지원하는 소프트웨어 스택이다.
바이트 페어 인코딩
bpe
가장 빈번하게 등장하는 문자 쌍을 반복적으로 병합하여 토큰을 생성하는 서브워드 토큰화 알고리즘이다. 어휘 사전 크기를 효율적으로 관리하면서도 미등록 단어 문제를 해결하는 데 널리 사용되는 표준 기술이다.
반응성 수송 모델링
reactive-transport-modeling
지하 매질 내에서 유체의 흐름, 용질의 이동, 그리고 그 과정에서 발생하는 화학 반응을 동시에 시뮬레이션하는 기법이다. 핵폐기물 저장소에서 방사성 핵종이 암석이나 토양을 통해 어떻게 확산되는지 예측하는 데 사용된다.
비동의 성적 이미지
ncii
당사자의 동의 없이 유포되거나 생성된 성적인 콘텐츠를 의미한다. AI 도구가 이러한 콘텐츠를 생성하는 데 악용되면서 글로벌 규제 기관의 집중 감시 대상이 되고 있다.
사용자 생성 콘텐츠
ugc
User Generated Content의 약자로, 서비스 제공자가 아닌 일반 사용자가 직접 제작한 콘텐츠를 의미한다. 사용자가 직접 AI 스토리를 만들고 공유함으로써 플랫폼 생태계를 활성화하는 핵심 요소이다.
생성적 적대 신경망
gan
두 개의 신경망이 서로 경쟁하며 성능을 개선하는 구조로, 여기서는 모델 간 상호 검증 워크플로우를 의미한다.
시간적 객체 영속성
temporal-object-permanence
객체가 다른 물체에 가려져 일시적으로 보이지 않더라도 시간이 지나도 동일한 객체로 인식하고 추적하는 능력이다. 자율주행 모델이 연속적인 프레임 사이에서 객체의 존재를 일관되게 파악하는 데 핵심적인 기술이다.
원자력 위험 분류기
nuclear-risk-classifier
원자력 기술 관련 데이터에서 잠재적인 보안 위험이나 위협 요소를 자동으로 식별하고 분류하기 위해 Anthropic과 미국 국가핵안보국이 공동 개발한 특화 AI 모델이다.
확률적 경사 하강법
stochastic-gradient-descent
데이터의 일부(미니배치)만을 사용하여 경사도를 계산하고 파라미터를 업데이트하는 최적화 알고리즘이다. 전체 데이터를 사용하는 것보다 계산 비용이 적고 지역 최솟값을 탈출하는 데 유리하여 딥러닝 학습의 핵심 기술로 사용된다.
개발자 도구 프로토콜
devtools-protocol
브라우저를 원격으로 제어하고 검사할 수 있게 해주는 인터페이스이다. 에이전트가 실제 웹 브라우저를 조작하여 데이터를 수집하거나 웹 앱을 테스트하는 데 사용된다.
도메인 특화 에이전트
domain-specific-agent
특정 산업이나 전문 분야의 용어, 프로세스, 데이터를 깊이 있게 이해하고 해당 분야의 복잡한 업무를 자율적으로 수행하는 AI 시스템이다.
분류기 없는 가이던스
cfg
학습 시 조건부와 무조건부 모델을 동시에 학습시킨 후, 추론 시 두 결과의 차이를 이용해 조건의 영향력을 조절하는 기법이다. 별도의 분류기 모델 없이도 생성 결과의 품질과 조건 일치도를 크게 향상시킬 수 있다.
메시지 전달 인터페이스
mpi
분산 메모리 시스템에서 병렬 컴퓨팅을 위해 프로세스 간 메시지를 주고받는 표준 규격이다. 대규모 AI 모델 학습이나 기상 예측과 같은 고성능 연산 작업에서 노드 간 데이터 동기화에 필수적이다.
상보성 금속 산화물 반도체
cmos
현대 마이크로칩 제조의 표준 공정이다. 높은 집적도와 낮은 전력 소모가 특징이며, 대량 생산에 최적화되어 있어 양자 칩의 상용화 가능성을 높여준다.
활성화 기반 가중치 양자화
awq
Activation-aware Weight Quantization의 약자로, 모델 실행 시 활성화 값이 큰 중요한 가중치를 보존하며 양자화하는 기법이다. 일반적인 양자화보다 모델의 추론 성능 손실이 적은 것이 특징이다.
그래프 검색 증강 생성
graphrag
기존의 단순 문서 검색(RAG)에 그래프 데이터베이스를 결합하여 데이터 간의 복잡한 관계와 연결성을 파악하며 답변을 생성하는 기법이다. 개체 간의 관계 추론이 필요한 지식 집약적 작업에 매우 효과적이다.
그래프 검색 증강 생성
graph-rag
그래프 데이터베이스와 RAG를 결합하여 데이터 간의 복잡한 관계를 기반으로 정보를 검색하는 기술이다. 단순 키워드 검색보다 맥락과 관계를 더 잘 파악할 수 있어 추천 시스템의 정확도를 높이는 데 중요하다.
책임감 있는 확장 정책
responsible-scaling-policy
AI 모델의 능력이 향상됨에 따라 발생할 수 있는 극단적인 위험을 관리하기 위해 Anthropic이 자발적으로 도입한 안전 프로토콜이다. 특정 위험 임계값에 도달할 경우 필요한 안전 조치를 사전에 정의한다.
콘텐츠 주소 지정 저장소
content-addressed-storage
파일의 이름이나 경로가 아닌 파일 내용의 해시값(ETag 등)을 기준으로 데이터를 저장하고 식별하는 방식이다. 동일한 내용의 파일이 여러 곳에서 참조되더라도 물리적으로는 한 번만 저장되므로 저장 공간을 획기적으로 절약할 수 있다. Hugging Face Hub의 캐시 시스템이 이 방식을 사용하여 효율성을 극대화한다.
대학원 수준 전문 지식 벤치마크
gpqa
생물학, 물리학, 화학 등 과학 분야의 매우 어려운 객관식 문제들로 구성된 데이터셋이다. 전문가들도 풀기 힘든 문제들을 통해 모델의 고도화된 추론 능력을 평가한다.
지속적 통합 및 배포
ci-cd
코드 변경 사항을 자동으로 테스트하고 배포하는 소프트웨어 개발 방법론이다. AI 모델 개발에서는 모델 성능 검증을 자동화하는 데 활용된다.
컴퓨터 비전 및 패턴 인식 컨퍼런스
cvpr
컴퓨터 비전 분야에서 가장 영향력 있는 국제 학술 대회로, 매년 최신 시각 지능 연구 결과가 발표되는 장이다. 채택된 논문은 해당 분야의 기술적 표준으로 자리 잡는 경우가 많아 연구자들에게 매우 중요한 이정표가 된다.
콘텐츠 공개/공시
content-disclosure
특정 미디어나 정보가 AI에 의해 생성되거나 수정되었음을 사용자에게 명확히 알리는 행위이다. 워터마크, 라벨링, 메타데이터 삽입 등의 방식을 통해 정보의 출처를 투명하게 밝힘으로써 온라인상의 신뢰도를 높이고 허위 정보의 영향을 최소화한다.
복소수 값 신경망
complex-valued-neural-network
실수 대신 복소수를 가중치와 활성화 함수에 사용하는 신경망이다. 위상과 진폭 정보를 동시에 처리할 수 있어 음향이나 전자기파와 같은 파동 형태의 데이터를 다루는 데 탁월한 성능을 보인다.
이미지 투 비디오
i2v
정지 영상을 입력으로 받아 움직이는 비디오를 생성하는 기술로, 텍스트만 사용하는 것보다 구도와 캐릭터의 일관성을 유지하는 데 유리하다.
이미지 투 이미지
img2img
텍스트 프롬프트뿐만 아니라 원본 이미지를 입력으로 사용하여, 기존 이미지의 구도나 색감을 유지하면서 새로운 스타일이나 요소를 추가하는 기법이다.
이미지 투 이미지
image-to-image
기존 이미지를 입력으로 사용해 새로운 이미지를 생성하는 기법이다. 원본의 형태나 구도를 유지하면서 스타일, 색상, 디테일만을 AI로 변환할 때 핵심적으로 활용된다.
작업자 간 일치도
inter-annotator-agreement
여러 작업자가 동일한 데이터에 대해 얼마나 일관되게 주석을 달았는지 측정하는 지표로, 데이터셋의 객관성과 신뢰성을 보장하는 핵심 요소이다.
프리필 및 디코딩
pre-fill-and-decoding
대규모 언어 모델 추론의 두 가지 주요 단계이다. 프리필은 입력 텍스트를 처리하고 디코딩은 결과 토큰을 생성하는 과정으로, 각 단계에 최적화된 하드웨어를 배치하여 전체 효율을 높인다.
리액트 웹 애플리케이션
react-web-app
React 프레임워크로 구축된 동적 웹 사이트로, 페이지 전체를 새로고침하지 않고 데이터를 업데이트한다. 일반적인 정적 스크래핑 방식으로는 데이터를 가져오기 어려워 브라우저 렌더링 엔진을 활용한 접근이 필요하다.
교집합 대 합집합 비율
iou
예측된 경계 상자와 실제 정답 상자가 겹치는 영역의 비율을 나타내는 지표이다. 모델의 위치 예측 정확도를 평가하거나 NMS 과정에서 중복 여부를 판단하는 기준으로 사용된다.
동역학 및 제어를 위한 학습
l4dc
머신러닝과 제어 이론의 교차점을 다루는 학술 커뮤니티 및 컨퍼런스이다. 데이터 기반의 학습 기법을 물리적 시스템의 동역학 제어에 안전하게 적용하는 방법을 연구하며, 두 분야의 시너지를 목표로 한다.
미검출 (위음성)
false-negative
실제로는 결함이 존재함에도 불구하고 시스템이 이를 정상으로 판단하여 감지하지 못한 상태이다. 품질 관리에서는 불량품이 출고되는 직접적인 원인이 된다.
퀄리아 (감각질)
qualia
주관적인 감각 경험을 뜻하며 고통이나 색깔의 느낌처럼 언어로 완전히 설명할 수 없는 의식의 질적인 측면을 의미한다. AI가 인간과 같은 주관적 느낌을 갖는지 논의할 때 핵심이 된다.
플래너-엑세큐터
planner-executor
에이전트가 작업을 수행하기 전 계획을 세우는 단계와 이를 실행하는 단계를 분리하는 설계 방식이다. 복잡한 문제를 작은 단위로 나누어 처리함으로써 전체적인 작업 성공률을 높인다.
플래너-엑세큐터 패턴
planner-executor-pattern
전체 실행 계획을 세우는 에이전트와 각 단계를 실제로 실행하는 에이전트를 분리하는 설계 방식이다. 역할 분담을 통해 복잡한 작업의 정확도를 높이고 오류 발생 시 복구 능력을 강화한다.
평가자-최적화 도구
evaluator-optimizer
생성된 결과물을 비판적으로 검토하고 개선안을 제시하여 품질을 높이는 반복 루프 구조이다. 모델 간의 상호작용을 통해 답변의 신뢰성을 검증하고 사용자 요구사항에 최적화된 최종 결과물을 도출한다.
정밀도-재현율 곡선 아래 면적
pr-auc
정밀도(Precision)와 재현율(Recall)의 관계를 나타내는 곡선 아래의 면적이다. 데이터가 불균형할 때 모델의 성능을 ROC AUC보다 더 엄격하고 정확하게 평가할 수 있어 추천 시스템에서 널리 쓰인다.
창업자-시장 적합성
founder-market-fit
창업자의 전문 지식과 경험이 선택한 사업 분야와 얼마나 일치하는지를 의미한다. 이는 투자자들이 사업의 성공 가능성을 판단할 때 가장 중요하게 고려하는 요소 중 하나다.
샤르코-마리-투스병
cmt-disease
유전적 요인으로 인해 말초 신경이 손상되어 근육 위축과 감각 소실을 일으키는 희귀 질환이다. 현재 근본적인 치료제가 부족하여 미충족 의료 수요가 매우 높다. RTX-117과 같은 혁신 신약의 주요 타겟이 된다.
휘발성/단기수명
ephemeral
영구적이지 않고 필요에 따라 생성되었다가 작업 완료 후 삭제되는 자원의 특성을 의미한다. AI 개발 세션은 전형적인 휘발성 워크로드로 동적인 관리가 필요하다.
달리 인
dolly-in
카메라를 피사체 방향으로 물리적으로 전진시키는 이동 기법이다. 줌 인과 달리 배경의 원근감이 변하는 특징이 있다.
뎁스 맵
depth-map
이미지의 각 픽셀이 카메라로부터 떨어진 거리 정보를 담은 흑백 지도이다. 캐릭터와 배경 간의 공간적 입체감을 부여하거나 피사계 심도를 조절하여 합성의 완성도를 높이는 데 사용된다.
모델 주
model-zoo
특정 프레임워크에서 미리 학습된 다양한 딥러닝 모델들의 저장소이다. 사용자는 처음부터 학습할 필요 없이 검증된 성능의 모델 가중치를 다운로드하여 자신의 데이터에 맞게 파인튜닝할 수 있다.
조건 수
condition-number
행렬이나 텐서의 입력 변화에 대한 출력 변화의 민감도를 나타내는 수치로 이 값이 클수록 최적화 알고리즘의 수렴 속도가 느려지는 경향이 있다.
코어 워
core-war
1984년에 발표된 프로그래밍 게임으로 가상 컴퓨터의 메모리 내에서 워리어 프로그램들이 서로를 파괴하고 생존하기 위해 경쟁하는 환경이다. 튜링 완전한 특성을 가지며 사이버 보안 및 진화 연산 연구에 활용된다.
가법 모델
additive-model
여러 독립 변수의 함수들의 합으로 종속 변수를 설명하는 통계 모델로, 각 변수가 결과에 미치는 비선형적인 영향을 개별적으로 포착할 수 있는 유연한 구조를 가진다.
가상 환경
virtual-environment
하나의 시스템 내에서 프로젝트별로 독립된 파이썬 실행 환경을 격리하여 관리하는 기술이다. 서로 다른 프로젝트가 요구하는 라이브러리 버전 충돌을 방지하기 위해 필수적으로 사용된다.
가상 환경
venv
파이썬 프로젝트별로 독립된 라이브러리 실행 환경을 구축하여 버전 충돌을 방지하는 기술로, AI 도구 설치 시 필수적으로 사용된다.
가설 생성
hypothesis-generation
문제의 원인에 대해 가능성 있는 여러 시나리오를 미리 설정하는 과정이다. 디버깅 시 무작위로 코드를 수정하는 대신 체계적인 접근을 가능하게 하여 해결 시간을 단축시킨다.
가치 정렬
value-alignment
AI 시스템의 목표와 행동이 인간의 가치, 윤리, 의도와 일치하도록 설계하는 기술적 및 철학적 과정이다. 모델이 의도하지 않은 해로운 행동을 하지 않도록 제어하는 것이 핵심이다.
간격 반복
spaced-repetition
망각 곡선을 고려하여 학습 내용을 특정 시간 간격으로 복습함으로써 장기 기억으로 전환하는 학습 원리다. Anki와 같은 플래시카드 도구가 이 원리를 활용한다.
감사 로그
audit-log
시스템 내에서 발생한 모든 활동과 의사결정 과정을 시간 순서대로 기록한 데이터이다. 보안 사고 분석, 규제 준수 확인, 에이전트의 오작동 원인 파악을 위해 필수적으로 요구된다.
감사 추적
audit-trail
시스템 내에서 발생한 모든 활동과 데이터 변경 이력을 시간 순서대로 기록한 로그로, 법적 분쟁 시 책임 소재를 규명하고 규제 준수를 증명하는 데 사용된다.
감성 분석
sentiment-analysis
텍스트에 나타난 작성자의 주관적인 감정이나 태도를 파악하여 긍정, 부정, 중립 등으로 분류하는 기술이다. 영화 리뷰에서 유머러스한 정도를 수치화하는 작업의 근간이 된다.
개념 증명
poc
새로운 아이디어나 기술이 실제로 구현 가능한지 확인하기 위해 제작하는 초기 단계의 모델이다. 상용화 수준은 아니지만 핵심 원리의 타당성을 입증하는 데 목적이 있다.
객체 추적
object-tracking
비디오 시퀀스 내에서 특정 객체의 위치 변화를 시간에 따라 추적하는 기술이다. 데이터 라벨링에서는 이전 프레임의 정보를 다음 프레임으로 전파하여 작업 효율을 높이는 데 사용된다.
객체 탐지
object-detection
이미지나 영상 내에서 특정 사물의 위치를 사각형(Bounding Box)으로 식별하고 해당 사물이 무엇인지 분류하는 컴퓨터 비전 기술이다. 이 프로젝트에서는 선반 위의 제품과 가격표를 각각 찾아내는 데 사용된다.
거리 변환
distance-transform
이진 이미지에서 각 픽셀로부터 가장 가까운 배경 픽셀까지의 거리를 계산하는 기법이다. 객체의 가장 깊은 안쪽 지점을 찾아 중심점을 결정할 때 주로 사용된다.
거부 절제
refusal-ablation
모델이 특정 요청을 거부하게 만드는 내부 활성화 성분을 식별하여 제거하거나 무력화하는 기법이다. 가중치 행렬에서 거부 반응과 관련된 방향성을 찾아 이를 투영 등의 방식으로 제거한다. 모델의 안전 가드레일을 아키텍처 수준에서 영구적으로 변형한다는 점에서 중요하다.
검색 왜곡
retrieval-distortion
RAG 시스템에서 중복되거나 파편화된 데이터가 검색 결과에 포함되어 모델이 혼란을 겪는 현상이다. 동일한 내용이 여러 문서에 흩어져 있으면 가장 관련성 높은 정보를 선별하기 어려워진다.
검열 우회
censorship-bypass
모델에 설정된 안전 가이드라인이나 금지어 필터링을 특정 기법으로 무력화하는 행위이다. 이번 사례에서는 페르소나 설정이 보안 취약점으로 작용할 수 있음을 보여주었으며 이는 모델 정렬 과정의 허점을 드러내는 지표가 된다.
검증 루프
verification-loop
AI가 생성한 결과물을 스스로 테스트하거나 실행하여 오류를 확인하고, 성공할 때까지 반복적으로 수정하는 프로세스이다.
검증 손실
validation-loss
학습 과정에서 사용되지 않은 별도의 데이터셋에 대해 모델이 예측한 값과 실제 값 사이의 오차를 측정한 값이다. 모델이 새로운 데이터에 대해 얼마나 잘 일반화되었는지 판단하는 지표로 활용된다. 일반적으로 훈련 손실보다 약간 높은 것이 정상이다.
경고 분류
alert-triage
보안 시스템에서 발생하는 수많은 알림 중 실제 위협과 오탐지를 구분하여 우선순위를 정하는 과정이다. AI 에이전트가 이 과정을 자동화하면 보안 분석가의 피로도를 줄이고 실제 위협에 대한 대응 속도를 높일 수 있다.
경로 계획
path-planning
로봇이 장애물을 피하며 목표 지점까지 이동하기 위한 최적의 궤적을 계산하는 알고리즘이다. 자동화된 조립을 위해 로봇 팔의 움직임을 정밀하게 제어하는 핵심 기술이다.
경쟁 상태
race-condition
여러 프로세스나 스레드가 공유 자원에 동시에 접근할 때, 실행 순서에 따라 결과값이 달라지는 현상이다. 비동기 작업이 많은 환경에서 예측 불가능한 버그를 유발하는 주요 원인이 된다.
계획 모드
plan-mode
코드를 직접 수정하기 전 에이전트가 작업 범위를 조사하고 단계별 구현 계획을 세우는 단계이다. 개발자가 에이전트의 의도를 미리 검토하고 수정할 수 있게 하여 잘못된 방향으로의 코드 생성을 방지한다.
계획 수립
planning
복잡한 목표를 달성하기 위해 이를 작은 하위 작업들로 분해하고 실행 순서를 결정하는 에이전트의 사고 과정이다. Chain-of-Thought와 같은 기법을 활용하여 논리적 단계를 밟아 나가는 능력을 의미한다.
고장 모드
failure-mode
시스템이나 구성 요소가 의도한 기능을 수행하지 못하는 구체적인 방식이나 형태를 의미하며, 진단 및 예방 정비의 기초가 된다.
공간 기억
spatial-memory
주변 환경의 구조와 사물의 위치 정보를 시스템 내부에 저장하고 인출하는 능력이다. 로봇 에이전트가 단기적인 명령 수행을 넘어 장기적인 목표를 설정하고 환경 변화에 대응하는 데 핵심적인 역할을 한다.
공간 인식
spatial-awareness
이미지 내 객체들 사이의 거리, 방향, 상호 배치 관계를 이해하는 능력이다. 로봇의 이동이나 물체 조작, 제조 공정의 정렬 상태 확인 등에 매우 중요한 요소이다.
공동 번영
shared-prosperity
AI 기술의 혜택이 특정 자본가나 기업에 집중되지 않고 노동자와 사회 전체에 고르게 분배되는 경제적 개념이다.
공유 상태
shared-state
여러 독립적인 프로세스나 에이전트가 동시에 접근하여 읽고 쓸 수 있는 공통의 데이터 저장소이다. 이 글에서는 state.json 파일을 통해 에이전트들이 작업 현황과 결과를 공유하는 매개체로 활용된다.
관심 영역
roi
이미지 내에서 분석하고자 하는 특정 부분이다. 손바닥 인식에서는 전체 손 이미지에서 손바닥 부분만을 정확히 잘라내는 것이 모델 성능에 결정적인 영향을 미친다.
관측 공간
observation-space
에이전트가 환경으로부터 매 단계마다 수신하는 모든 정보의 집합이다. 이 정보가 불완전하거나 마스킹되면 에이전트가 최적의 결정을 내리는 데 방해가 된다.
교란 변수
confounds
원인과 결과 모두에 영향을 주어 인과 관계 파악을 방해하는 제3의 변수입니다. 예를 들어 기업의 기존 신용도는 금융 지원 수혜 여부와 매출 성장 모두에 영향을 줄 수 있는 교란 변수이며, 이를 통제해야 정확한 분석이 가능합니다.
교차 검증
cross-validation
하나의 정보원이나 모델이 내놓은 결과가 맞는지 다른 데이터나 지식을 활용해 확인하는 과정이다. 본문에서는 AI가 생성한 퀴즈 정답의 오류 가능성을 사용자가 직접 원문과 대조하며 확인하는 능동적 학습 과정을 의미한다.
국가 지분
sovereign-equity
국가가 핵심 자동화 인프라의 주주로서 참여하여 그 수익을 국민에게 배당하는 경제 모델이다. 국가가 에너지와 컴퓨팅 자원 같은 병목 지점을 관리하며 경제적 수요를 보장하는 역할을 수행한다.
궤도 역학
orbital-dynamics
중력의 영향을 받는 천체나 인공 물체의 운동을 다루는 물리 법칙이다. 강화학습 환경에서는 에이전트가 학습해야 할 복잡한 비선형 물리 법칙으로 작용한다.
궤적 분석
trajectory-analysis
AI 에이전트가 작업을 수행하는 과정에서 거친 모든 단계와 의사결정 흐름을 추적하여 성능과 실패 원인을 분석하는 방법이다.
귀무 가설
null-hypothesis
실험에서 검증하고자 하는 효과나 차이가 실제로 존재하지 않는다는 기본 가정이다. 통계적 검정은 이 가설이 참일 확률을 계산하여 이를 기각할지 여부를 결정하는 방식으로 진행된다. 과학적 발견을 확정하기 위한 논리적 출발점으로서 중요하다.
그람 행렬
gram-matrix
특성 맵(Feature Map)들 간의 상관관계를 계산하여 이미지의 스타일이나 질감 정보를 수치화한 행렬이다. 신경 스타일 전이에서 콘텐츠와 별개로 이미지의 예술적 스타일을 정의하고 추출하는 데 활용된다.
근방 탐색
neighborhood-search
현재 해에서 작은 변화를 주어 더 나은 해를 찾는 최적화 기법이다. 담금질 기법과 같은 메타 휴리스틱 알고리즘의 핵심 구성 요소로, 해 공간을 효율적으로 탐색하기 위해 다양한 변화 연산을 정의하는 것이 중요하다.
근접 스킴
proximal-scheme
미분 불가능한 항이 포함된 최적화 문제를 해결하기 위해 근접 연산자(Proximal Operator)를 사용하는 반복 계산 방식이다. 복합 함수 최적화에서 정규화 항을 효율적으로 처리할 수 있게 하며 수렴 안정성을 보장한다.
글루 코드
glue-code
서로 다른 소프트웨어 컴포넌트나 API 간의 데이터를 연결하고 변환하기 위해 작성하는 보조 코드이다. CUGA는 이를 자율적으로 생성하여 데이터 필터링이나 형식 변환을 처리한다.
기계 망각
machine-unlearning
이미 학습된 모델에서 특정 데이터나 편향된 정보를 선택적으로 제거하는 기술이다. 개인정보 보호나 유해 콘텐츠 차단을 위해 필수적이지만 망각 과정에서 모델의 일반적인 성능이나 안전성이 저하되는 트릴레마 현상이 관찰된다.
기술 부채
tech-debt
빠른 출시를 위해 선택한 임시 방편적 코드가 나중에 수정이나 유지보수 비용으로 돌아오는 현상이다. AI 시대에는 AI가 생성한 저품질 코드가 새로운 형태의 부채로 작용한다.
기술 주권
technological-sovereignty
국가나 지역이 외부 의존 없이 핵심 기술과 데이터를 스스로 통제하고 발전시킬 수 있는 능력이다. AI 분야에서는 자체 모델 보유와 인프라 접근성, 관련 규제 및 투자 환경 조성을 포함하는 개념이다.
기아 현상
starvation
운영체제나 네트워크에서 특정 프로세스나 요청이 자원을 할당받지 못하고 무한정 대기하는 상태이다. LLM 추론에서는 대규모 요청이 GPU 자원을 독점할 때 발생하며 서비스 품질을 저하시킨다.
기호 계층
symbolic-tier
수치적 계산 대신 논리 기호와 규칙을 사용하여 정형 검증이나 추론을 수행하는 아키텍처의 일부로 시스템의 논리적 엄밀함을 보장한다.
깊이 완성
depth-completion
희소하거나 구멍이 뚫린 깊이 맵을 RGB 이미지 등의 정보를 활용해 조밀하게 채우는 기술이다. 로봇이 물체의 정확한 형상을 파악하여 파지 지점을 결정하는 데 필수적인 전처리 단계이다. 정확한 표면 복원은 파지 성공률에 직접적인 영향을 미친다.
깊이 추정
depth-estimation
단일 이미지나 스테레오 이미지를 분석하여 카메라로부터 물체까지의 거리를 계산하는 기술이다. 장애물 회피 및 공간 구조 파악에 필수적이다.
나노 기술
nanotechnology
원자나 분자 수준(10억분의 1미터)에서 물질을 조작하고 제어하는 기술이다. 초미세 센서, 고성능 소재, 표적 약물 전달 시스템 등 다양한 첨단 분야의 기초가 되며 기술의 소형화와 고성능화를 가능하게 한다.
내쉬 균형
nash-equilibrium
게임 이론에서 모든 참가자가 상대방의 전략을 알고 있다고 가정할 때, 어느 누구도 전략을 바꿀 유인이 없는 상태를 의미한다. MARL에서는 학습이 안정화되어 최적의 정책에 도달했음을 나타내는 지표로 쓰인다.
능동 학습
active-learning
모델이 학습에 가장 도움이 될 데이터를 스스로 선택하여 실험을 요청하는 기계학습 기법으로, 데이터 획득 비용이 높은 신약 개발에서 효율성을 극대화한다.
니지 모델
niji-model
미드저니와 시즐(Spellbrush)이 협업하여 만든 애니메이션 및 아시아 스타일 특화 이미지 생성 모델이다. 일반적인 실사 위주의 모델과 달리 만화적 표현과 색감에 최적화되어 있다.
니치 토픽
niche-topic
매우 전문적이거나 대중적이지 않은 틈새 주제를 말한다. AI 학습 데이터가 부족할 수 있는 영역으로, 퀴즈 생성 시 정확도가 상대적으로 낮아질 수 있는 지점이다.
님비 현상
nimby-ism
Not In My Back Yard의 약자로 공공의 이익에는 부합하지만 자신이 거주하는 지역에 혐오 시설이 들어서는 것을 반대하는 지역 이기주의를 뜻한다.
다중 참조
multi-reference
이미지 생성 시 한 장이 아닌 여러 장의 이미지를 참고 자료로 입력하는 기법이다. 모델이 대상의 다양한 각도와 특징을 학습하게 하여 생성된 결과물에서 대상의 정체성과 일관성을 유지하는 데 핵심적인 역할을 한다.
대뇌 피질
cortex
지각, 기억, 사고 등을 담당하는 뇌의 가장 바깥쪽 층으로, 연구에서는 AI 모델이 이 부위의 시각 정보 처리 방식을 얼마나 모방하는지 분석하는 기준이 된다.
대리 모델
surrogate-model
복잡하고 계산 비용이 많이 드는 물리적 시뮬레이션을 모방하도록 훈련된 근사 모델이다. 머신러닝 알고리즘을 사용하여 입력과 출력 사이의 관계를 학습함으로써 원래 모델보다 훨씬 빠른 속도로 결과를 예측할 수 있게 해준다.
대조 학습
contrastive-learning
데이터 간의 유사성과 차이점을 비교하며 특징을 추출하는 자가 지도 학습 기법이다. 본 연구에서는 특정 신호를 제외하고 나머지를 통해 이를 재구성하는 방식을 사용하여 다중 모달 데이터 간의 관계를 학습시켰다.
대칭 행렬
symmetric-matrix
행렬 A와 그 전치 행렬 A^T가 같은 행렬을 의미한다. 항상 서로 직교하는 고유벡터들로 대각화가 가능하다는 강력한 수학적 성질을 보유하고 있다.
대학 학점
academic-credit
교육 과정을 성공적으로 이수했을 때 정규 교육 기관에서 인정해 주는 학습 단위이다. 이 코스가 단순한 취미 교육을 넘어 공신력 있는 고등 교육 수준의 내용을 포함하고 있음을 의미한다.
데몬 실행
daemon-execution
사용자의 직접적인 개입 없이 백그라운드에서 지속적으로 실행되는 프로세스 방식을 의미한다. 장시간 소요되는 코딩 작업이나 모니터링 업무를 에이전트가 독립적으로 수행할 수 있게 한다.
델타 응답
delta-response
전체 데이터 대신 이전 상태와 비교하여 변경된 차이점(Delta)만 전송하는 방식이다. 네트워크 대역폭을 절약하고 처리 속도를 극대화할 수 있어 대규모 파일 편집에 유리하다.
도구 변수
instrumental-variable
원인 변수에는 영향을 주지만 결과 변수에는 직접적인 영향이 없고 오직 원인 변수를 통해서만 영향을 주는 제3의 변수이다. 숨겨진 혼란 변수가 존재할 때 인과 관계를 식별하고 추정하기 위한 통계적 도구로 널리 사용된다.
도구 사용
tool-use
LLM이 텍스트 생성 외에 계산기, 웹 검색, API 호출 등 외부 기능을 직접 실행하여 문제를 해결하는 능력이다. 모델이 외부 환경과 상호작용하는 핵심 기법이다.
도구 통합
tool-integration
AI 에이전트가 외부 API나 소프트웨어 기능을 호출하여 실제 작업을 수행할 수 있도록 연결하는 과정이다. 에이전트가 단순 답변을 넘어 실행력을 갖추게 하는 필수 요소이다.
도구 호출
tool-calling
LLM이 사용자의 질문에 답하기 위해 외부 함수나 API를 실행해야 한다고 판단하고, 필요한 인자와 함께 실행을 요청하는 기능이다.
도커 격리
docker-isolation
컨테이너 기술인 도커를 사용하여 애플리케이션의 실행 환경을 호스트 시스템이나 다른 컨테이너로부터 물리적으로 분리하는 방식이다. 에이전트가 코드를 실행하거나 파일을 수정할 때 독립된 샌드박스 환경을 제공하여 보안 사고와 시스템 간섭을 방지한다.
라쏘 회귀
lasso
L1 노름(Norm)을 규제 항으로 사용하여 일부 계수를 정확히 0으로 만들어 변수 선택 기능을 수행하는 회귀 방법이다. 모델의 복잡도를 줄이면서도 안정적인 예측을 가능하게 한다.
랜덤 피처
random-features
고차원 커널 함수를 근사하기 위해 무작위로 생성된 기저 함수를 사용하는 기법이다. 복잡한 비선형 모델 대신 선형 모델의 효율성을 유지하면서도 강력한 표현력을 얻을 수 있는 방법론이다.
랜스 포맷
lance-format
AI 워크로드의 고성능 랜덤 액세스를 위해 설계된 차세대 컬럼형 데이터 저장 포맷이다. Parquet와 달리 벡터 검색과 대규모 미디어 데이터 처리에 최적화되어 있어 모델 학습 및 RAG 시스템의 I/O 병목을 획기적으로 줄여준다.
랭킹 퍼널
ranking-funnel
수백만 개의 콘텐츠 중 사용자에게 보여줄 최종 리스트를 선정하기 위해 후보군 추출(Retrieval)부터 정밀 순위 산정(Ranking)까지 단계별로 필터링하는 구조이다. 각 단계마다 데이터의 정밀도와 계산 비용 사이의 균형을 맞추는 것이 핵심이다.
로봇 조작
robotic-manipulation
로봇이 물리적 객체를 잡고, 옮기고, 조작하는 능력을 말한다. 신경망 기술의 발전으로 박스의 형태나 위치가 불규칙한 환경에서도 정교한 조작이 가능해졌다.
로컬 모델
local-model
외부 클라우드 API를 통하지 않고 사용자의 개인 컴퓨터나 서버 내에서 직접 실행되는 AI 모델이다. 데이터 보안이 우수하고 오프라인에서도 사용 가능하며 장기적으로 비용을 절감할 수 있다.
로컬 실행
local-execution
데이터를 외부 서버로 전송하지 않고 사용자의 개인 컴퓨터 내에서만 처리하는 방식으로, 보안과 프라이버시 보호에 유리하다.
루프 폐쇄
closing-the-loop
에이전트가 작업을 수행한 후 그 결과를 스스로 확인하고 수정하는 피드백 과정을 완료하는 것을 의미한다. 에이전트의 신뢰성을 높이는 중요한 설계 패턴이다.
리즈 기저
riesz-basis
힐베르트 공간에서 정규 직교 기저를 선형 동형 사상으로 변형한 기저로, 함수를 고유하게 표현하면서도 수치적 안정성을 보장하는 도구이다.
머리 추적
head-tracking
카메라를 통해 사용자의 머리 위치와 방향을 실시간으로 감지하는 기술이다. 3D 환경에서 사용자의 시점 변화를 자연스럽게 반영하기 위해 사용된다.
머신 비전
machine-vision
카메라와 AI를 이용해 시각 정보를 해석하는 기술이다. 로봇이 박스의 위치, 크기, 방향을 정확히 파악하여 적절한 위치를 잡는 데 필수적인 역할을 한다.
머클 트리
merkle-tree
데이터 블록의 해시값을 트리 구조로 구성하여 데이터의 무결성을 효율적으로 검증하는 방법이다. 최상위 루트 해시값만 비교하면 전체 데이터의 변조 여부를 빠르게 확인할 수 있어 보안 저장소에서 핵심적인 역할을 한다.
메타 언어
meta-language
언어 그 자체에 대해 설명하거나 대화의 흐름을 제어하기 위해 사용되는 언어이다. AI가 "제가 이해한 바로는~" 또는 "다음 단계는~"이라고 말하는 것이 대표적인 예시이다.
모델 반전
model-reversal
분류 모델의 예측 성능이 매우 낮을 때 결정 경계를 반대로 뒤집어 성능을 개선하는 기법이다. 이 연구에서는 LDP 노이즈로 인해 왜곡된 모델을 교정하여 유용한 정보를 추출하는 수단으로 활용된다.
모델 스펙
model-spec
AI 모델이 사용자 요청에 어떻게 반응해야 하는지를 정의하는 지침서이다. 모델의 목표, 규칙, 기본 원칙을 설정하여 일관되고 안전한 답변을 생성하도록 제어하는 역할을 한다.
모델 오염
model-poisoning
AI 학습 데이터에 악의적인 정보를 주입하거나 AI 생성 콘텐츠가 다시 학습 데이터로 사용되어 모델의 성능과 신뢰성을 저하시키는 공격 기법이다. 이는 AI가 잘못된 정보를 사실처럼 출력하게 만들어 기업의 의사결정 체계를 교란할 수 있다.
모델 증류
model-distillation
거대한 모델(Teacher)의 지식을 더 작고 효율적인 모델(Student)로 전이시키는 기법이다. FLUX.2 [dev] 모델은 이 기법을 통해 성능은 유지하면서도 추론 속도를 획기적으로 높였다.
모델 행동
model-behavior
특정 입력값에 대해 AI 모델이 반응하거나 결과를 도출하는 방식과 특성을 의미한다. 이를 분석함으로써 모델의 편향성, 정확도, 안전성 등을 파악하고 개선 방향을 설정할 수 있다.
모방 학습
imitation-learning
에이전트가 보상 함수를 직접 최적화하는 대신 전문가의 시연을 보고 최적의 행동을 배우는 강화학습의 한 분야이다.
모션 감지
motion-detection
연속된 영상 프레임 간의 픽셀 변화를 분석하여 움직이는 물체를 찾아내는 기술이다. 배경과 분리된 객체의 대략적인 위치를 파악하는 첫 단계로 사용된다.
목표 전치
goal-displacement
조직이나 시스템의 원래 목적보다 그 목적을 달성하기 위한 수단이나 지표가 더 중요해지는 현상이다. 과학계에서는 진리 탐구라는 본질보다 논문 수나 인용 지수 같은 수치 달성에 자원이 집중되는 결과를 초래한다.
몰입 상태
the-zone
작업에 완전히 빠져들어 시간 가는 줄 모르는 고도의 집중 상태이다. 코딩에서는 복잡한 논리를 해결하며 느끼는 즐거움과 연결되며, AI가 이를 대신할 경우 개발자가 느끼는 성취감이 저하될 수 있다.
문맥 검색
context-retrieval
코드의 특정 부분뿐만 아니라 관련된 전체 파일과 의존성을 찾아내어 분석에 활용하는 기술이다.
문맥 관리
context-management
AI가 이전 대화나 상태 정보를 기억하고 활용하도록 제어하는 기술이다. 본문에서는 매 생성마다 데이터를 출력하여 업데이트하는 방식으로 구현되어 일관성을 유지한다.
문맥 손실
context-loss
AI 모델이 긴 대화나 복잡한 작업 과정에서 이전의 중요한 정보를 잊어버리거나 무시하게 되는 현상이다. 이는 모델의 컨텍스트 윈도우 제한이나 어텐션 메커니즘의 한계로 인해 발생한다.
문맥 전환
context-switching
한 작업에서 다른 작업으로 주의를 돌리는 과정이다. 뇌가 새로운 작업의 맥락을 파악하는 데 시간이 걸리므로, AI 속도에 맞춰 작업을 자주 바꾸면 생산성이 급격히 떨어진다.
문헌 조사
literature-review
특정 주제에 대한 기존 연구들을 수집하고 분석하여 현재의 연구 흐름과 한계를 파악하는 과정이다. 새로운 연구의 방향성을 설정하고 독창성을 확보하기 위한 필수적인 단계이다.
문화 적응
enculturation
특정 집단의 가치, 규범, 지식을 사회적 상호작용을 통해 자연스럽게 습득하는 과정이다. 안목과 같은 암묵지는 도제식 교육이나 전문가 집단과의 교류를 통해 전수되는 경우가 많다.
미세 분류
fine-grained-classification
매우 유사한 시각적 특징을 가진 하위 범주(예: 장미의 세부 색상 차이)를 구분하는 고난도 분류 작업이다. 일반적인 분류보다 더 세밀한 특징 추출 능력이 요구된다.
미세 조정
fine-tuning
이미 대량의 데이터로 학습된 기존 모델(Pre-trained model)을 특정 도메인이나 지역의 데이터셋으로 추가 학습시키는 과정이다. 이를 통해 모델이 특정 문화적 맥락이나 전문 지식을 더 정확하게 이해하도록 최적화할 수 있다.
밀집 모델
dense-model
모든 파라미터가 추론 과정에 참여하는 전통적인 신경망 구조이다. MoE 대비 연산량은 많으나 지능의 밀도가 높고 일관된 성능을 제공하는 경향이 있다.
발달 과학
developmental-science
인간이 생애 전반에 걸쳐 어떻게 성장하고 변화하는지를 연구하는 학문이다. 이 아티클에서는 청소년의 인지 및 정서 발달 수준에 맞춘 AI 답변을 설계하는 근거로 활용되었다.
버퍼 기간
buffer-periods
학습 과정에서 특정 기간 동안 정책 변경을 멈추거나 데이터를 분리하여 입찰자의 전략적 조작이 학습 결과에 즉각 반영되지 않도록 차단하는 기술이다. 이를 통해 입찰자의 기만 행위를 방지한다.
베타 계수
beta
전체 시장의 수익률 변동에 대한 개별 주식 수익률의 민감도를 나타내는 수치이다. 위험 수준을 측정하는 지표로 사용되며, DCF 모델에서 자본 비용을 계산할 때 필수적인 요소이다.
벡터 검색
vector-search
데이터를 다차원 공간의 벡터로 변환하여 의미적 유사성을 바탕으로 검색하는 기술이다. 텍스트뿐만 아니라 분자 구조, 단백질 서열 등 복잡한 생물학적 데이터를 효율적으로 검색하는 데 사용된다.
벡터 내적
dot-product
두 벡터의 성분별 곱의 합을 구하는 연산이며, 확률 분포와 가치 벡터를 곱해 기대값을 구하는 과정을 단순화한다. 강화학습 수식을 행렬 연산으로 변환할 때 핵심적인 역할을 한다.
벤더 종속
vendor-lock-in
특정 클라우드 서비스나 모델 제공업체의 기술에 의존하게 되어 다른 서비스로 전환하기 어려워지는 현상이다. OpenRouter와 같은 통합 게이트웨이는 여러 모델을 쉽게 교체할 수 있게 하여 이 문제를 완화한다.
벤딩 벤치
vending-bench
Andon Labs에서 개발한 AI 자판기 운영 능력 평가용 시뮬레이션 벤치마크이다. 실제 물리적 환경에 투입하기 전 AI 에이전트의 비즈니스 판단력을 수치화하여 측정하는 도구로 사용된다.
변분 근사
variational-approximation
복잡한 사후 분포를 다루기 쉬운 단순한 분포의 가족 중에서 가장 유사한 것을 찾아 대체하는 기법이다. 계산이 불가능한 적분 문제를 최적화 문제로 변환하여 베이지안 추론의 계산 효율성을 극대화한다.
변분 추론
variational-inference
복잡한 사후 분포를 직접 계산하는 대신, 다루기 쉬운 분포들의 가족 중에서 실제 분포와 가장 유사한 것을 최적화를 통해 찾는 기법이다. 샘플링 기반의 MCMC보다 계산 속도가 빨라 대규모 문제에 유리하다.
변형 수축
deformation-retraction
위상 공간을 그 부분 공간으로 연속적으로 줄여나가는 사상이다. 본 연구에서는 불연속 경계 근처의 하위 레벨 세트 구조를 단순화하여 분석하는 데 사용된다.
병렬 실행
parallel-execution
여러 작업을 동시에 수행하여 전체 처리 시간을 단축하는 기법이다. 라우터나 서브에이전트 패턴에서 여러 도메인의 정보를 동시에 조회할 때 효율성을 극대화한다.
병렬 처리
parallel-processing
여러 개의 연산을 동시에 수행하여 처리 속도를 높이는 기술이다. 대규모 데이터를 동시에 처리해야 하는 딥러닝 모델의 학습과 추론에서 핵심적인 역할을 하며, GPU가 AI 연산에 유리한 이유이기도 하다.
병목 거리
bottleneck-distance
두 지속성 다이어그램 사이의 유사도를 측정하는 거리 함수이다. 한 다이어그램의 점들을 다른 다이어그램의 점들과 매칭할 때 발생하는 최대 이동 거리의 최솟값을 의미한다.
보상 설계
reward-shaping
에이전트가 복잡한 목표를 달성할 수 있도록 중간 단계마다 적절한 보상을 제공하여 학습 속도와 품질을 높이는 기법이다.
보상 함수
reward-function
강화학습에서 에이전트가 수행한 행동의 결과에 대해 점수를 부여하는 기준이다. 에이전트는 이 점수를 최대화하는 방향으로 행동 방침을 수정하며 학습한다.
보상 해킹
reward-hacking
AI가 설계자의 의도와 달리 보상 함수를 극대화하는 편법을 찾아내어 잘못된 행동을 학습하는 현상이다. 이는 모델의 안전성과 정렬 문제에서 매우 중요하게 다뤄지며, 의도치 않은 오용이나 오작동의 주요 원인이 된다.
보조 변수
auxiliary-variable
주된 관심 대상은 아니지만, 모델의 식별 가능성을 높이거나 노이즈를 제어하기 위해 함께 관측되는 추가적인 정보다.
복합 함수
composite-function
미분 가능한 매끄러운 함수와 미분 불가능할 수 있는 정규화 항(Regularizer)의 합으로 구성된 함수 형태이다. 머신러닝에서 손실 함수와 L1/L2 규제를 결합한 형태가 대표적이다.
부수 현상
epiphenomenon
어떤 과정의 결과로 나타나지만 그 과정 자체에는 아무런 영향을 미치지 않는 현상을 뜻한다. 뇌과학에서는 의식을 뇌 활동에 수반되는 결과물로 보는 관점에서 사용한다.
분산 학습
decentralized-training
단일 데이터센터가 아닌 인터넷으로 연결된 여러 위치의 컴퓨팅 자원을 활용해 AI 모델을 학습시키는 방식이다. 거대 기업의 독점적 인프라 없이도 대규모 모델을 학습시킬 수 있는 대안으로 주목받고 있다.
분포 변화
distribution-shift
학습 데이터와 실제 운영 데이터의 통계적 특성이 달라지는 현상으로 모델의 예측 성능을 급격히 떨어뜨리는 주요 원인이다.
분할 상환
amortization
초기 설정이나 일회성 계산에 드는 큰 비용을 여러 번의 반복 실행 과정에 나누어 배치함으로써 전체적인 평균 비용을 낮추는 전략이다.
비전 모델
vision-model
텍스트뿐만 아니라 이미지나 PDF 같은 시각적 데이터를 이해하고 처리할 수 있는 AI 모델이다. 멀티모달 인터페이스를 구현하는 데 필수적인 요소이다.
빠른 실패
fast-failure
성공 가능성이 낮은 아이디어를 조기에 포기하여 시간과 자원의 낭비를 최소화하는 전략이다. 이는 더 유망한 기회에 집중할 수 있게 해주는 창업의 핵심 원칙이다.
사고 모드
thinking-mode
LLM이 답변을 출력하기 전 내부적으로 복잡한 추론 단계를 거치도록 설계된 기능으로, 논리적 문제 해결 능력을 높이기 위해 도입되었다.
사전 승인
prior-authorization
보험사가 특정 치료나 약제에 대해 비용을 지불하기 전 의료적 필요성을 미리 검토하는 절차이다. 복잡한 서류 작업이 수반되어 AI를 통한 자동화 요구가 높은 분야이다.
사회 공학
social-engineering
기술적 해킹이 아닌 인간의 심리나 논리적 허점을 이용해 기밀 정보를 탈취하거나 특정 행동을 유도하는 공격 기법이다.
사후 분포
posterior-distribution
데이터를 관측한 후 업데이트된 파라미터에 대한 확률 분포로, 베이지안 추론의 최종 결과물이다.
사후 추론
post-hoc-inference
데이터 수집이 완료된 이후에 수행되는 추론 방식으로, 샘플 데이터를 데이터 생성 분포와 연결하여 결론을 도출한다. 저자는 이를 귀납법의 문제를 해결하려는 시도 중 하나로 보며 논쟁을 위한 규칙 세트라고 설명한다.
사후 학습
post-training
사전 학습된 모델에 특정 데이터셋을 추가로 학습시켜 도구 호출이나 대화 능력 등 특정 기능을 강화하는 단계이다. 모델의 범용성을 유지하면서 전문성을 높이는 역할을 한다.
상태 관리
state-management
워크플로의 각 단계에서 발생하는 데이터와 진행 상황을 추적하고 유지하는 프로세스이다. 에이전트 시스템에서는 여러 단계에 걸친 작업의 맥락을 보존하고 조건부 분기를 결정하는 핵심적인 역할을 수행한다.
생물 보안
biosecurity
AI 모델이 생물학적 무기 제조나 유해 병원체 관련 정보를 오용하지 않도록 관리하는 안전 영역이다. 고성능 모델일수록 전문 지식 접근성이 높아지므로, GPT-5.2와 같은 최신 모델에서는 이를 방지하기 위한 엄격한 가드레일 설정이 중요하다.
생존 분석
survival-analysis
특정 사건이 발생하기까지 걸리는 시간을 분석하는 통계적 기법이다. 고객의 이탈 시점을 예측하고 시간에 따른 잔존 확률 곡선을 도출하여 LTV를 정밀하게 계산하는 데 사용된다.
생존 인증
proof-of-liveness
온보딩 시 사용자가 실제 사람인지 확인하기 위해 실시간 촬영 등을 요구하는 보안 절차이다. 사진 도용이나 딥페이크를 이용한 사기 가입을 방지하기 위해 글로벌 규제 대응 시 필수적으로 포함되는 단계이다.
섀도 모드
shadow-mode
새로운 시스템을 실제 운영 환경에 적용하기 전, 실제 데이터로 작동시키되 결과값을 실제 실행에는 반영하지 않고 모니터링하며 성능을 검증하는 단계이다.
선택 편향
selection-bias
실험 대상을 선정할 때 특정 특성을 가진 집단이 선택되어 결과가 왜곡되는 현상입니다. 이 아티클에서는 성장이 유망한 기업이 대출을 받을 가능성이 높다는 점이 선택 편향으로 작용할 수 있으며, 이를 RCT를 통해 제거하여 순수한 금융 지원 효과를 측정했습니다.
선행 지표
leading-indicator
최종 결과가 나타나기 전에 미래의 성과를 예측할 수 있는 지표이다. AI 도입 후 PR 코멘트 수정 시간 단축 등이 비즈니스 가치 창출의 선행 지표가 된다.
선형 수렴
linear-convergence
알고리즘의 오차가 매 단계마다 일정한 비율로 줄어드는 특성으로, 대규모 계산에서 빠른 최적화 성능과 안정적인 종료 시점을 보장하는 지표다.
성향 점수
propensity-score
관측된 공변량이 주어졌을 때 특정 유닛이 처치군에 배정될 확률을 의미한다. 인과 추론에서 선택 편향을 보정하고 처치군과 대조군을 비교 가능하게 만드는 데 사용된다.
세포 분할
cell-segmentation
이미지나 데이터에서 개별 세포를 식별하고 경계를 나누는 기술로 정밀한 뇌 지도를 만드는 데 필수적이다.
센서 퓨전
sensor-fusion
카메라, 라이다(Lidar), 레이더(Radar) 등 서로 다른 특성을 가진 여러 센서의 데이터를 결합하여 주변 환경을 더 정확하게 인식하는 기술이다. 각 센서의 단점을 보완하고 신뢰성 높은 데이터를 확보하는 데 중요하다.
셀프 포싱
self-forcing
모델이 직접 생성한 출력을 다시 입력으로 사용하는 실제 추론 환경과 유사한 방식으로 학습시켜, 장기 생성 시 발생하는 오차 누적 문제를 완화하는 기법이다.
소셜 역학
social-dynamics
집단 내 개체들 사이의 상호작용, 관계 형성 및 영향력을 주고받는 복잡한 체계를 의미한다. AI 에이전트 간의 소셜 역학 연구는 협력적 문제 해결이나 자율적 사회 구조 형성을 이해하는 데 중요하다.
속도 제한
rate-limit
특정 시간 동안 API를 통해 보낼 수 있는 요청의 수나 토큰의 양을 제한하는 정책이다. 고성능 모델일수록 제한이 엄격한 경우가 많아, 효율적인 프롬프트 작성을 통해 요청 횟수를 최소화하는 것이 중요하다.
속도 제한
rate-limiting
특정 시간 내에 API에 보낼 수 있는 요청의 수를 제한하는 메커니즘이다. 자율 에이전트가 단시간에 많은 요청을 보낼 경우 서비스 제공업체에 의해 차단될 수 있어 이를 관리하는 설계가 중요하다.
손실 압축
lossy-compression
데이터를 요약하거나 크기를 줄이는 과정에서 일부 세부 정보가 영구적으로 누락되는 현상이다. LLM의 대화 요약 과정에서 발생하기 쉬우며, 이를 보완하기 위해 원본 기록에 대한 참조를 유지하는 기법이 사용된다.
손실 함수
loss-function
모델의 예측값과 실제값의 차이를 수치화하는 함수이다. 이 값이 작을수록 모델의 예측 성능이 좋음을 의미하며, 학습 과정에서 모델을 최적화하는 기준이 된다. 평균 제곱 오차(MSE)나 교차 엔트로피(Cross-Entropy) 등이 대표적인 예시이다.
수관 높이
tree-canopy-height
지면에서 나무의 가장 높은 부분까지의 수직 거리를 의미한다. 삼림의 바이오매스 추정, 생태계 건강도 평가, 탄소 흡수량 계산 등을 위한 핵심 지표로 활용된다.
수락 기준
acceptance-criteria
시스템이나 기능이 사용자의 요구사항을 충족했는지 판단하기 위해 미리 정의된 조건이다. AI 에이전트가 배포 가능한 수준인지 결정하는 최종적인 평가 지표가 된다.
수렴 분석
convergence-analysis
알고리즘이 반복됨에 따라 최적해에 얼마나 빠르고 정확하게 도달하는지를 수학적으로 증명하고 측정하는 과정이다. 알고리즘의 안정성과 효율성을 보장하는 데 필수적이다.
수렴 속도
convergence-rate
최적화 알고리즘이 반복을 거듭함에 따라 최적해에 도달하는 속도를 의미한다. 본문에서는 반복 횟수 t에 따른 오차 감소율을 O(t^-n) 형태로 표현하여 학습 효율성을 비교한다.
수렴 진화
convergent-evolution
계통이 다른 생물들이 유사한 환경에 적응하면서 결과적으로 비슷한 외형이나 기능을 갖게 되는 현상이다. 이 아티클에서는 서로 다른 코드 구현이 최적의 생존 전략으로 모이는 현상을 뜻한다.
수익 후생
revenue-regret
최적의 전략을 미리 알고 있었을 때 얻을 수 있는 최대 수익과 실제 알고리즘이 달성한 수익 사이의 차이를 의미한다. 이 값이 작을수록 알고리즘이 최적 성능에 빠르게 수렴함을 나타낸다.
수축 사상
contraction-mapping
연산자를 적용한 후의 두 점 사이의 거리가 적용 전보다 작아지는 성질을 가진 함수이다. 벨만 연산자가 수축 사상임을 증명함으로써 반복적인 업데이트를 통해 유일한 최적해(고정점)에 도달할 수 있음을 보장한다.
수축 효과
shrinkage
회귀 계수의 추정치를 0 방향으로 축소시켜 모델의 분산을 줄이는 기법이다. 이는 모델의 안정성을 높이고 예측 오차를 줄이는 데 도움을 준다.
수축 효과
shrinkage-effect
회귀 계수의 크기를 0 방향으로 줄여 추정치의 분산을 감소시키는 기법이다. 모델의 복잡도를 제어하여 예측 성능의 안정성을 높이는 역할을 한다.
순열 행렬
permutation-matrix
각 행과 열에 정확히 하나의 1이 있고 나머지는 0인 정사각 행렬로, 다른 행렬에 곱해졌을 때 행이나 열의 순서를 바꾸는 역할을 한다. GNN에서 노드 순서 재배치를 수학적으로 표현할 때 사용된다.
순환 참조
circular-reference
두 개 이상의 객체가 서로를 참조하여 외부 연결이 모두 끊겨도 참조 횟수가 0이 되지 않는 상태이다. 단순 참조 횟수 계산 방식에서는 메모리 누수의 주요 원인이 된다.
슈퍼 식스
super-six
나스닥 시장을 주도하는 6개의 거대 기술 기업(엔비디아, MS, 애플, 알파벳, 아마존, 메타)을 지칭한다. 이들은 AI 기술과 자본력을 바탕으로 시장 전체의 성장을 견인하고 있다.
시각 피질
visual-cortex
뇌의 후두엽에 위치하며 눈에서 들어온 시각 정보를 처리하는 핵심 영역이다. 컴퓨터 비전의 CNN 구조가 이 영역의 계층적 처리 방식에서 영감을 받았으며, 사물 인식과 공간 파악의 중심 역할을 한다.
시각 효과
vfx
실사 영상에 컴퓨터 그래픽 등을 결합하여 현실에서 촬영하기 어려운 장면을 구현하는 기술이다. 최근 AI 도구와 결합하여 제작 효율성을 극대화하고 있다.
신뢰 구간
confidence-interval
통계적으로 모수가 존재할 것으로 예상되는 범위이다. 머신러닝에서는 모델 예측의 불확실성을 표현하는 도구로 쓰이며, 이 구간이 정확할수록 모델의 예측을 더 신뢰할 수 있다.
신뢰 밀도
confidence-density
모수에 대한 신뢰 구간 정보를 확률 밀도 함수 형태로 표현한 것으로, 베이지안 사후 분포와 유사하게 서로 다른 소스의 통계 정보를 통합할 때 유용하다.
실행 궤적
trajectory
에이전트가 작업을 수행하는 동안 발생한 모든 메시지, 도구 호출, 추론 과정, 중간 결과의 전체 기록이다. 최종 결과뿐만 아니라 에이전트가 목표에 도달하기 위해 거친 단계별 논리를 분석하여 실패 원인을 파악하는 데 필수적인 데이터이다.
실행 추적
trace
AI 에이전트가 요청을 처리하는 과정에서 발생하는 모든 단계별 입력, 출력, 도구 호출 등의 상세 기록이다. 복잡한 에이전트의 동작을 디버깅하고 성능을 평가하는 데 필수적인 데이터이다.
실험 관리
experiment-tracking
모델 학습 과정에서 발생하는 하이퍼파라미터, 메트릭, 결과물을 기록하고 비교하는 프로세스이다. 이를 통해 최적의 모델 설정을 찾고 연구의 재현성을 확보한다.
실현 위기
realization-crisis
생산된 재화가 소비자의 구매력 부족으로 인해 판매되지 못하고 가치로 전환되지 못하는 경제적 교착 상태이다. AI가 인간 노동을 대체하여 임금 소득이 사라질 때 발생하는 자본주의의 구조적 모순을 설명한다.
안전 정렬
safety-alignment
AI 모델의 출력이나 행동이 인간의 가치관, 윤리, 안전 기준에 부합하도록 조정하는 기술적 과정이다. 유해한 답변을 방지하고 모델의 의도된 행동을 보장하기 위해 필수적이다.
안전 정책
safety-policy
AI 모델이 유해한 콘텐츠를 생성하거나 범죄에 악용되는 것을 막기 위해 기업이 설정한 가이드라인이다. 이번 사건에서는 법 집행 기관 신고를 결정하는 '위험 임계치' 설정이 정책의 핵심 쟁점이 되었다.
안티 패턴
anti-pattern
실제로는 비효율적이거나 부작용을 일으키는 흔한 설계 방식을 의미한다. AI에게 이를 명시하면 잘못된 해결책을 제시하는 것을 막을 수 있다.
액터 메쉬
actor-mesh
강화학습에서 환경과 상호작용하는 여러 액터(Actor)들을 효율적으로 관리하고 통신하게 하는 분산 아키텍처입니다. 대규모 롤아웃 작업을 병렬로 처리하는 데 필수적입니다.
양자 얽힘
quantum-entanglement
멀리 떨어진 입자들이 서로 연결되어 상태를 공유하는 물리 현상이다. 뇌 전체에서 의식이 통합된 형태로 나타나는 원리를 설명하는 핵심 개념으로 활용되며, 실리콘 기반 컴퓨팅과 차별화되는 유기적 뇌의 고유한 특성으로 강조된다.
언어 감지
language-detection
입력된 텍스트가 어떤 언어인지 자동으로 식별하는 기술이다. 지원 언어가 100개 이상으로 늘어나면 유사 언어 간 구분이 어려워지므로 DeepL은 정확도를 높이기 위해 모델의 가중치와 매개변수를 조정하는 고도화 작업을 수행했다.
에지 배포
edge-deployment
중앙 서버가 아닌 스마트폰, IoT 기기 등 단말기 자체에서 AI 모델을 실행하는 방식으로, 저지연성과 개인정보 보호가 중요하다.
역량 협상
capability-negotiation
클라이언트와 서버가 연결될 때 서로 제공할 수 있는 기능과 형식을 확인하는 과정이다. 이를 통해 사전에 정의된 고정 스키마 없이도 런타임에 유연하게 상호작용할 수 있다.
연산 캐시
computecache
NVIDIA 드라이버가 셰이더나 연산 결과를 미리 저장해두어 실행 속도를 높이는 공간으로, 오염될 경우 잘못된 연산 결과를 초래할 수 있다.
연속 배칭
continuous-batching
새로운 요청이 들어올 때 기존 배치의 처리가 끝날 때까지 기다리지 않고 즉시 배치에 합류시키는 기술이다. 정적 배칭에 비해 처리량(Throughput)을 수 배 이상 향상시킨다.
연속 제어
continuous-control
행동 공간이 이산적인 선택지가 아닌 연속적인 수치(예: 로봇 관절의 각도)로 구성된 제어 문제이다. SAC나 TD3와 같은 알고리즘이 주로 사용되며, 행동 부패와 같은 스트레스에 민감하게 반응할 수 있다.
예후 예측
prognostication
질병의 경과나 치료 후의 결과를 미리 짐작하여 판단하는 의학적 과정이다. 암 연구에서는 재발 가능성이나 생존율을 예측하는 데 AI가 활용되어 맞춤형 치료 계획 수립을 돕는다.
오픈 모델
open-model
모델의 가중치(Weights)나 소스 코드가 공개되어 누구나 자유롭게 사용, 수정, 배포할 수 있는 인공지능 모델이다. 폐쇄형 모델과 달리 투명성과 커스터마이징 가능성이 높아 연구 및 특정 산업 분야에서 선호된다.
오픈 인증
oauth
비밀번호를 직접 공유하지 않고도 제3의 애플리케이션에 특정 데이터나 기능에 대한 접근 권한을 부여하는 표준 프로토콜이다. 에이전트가 사용자의 구글이나 슬랙 계정에 안전하게 접근하기 위해 필수적이다.
완전 관해
complete-remission
검사상 암이나 질병의 증거가 완전히 사라진 상태를 의미하며, 완치의 전 단계로 평가받는 중요한 임상 지표이다.
우측 검열
right-censoring
관찰 기간이 종료될 때까지 사건(탈퇴 등)이 발생하지 않아 정확한 시점을 알 수 없는 상태이다. 아직 활동 중인 고객의 데이터를 버리지 않고 활용하기 위해 생존 분석에서 필수적으로 처리해야 하는 개념이다.
운영 계층
operational-layer
기업의 핵심 비즈니스 로직과 실행이 이루어지는 시스템 층위이다. AI가 단순한 보조 도구를 넘어 기업 운영의 중추적인 역할을 수행하게 됨을 의미하는 개념이다.
원시 의식
proto-consciousness
생명체가 나타나기 전부터 우주에 존재하던 기초적인 의식의 단편들을 의미한다. 하메로프는 이러한 원시 의식적 사건들이 생명 진화의 방향을 결정했다고 주장한다. 의식을 생물학적 현상을 넘어 물리학적 기초로 확장하는 개념이다.
월드 모델
world-model
AI가 물리적 세계의 인과관계와 법칙을 이해하고 예측할 수 있도록 설계된 모델이다. 단순한 데이터 패턴 학습을 넘어 환경의 변화를 시뮬레이션하고 행동의 결과를 예측하는 능력을 갖추는 것이 핵심이다.
웜업 단계
warmup-steps
학습 초기 단계에서 학습률을 0 또는 매우 작은 값에서 목표치까지 서서히 높이는 구간이다. 이는 초기 가중치의 불안정성으로 인해 학습이 발산하는 것을 방지한다.
위상 분석
topology-analysis
객체들의 연결 방식이나 기하학적 성질을 분석하는 기법이다. AI 모델에서는 레이어와 뉴런 간의 연결 패턴을 분석하여 정보의 흐름이나 병목 지점을 파악하는 데 활용된다. 이를 통해 모델의 구조적 건전성을 평가할 수 있다.
위상 정렬
phase-alignment
여러 파동이나 진동 신호의 위상을 일치시키는 과정이다. PQNS에서는 신호 간의 건설적 간섭을 유도하여 특정 경로를 강화하고 정보 전달의 효율성을 높이는 핵심 메커니즘으로 작용한다.
위치 편향
positional-bias
평가 대상이 제시되는 순서나 위치에 따라 평가 결과가 왜곡되는 현상이다. LLM은 보통 첫 번째로 제시된 답변을 선호하거나 특정 위치의 정보를 더 중요하게 여기는 경향이 있다.
위험 경계
risk-bound
모델의 기대 손실(Risk)이 가질 수 있는 최대치를 수학적으로 제한하는 값이다. 샘플 수와 모델 복잡도에 따른 성능 보장 범위를 의미한다.
유도 편향
inductive-bias
모델이 학습 시 접하지 않은 데이터에 대해 예측하기 위해 사용하는 가정들의 집합이다. 특정 아키텍처가 특정 문제 해결에 적합하도록 설계된 구조적 특성을 의미한다.
유동 지능
fluid-intelligence
이전의 학습이나 경험에 의존하지 않고 생소한 상황에서 문제를 해결하고 논리적으로 추론하는 선천적 지적 능력이다.
은닉 상태
hidden-state
신경망 내부의 레이어 사이에서 데이터를 처리하고 전달하는 중간 단계의 벡터 표현이다. 모델이 입력 데이터를 어떻게 해석하고 변환하는지를 나타내는 핵심적인 정보 값을 담고 있다.
은닉 상태
hidden-states
신경망 내부 계층에서 계산된 중간 벡터 표현으로, 입력 데이터의 풍부한 문맥 정보를 담고 있다. AutoJudge는 이를 분류기의 입력값으로 재사용한다.
음성 인식
stt
음성 신호를 텍스트 데이터로 변환하는 기술로, Whisper와 같은 모델이 대표적이며 AI 앱의 입력 단계에서 필수적인 역할을 수행한다.
음성 합성
speech-synthesis
텍스트 데이터를 인공적인 음성으로 변환하는 기술(TTS)이다. Sarvam Edge는 이를 초경량화하여 모바일 기기의 제한된 자원에서도 자연스러운 목소리를 실시간으로 생성할 수 있게 한다.
음향 광학
acousto-optics
음파나 미세 진동을 이용해 빛의 경로, 위상, 주파수를 제어하는 기술로, 본 연구에서 칩 위 레이저를 정밀하게 조절하는 핵심 메커니즘이다.
의도 분류
intent-classification
사용자의 질문이나 명령이 어떤 카테고리에 속하는지 파악하는 과정이다. 이를 통해 에이전트가 수행할 작업이나 사용할 도구를 정확히 결정할 수 있다.
의도 인식
intention-aware
사용자가 입력한 프롬프트의 표면적 지시를 넘어 그 이면에 담긴 창의적 목표와 맥락을 AI가 파악하는 기술이다. 이를 통해 단순한 키워드 매칭보다 사용자의 의도에 부합하는 결과물을 생성할 수 있다.
의미 주석
gloss
특정 단어나 표현의 의미를 간략하게 설명한 주석이다. NLP 데이터셋에서 관용구의 실제 뜻을 모델에게 학습시키거나 프롬프트에 제공할 때 사용된다.
이봉 분포
bimodal-distribution
데이터 분포에서 정점이 두 개 나타나는 현상이다. LLM 평가에서는 특정 답변에 대해 판사들의 견해가 두 그룹으로 극명하게 갈릴 때 발생한다.
이상 탐지
anomaly-detection
데이터에서 일반적인 패턴과 다른 비정상적인 징후를 찾아내어 잠재적 위협을 식별하는 기법이다. 보안에서는 공격자의 침입이나 내부자의 비정상 행위를 포착하는 데 사용된다.
이온 추진
ion-propulsion
전하를 띤 입자를 이동시켜 추진력을 얻는 방식으로, 움직이는 기계적 부품 없이 액체 속에서 구동이 가능하다.
이온 트랩
trapped-ion
전자기장을 이용해 이온을 공중에 띄워 가두는 방식이다. 이 이온의 에너지 상태를 큐비트로 활용하며, 레이저를 이용해 매우 정밀한 연산 제어가 가능하다.
이중 잣대
double-standard
인간의 지능을 판단할 때와 AI의 지능을 판단할 때 서로 다른 기준을 적용하는 것을 의미하며 벨킨 박사는 AI에게만 유독 가혹한 기준을 적용하는 과학계의 태도를 비판한다.
이중 하강
double-descent
모델 복잡도가 증가할 때 성능이 악화되었다가 다시 개선되는 현상이다. 이는 과파라미터화된 모델이 단순 암기를 넘어 데이터의 내재적 구조를 학습하는 과정을 묘사하는 핵심 이론으로 활용된다.
이탈 예측
churn-prediction
고객이 서비스를 해지할 가능성을 머신러닝 모델로 분석하여 사전에 방지하는 기법이다. 비즈니스 유지율을 높이는 데 필수적이다.
인과 추론
causal-inference
단순한 상관관계를 넘어 원인과 결과 사이의 직접적인 연결 고리를 찾아내는 통계적 과정입니다. 금융 지원이 실제 매출 성장의 원인인지, 아니면 성장할 기업이 지원을 받은 것인지 구분하는 데 필수적인 분석 기법입니다.
인구 코딩
population-coding
하나의 정보를 여러 신경세포의 활동 패턴으로 나타내는 뇌의 정보 처리 방식이다. 시스템 장애 시에도 전체적인 기능이 유지되도록 하는 중복성 설계의 근간이 된다.
인재 유출
talent-exodus
특정 조직이나 국가에서 핵심적인 기술이나 지식을 보유한 우수한 인력들이 대거 빠져나가는 현상을 뜻한다.
인접 행렬
adjacency-matrix
그래프에서 어느 노드들이 간선으로 연결되었는지 나타내는 정사각형 행렬이다. 노드 i에서 j로의 연결 여부를 성분으로 표시하며 그래프 구조를 수치화하는 핵심 도구이다.
인증 토큰
oauth-token
사용자의 비밀번호를 공유하지 않고도 특정 서비스의 권한을 제3자 앱에 부여하기 위해 사용하는 디지털 증명서이다.
인지 부하
cognitive-load
작업 기억(Working Memory)이 정보를 처리할 때 가해지는 부담의 양이다. AI 사용 시 직접 코딩할 때보다 인지 부하가 줄어들지만, 대기 시간의 지루함이나 잦은 작업 전환이 새로운 형태의 정신적 피로를 유발한다.
인지 제어
cognitive-control
목표 달성을 위해 생각과 행동을 조절하는 능력으로, 불필요한 정보를 억제하고 중요한 정보에 집중하는 과정을 포함한다. 뇌가 한정된 자원을 효율적으로 사용하여 복잡한 작업을 수행하게 돕는다.
인지 편향
cognitive-bias
정보를 처리할 때 논리적 추론보다는 주관적인 경험이나 고정관념에 의존하여 비합리적인 판단을 내리는 심리적 경향이다. 데이터 분석에서 인간의 오류 패턴을 이해하는 핵심 요소이다.
일괄 처리
batch-processing
여러 개의 데이터를 하나씩 처리하지 않고 한꺼번에 묶어서 자동으로 처리하는 방식이다. 데이터셋 준비 과정에서 수백 장의 이미지 크기를 동시에 변경하거나 형식을 변환할 때 필수적이다. 수작업 시간을 획기적으로 단축하고 작업의 일관성을 유지하는 데 중요하다.
일차 섬모
primary-cilia
대부분의 동물 세포 표면에 존재하는 안테나 모양의 구조물이다. 세포 외부의 물리적, 화학적 신호를 감지하여 내부로 전달하는 감각 기관 역할을 하며, 기능 이상 시 다양한 유전 질환을 유발한다.
일치 지수
c-index
예측 모델의 성능을 평가하는 지표로, 두 대상 중 누가 먼저 특정 사건(질병 발생 등)을 겪을지 맞히는 확률을 의미한다. 0.5는 무작위 추측을, 1.0은 완벽한 예측을 나타내며 본 모델은 주요 질환에서 0.8 이상의 높은 수치를 보였다.
임시 환경
ephemeral-environment
특정 작업이나 테스트를 위해 일시적으로 생성되었다가 작업이 완료되면 즉시 삭제되는 격리된 개발 환경이다. 코딩 에이전트가 안전하게 코드를 실행하고 검증할 수 있는 샌드박스 역할을 한다.
자가 개선
self-improvement
AI 모델이 인간의 개입 없이 스스로 데이터를 생성하고 학습하여 자신의 성능을 높이는 과정이다. 지능의 폭발적 성장을 가능케 하지만 통제 불능의 위험성이 존재한다.
자가 수정
self-correction
모델이 생성한 결과물에 오류가 있을 때 사용자의 피드백을 받아 스스로 논리적 모순을 찾아내고 수정하는 과정이다. 고도의 추론 능력이 요구되며 에이전트 환경에서 모델의 신뢰성을 결정짓는 핵심 요소이다.
자가 정제
self-refinement
모델이 생성한 초기 답변을 스스로 검토하고 피드백을 반영하여 더 정확한 답변으로 반복 수정하는 기법으로, 추론 단계에서 성능을 높이는 핵심 전략이다.
자가 치유
self-healing
애플리케이션의 UI나 코드가 변경되었을 때 테스트 스크립트가 자동으로 이를 감지하고 수정하여 테스트 실패를 방지하는 기술이다. 유지보수 비용을 획기적으로 줄여준다.
자기 반성
self-reflection
AI가 자신이 생성한 결과물의 오류나 한계를 스스로 분석하고 이를 바탕으로 다음 시도에서 성능을 개선하는 기법이다.
자기 원인
causa-sui
다른 어떤 것에도 의존하지 않고 스스로가 자신의 존재나 행동의 원인이 되는 존재를 의미한다. 자유의지의 논리적 성립을 위해 필요한 조건으로 거론되지만 인간에게는 불가능하다는 주장의 근거가 된다.
자동 미분
automatic-differentiation
컴퓨터 프로그램을 통해 함수의 미분값을 정확하고 효율적으로 계산하는 기법이다. 수치 미분보다 정확하고 기호 미분보다 효율적이어서 딥러닝의 역전파 알고리즘 핵심 기술로 사용된다.
자동 탐지
automated-detection
AI 모델 사용 패턴을 알고리즘으로 분석하여 정책 위반 사례를 실시간으로 찾아내는 기술이다. 대규모 사용자 데이터를 효율적으로 감시하여 폭력적 오용을 사전에 차단하는 역할을 한다.
자본 지출
capex
기업이 미래의 이윤 창출을 위해 설비, 건물 등 고정 자산에 투자하는 비용이다. 본문에서는 빅테크 기업들이 AI 데이터 센터 구축을 위해 지출하는 막대한 비용을 의미하며 이것이 인력 감축의 압박으로 작용한다.
자율 무기
autonomous-weapon
인간의 직접적인 개입 없이 스스로 목표를 선정하고 공격을 수행하는 무기 체계로, 앤스로픽은 자사 AI가 이 용도로 쓰이는 것을 엄격히 금지한다.
자율 무기
autonomous-weapons
인간의 개입 없이 스스로 목표를 식별하고 공격을 결정하는 무기 체계이다. AI 기술의 발전으로 현실화되고 있으나 윤리적 책임 소재와 오작동 위험으로 인해 국제적인 논쟁의 대상이다.
작업 기억
working-memory
정보를 일시적으로 유지하고 조작하는 능력을 의미하며, 여기서는 모델이 입력된 문맥 중 필요한 정보를 선택적으로 관리하는 능력을 비유한다.
작업 범위
task-coverage
특정 직업을 구성하는 전체 작업 중 AI가 수행하거나 보조할 수 있는 작업의 비율이다. 실제 영향력을 측정할 때는 여기에 성공률과 시간 가중치를 더해 보정한다.
작업 분해
task-decomposition
복잡하고 모호한 사용자 요청을 실행 가능한 여러 개의 작은 하위 작업으로 나누는 과정이다. 에이전트가 논리적 순서에 따라 도구를 호출하고 목표를 달성하기 위한 핵심 계획 수립 단계이다.
작업 정렬
task-alignment
AI의 답변이 사용자가 요청한 구체적인 목표나 작업의 본질에 얼마나 정확하게 부합하는지를 의미한다. 불필요한 서술을 줄이고 핵심 정보 전달에 집중하는 것이 핵심이다.
잠재 공간
latent-space
고차원 데이터를 저차원의 벡터로 표현한 공간으로 AI 모델이 데이터의 특징과 관계를 학습하여 저장하는 추상적인 영역이다.
잠재 변수
latent-variable
직접적으로 관측되지는 않지만 관측된 변수들에 영향을 미치는 숨겨진 변수입니다. 인과 모델에서는 이 잠재 변수가 변수 간의 상관관계를 유발하는 혼란 변수(Confounder)로 작용할 수 있어 이를 적절히 처리하는 것이 중요합니다.
장기 기억
long-term-memory
AI가 과거 대화 내용이나 사용자가 설정한 핵심 정보를 세션이 종료된 후에도 지속적으로 보관하고 참조하는 기능이다. 개인화된 답변을 제공하는 근간이 된다.
장애 번들
incident-bundle
시스템 장애나 오류가 발생했을 때 당시의 로그, 상태 데이터, 환경 설정 등을 하나로 묶은 패키지이다. 디버깅을 위해 외부 전문가에게 전달하기 용이하도록 독립적인 형태로 구성되는 것이 특징이다.
재발 규칙
rrule
iCalendar 표준(RFC 5545)에서 정의된 일정 반복 규칙으로, 특정 작업이 매일, 매주 또는 특정 조건에서 반복되도록 정의하는 텍스트 형식이다.
전력 밀도
power-density
데이터 센터의 단위 면적 또는 랙당 공급 가능한 전력량이다. 최신 AI 하드웨어는 과거의 일반 서버보다 훨씬 많은 전력을 요구하므로, 기존 시설의 전력 밀도 한계를 파악하는 것이 AI 인프라 구축의 핵심 조건이 된다.
전방 선언
forward-declaration
실제 정의 전에 심볼의 존재를 미리 알리는 선언 방식으로, 인덱싱 시 실제 정의 위치를 찾는 기술적 난제를 발생시킨다.
전사 인자
transcription-factor
DNA의 특정 서열에 결합하여 유전자의 정보를 RNA로 복사하는 과정(전사)을 조절하는 단백질이다. 유전자의 발현 여부를 결정하여 세포의 분화와 발달을 조절하는 핵심 역할을 한다.
전이 학습
transfer-learning
한 도메인에서 학습된 지식을 다른 도메인의 문제를 해결하는 데 적용하는 머신러닝 기법이다. 본 논문에서는 노이즈가 있는 LDP 데이터를 소스 도메인으로, 깨끗한 데이터를 타겟 도메인으로 설정하여 분석했다.
전자 밀도
electron-density
특정 공간 영역에서 전자가 존재할 확률 분포를 의미한다. 분자의 안정성, 반응성 등 화학적 성질을 결정하는 가장 중요한 물리량 중 하나다.
접지 문제
grounding-problem
기호나 언어가 실제 세계의 물리적 대상이나 경험과 연결되지 못하는 문제이다. 텍스트로만 학습한 모델이 실제 물리 법칙이나 인과 관계를 진정으로 이해하는지 판단하는 중요한 기준이 된다.
정기 작업
scheduled-tasks
특정 시간이나 주기에 따라 자동으로 실행되도록 설정된 작업이다. 사용자의 개입 없이 반복적인 업무를 처리할 수 있게 하여 운영 효율성을 극대화하는 자동화의 핵심 기능이다.
정보 검색
retrieval
질문과 관련된 문서를 찾는 과정이다. 데이터 추출 단계의 정확도가 낮으면 관련 없는 문서가 검색될 확률이 높아진다.
정보 평가
intelligence-assessment
수집된 첩보를 분석하여 적의 의도나 상황을 판단하는 과정으로, 최근 LLM은 방대한 데이터를 요약하고 패턴을 찾는 데 활용된다.
정식 검증
formal-verification
소프트웨어가 설계 명세대로 정확히 동작함을 수학적 증명을 통해 확인하는 기법이다. 테스트와 달리 특정 조건에서의 오류 부재를 논리적으로 보장할 수 있으나 과정이 매우 복잡하여 AI의 보조가 기대되는 분야이다.
정신 모델
mental-model
현실 세계가 어떻게 작동하는지에 대해 개인이 가진 사고 체계나 심리적 시뮬레이션이다. 새로운 상황에서 결과를 예측하고 전략을 세우는 데 사용되는 인지적 도구이다.
정적 분석
static-analysis
프로그램을 실행하지 않고 소스 코드 자체를 분석하여 오류나 잠재적인 문제를 찾아내는 기법이다. Tailwind CSS는 이 기법을 통해 사용된 클래스만 추출하여 최종 CSS 파일을 생성한다.
정형 언어
formal-language
수학적 논리나 프로그래밍 언어처럼 엄격한 문법과 의미 규칙을 가진 언어이다. 언어 모델의 모호한 추론을 정밀하게 검증하는 도구로 쓰인다.
제로 지식
zero-knowledge
어떤 정보가 참이라는 사실 외에 그 정보의 구체적인 내용을 노출하지 않는 방식이다. 여기서는 모델 검증 시 고객의 실제 학습 데이터를 직접 확인하거나 사용하지 않고도 모델의 특성을 분석할 수 있음을 의미한다. 데이터 보안과 개인정보 보호에 매우 중요하다.
제로 카피
zero-copy
데이터를 한 메모리 영역에서 다른 영역으로 복사하지 않고 직접 액세스하는 기술이다. 대규모 데이터셋을 처리할 때 CPU와 메모리 오버헤드를 획기적으로 줄여 학습 속도를 높인다. 스토리지와 학습 프레임워크 간의 데이터 전송 효율을 극대화하는 데 사용된다.
제어 평면
control-plane
네트워크 시스템에서 데이터가 어디로 전송될지 결정하는 로직과 관리 기능을 담당하는 영역이다. 실제 사용자 데이터를 처리하는 데이터 플레인(Data Plane)에 명령을 내리는 두뇌 역할을 수행한다.
조기 접근
early-access
새로운 기능이나 도구가 일반 대중에게 공개되기 전에 특정 사용자 그룹에게 먼저 제공되어 테스트하고 피드백을 줄 수 있도록 하는 권한이다. AI 분야에서는 최신 모델이나 API 기능을 먼저 활용해 시장 경쟁력을 확보하는 데 중요한 역할을 한다.
조기 종료
early-stopping
모델 학습 중 검증 손실이 더 이상 개선되지 않을 때 학습을 미리 중단하는 규제 기법이다. 과적합을 방지하고 불필요한 계산 자원 낭비를 줄이는 데 사용된다. 특정 에폭 동안 성능 향상이 없으면 학습을 멈추도록 설정한다.
중간 추론
intermediate-reasoning
최종 결과 도출 전 단계에서 논리적 근거를 생성하거나 특정 지식을 반영하는 과정이다. 이 연구에서는 전문가의 임상 지식을 이 단계에 주입하여 AI의 판단 근거를 강화하고 정확도를 높였다.
중간 표현
ir
소스 코드를 기계어로 번역하는 과정에서 생성되는 중간 단계의 코드 형태이다. LLVM IR 등으로 변환하면 다양한 하드웨어 아키텍처에 맞춰 최적화된 기계어를 생성하기 용이해진다.
중성 원자
neutral-atom
전하를 띠지 않는 원자를 레이저 집게로 고정하는 방식이다. 원자 간 상호작용을 조절하기 쉬워 대규모 양자 컴퓨터 구현을 위한 유망한 후보 기술로 꼽힌다.
중첩 학습
nested-learning
딥러닝 아키텍처 내에서 학습 프로세스가 계층적으로 구성되는 방식이다. 모델의 내부 구조적 특성이 최종적인 학습 성능과 일반화 능력에 미치는 영향을 분석하는 연구 주제이다.
증류 모델
distilled-model
거대한 원본 모델의 지식을 더 작고 효율적인 모델로 전이시킨 형태이다. FLUX.2 [dev]와 같은 증류 모델은 원본의 성능을 최대한 유지하면서도 추론 속도를 획기적으로 높이고 자원 소모를 줄여 실시간 서비스에 적합하다.
지각 능력
sentience
단순한 정보 처리를 넘어 고통, 즐거움, 공포와 같은 주관적 감각을 경험할 수 있는 능력이다. 윤리학에서 도덕적 고려의 대상이 되는 핵심 기준으로 간주된다.
지분 회수
equity-clawback
부여된 주식 지분을 특정 조건 위반 시 회사가 다시 가져가는 권리이다. OpenAI는 퇴사자가 회사에 비판적인 발언을 할 경우 지분을 회수하는 조항을 NDA에 포함시켜 논란이 되었다. 이는 직원의 경제적 이해관계를 이용해 입을 막는 강력한 수단으로 작용했다.
지식 공학
knowledge-engineering
인간의 전문 지식을 컴퓨터가 처리할 수 있는 형태의 데이터나 규칙으로 변환하여 지능형 시스템을 구축하는 기술이다. 자율주행에서는 인간 운전자의 판단 기준과 도로 규칙을 데이터 구조에 반영하는 과정을 의미한다.
지식 망각
unlearning
모델에서 특정 지식이나 위험한 정보를 선택적으로 제거하는 기술이다. 특정 지식을 삭제했을 때 관련 없는 다른 지식까지 함께 손실되는 '파급 효과(Ripple Effect)'를 관리하는 것이 핵심 과제이다.
지식 수집
knowledge-ingestion
파편화된 비정형 데이터(문서, 드라이브 등)를 AI가 처리하기 쉬운 구조화된 형태로 변환하여 시스템에 입력하는 과정이다. 사내 지식의 사일로 현상을 방지하고 AI 답변의 품질을 결정짓는 핵심 단계다.
지식 접지
knowledge-grounding
AI 모델의 답변을 검증된 외부 데이터 소스나 지식 베이스에 기반하도록 제한하는 기술이다. 모델 내부의 파라미터에만 의존하지 않고 실제 사실에 근거하게 함으로써 환각 현상을 억제한다.
지식 증류
knowledge-distillation
거대 모델(Teacher)이 학습한 지식을 작은 모델(Student)에게 전달하여, 작은 모델이 거대 모델의 성능을 모방하도록 만드는 기법이다. 이를 통해 연산 자원이 제한된 환경에서도 고성능 AI를 사용할 수 있게 한다.
지식 증류
distillation
거대 모델(Teacher)의 지식을 작은 모델(Student)로 전이시키는 기법이다. 성능 손실을 최소화하면서 모델 크기를 줄여 자체 서버에서 저비용으로 운영할 수 있게 한다.
지연 시간
latency
사용자의 요청이 발생한 시점부터 시스템이 응답을 완료할 때까지 걸리는 시간을 뜻한다. LLM 애플리케이션에서는 모델의 추론 시간과 API 통신 시간이 주요 요인이며, 이를 줄이는 것이 사용자 경험 향상에 핵심적이다.
지적 자극
intellectual-stimulation
뇌의 인지 기능을 활성화하고 호기심을 유발하는 외부적 도전이나 새로운 정보의 유입이다. 아동의 발달 단계에 맞는 적절한 자극은 학습 동기를 유지하고 권태를 방지하는 역할을 한다.
집계 통계
aggregate-statistics
개별 데이터 포인트를 합산하여 평균이나 중앙값 등으로 요약한 수치다. 전체적인 경향을 파악하기 좋으나 특정 하위 그룹에서 발생하는 심각한 오류나 편향을 가릴 수 있다는 단점이 있다.
차가 경매
second-price-auction
가장 높은 가격을 제시한 입찰자가 낙찰되되 실제 지불 가격은 두 번째로 높은 입찰가로 결정되는 경매 방식이다. 입찰자가 자신의 실제 가치를 정직하게 입찰하도록 유도하는 특성이 있어 이론적으로 널리 연구된다.
채팅 압축
chat-compaction
긴 대화 기록을 짧은 요약본으로 변환하여 모델의 처리 용량 내에 유지시키는 기술이다. 대화의 연속성은 보장하지만 세부적인 논리나 미묘한 맥락이 삭제되는 부작용이 있다.
최적 운송
optimal-transport
최적 운송은 자원을 한 분포에서 다른 분포로 가장 효율적으로 이동시키는 방법을 연구하는 수학 분야이다. 확률 분포 간의 거리를 정의하는 바세르슈타인 거리의 기초가 되며, 최근 딥러닝에서는 데이터 정렬, 도메인 적응, 분포 근사 오차 계산 등 다양한 영역에서 핵심 도구로 쓰인다.
최적 정책
optimal-policy
특정 환경에서 에이전트가 얻을 수 있는 누적 보상의 기대치를 최대화하는 행동 규칙의 집합이다. 모든 상태에서 어떤 행동을 취하는 것이 가장 유리한지를 정의하며, 보상 구조와 할인 계수에 따라 그 형태가 완전히 달라질 수 있는 강화학습의 최종 목표이다.
추론 경로
reasoning-pathway
모델이 답을 도출하기 위해 거치는 논리적 단계들의 집합으로, 입력의 복잡도와 구조에 따라 활성화되는 경로의 깊이와 정교함이 달라진다.
추론 모델
thinking-model
답변을 내놓기 전 단계에서 복잡한 논리적 사고 과정을 거치는 고성능 AI 모델이다. 일반 모델보다 정확도가 높지만 더 많은 시간과 연산 자원을 필요로 하는 것이 특징이다.
추론 모델
reasoning-model
복잡한 논리적 단계와 사고 과정을 거쳐 정답을 도출하도록 설계된 AI 모델이다. 단순한 다음 단어 예측을 넘어 문제 해결을 위한 내부적인 사고 체인을 형성하는 것이 특징이다.
추론 비용
inference-cost
AI 모델이 사용자의 질문에 답변을 생성할 때 발생하는 컴퓨팅 자원 비용으로 모델의 크기와 생각의 깊이에 비례하여 증가한다.
추론 속도
inference-speed
학습된 AI 모델이 새로운 입력 데이터에 대해 결과를 생성해내는 속도를 의미하며, 비디오 생성에서는 초당 프레임(FPS)이나 전체 생성 시간으로 측정된다.
추론 스택
inference-stack
학습된 모델을 실행하여 결과를 내놓기까지 필요한 하드웨어 및 소프트웨어 인프라 전체를 의미한다. 모델 가중치가 같더라도 이 스택의 최적화 수준에 따라 속도와 정확도 등 실행 성능이 달라진다.
추론 엔진
inference-engine
학습된 AI 모델을 실제로 실행하여 결과값을 내놓는 소프트웨어 시스템입니다. Together AI는 대규모 모델을 빠르고 효율적으로 서빙하기 위해 최적화된 추론 인프라를 제공합니다.
추론 엔진
reasoning-engine
주어진 목표를 달성하기 위해 논리적으로 단계를 계획하고 판단하는 AI의 핵심 사고 모듈이다. 에이전트 프레임워크에서 LLM이 주로 이 역할을 수행한다.
추론 작업
reasoning-task
단순한 텍스트 생성이나 요약을 넘어 논리적 단계에 따라 복잡한 문제를 해결하거나 결론을 도출하는 고차원적 AI 작업이다. 수학 문제 풀이, 복잡한 코드 디버깅, 다단계 전략 수립 등이 이에 해당한다.
추론 토큰
thinking-tokens
LLM이 최종 답변을 내놓기 전 내부적으로 생성하는 중간 추론 과정의 토큰이다. 모델이 복잡한 문제를 단계별로 사고하게 함으로써 논리적 정확도와 문제 해결 능력을 높이는 데 기여한다.
추론 토큰
inference-token
AI 모델이 사용자 요청에 응답할 때 생성하는 데이터 단위로, 모델의 실행 비용과 수익성을 측정하는 핵심 지표임.
측도 수송
measure-transport
단순한 기준 분포(예: 가우시안)를 결정론적 사상을 통해 복잡한 타겟 분포로 변환하는 수학적 프레임워크이다. 이를 통해 복잡한 확률 분포에서의 샘플링이나 밀도 추정을 효율적으로 수행할 수 있다.
칸반 보드
kanban-board
작업의 흐름을 시각화하여 관리하는 도구로, 각 작업을 '할 일', '진행 중', '완료' 등의 상태로 구분하여 표시한다. 에이전트의 복잡한 작업 단계를 직관적으로 파악하게 해준다.
커밋 기록
commit-history
소프트웨어 개발 과정에서 변경 사항을 기록한 타임라인으로, 프로젝트의 정통성과 기여자를 확인하는 핵심적인 증거 자료가 된다.
코드 리뷰
code-review
작성된 소스 코드를 다른 개발자가 읽고 확인하여 오류를 찾거나 개선 사항을 제안하는 과정이다. 소프트웨어의 안정성을 높이고 팀 내 지식을 공유하는 중요한 역할을 한다.
코드 비교
diff
두 개의 텍스트 파일이나 소스 코드 간의 차이점을 찾아내고 시각화하는 도구 또는 과정이다. 프로그래밍에서 코드의 변경 사항을 추적하거나 서로 다른 버전의 코드를 비교할 때 필수적으로 사용된다. 이번 사건에서는 두 기업의 코드가 바이트 단위로 일치함을 증명하는 핵심 수단이 됐다.
코드 액트
code-act
에이전트가 자연어 설명 대신 실행 가능한 코드를 직접 생성하고 실행하여 작업을 완수하는 기법이다. API 호출이나 데이터 처리 시 텍스트 기반 방식보다 훨씬 높은 정확도와 유연성을 제공한다.
코드 축소
minification
코드의 기능은 유지하면서 파일 크기를 최소화하는 과정이다. 변수명 단축, 공백 제거 등을 통해 웹 페이지 로딩 속도를 향상시키며 프로덕션 배포 시 필수적인 단계이다.
쿠다 커널
cuda-kernel
NVIDIA GPU에서 병렬로 실행되는 함수 단위이다. 모델 실행 초기 단계에서 이 커널들이 컴파일되거나 로드되는 과정에서 일시적인 지연(Latency)이 발생할 수 있다.
쿱만 이론
koopman-theory
복잡한 비선형 동역학 시스템을 무한 차원의 선형 공간으로 투영하여 선형적으로 분석할 수 있다는 수학적 이론이다.
쿼럼 합의
quorum-consensus
분산 시스템에서 데이터의 일관성을 보장하기 위해 과반수 이상의 노드가 동의해야 작업을 승인하는 방식이다. ProbOS에서는 에이전트들의 결과값 중 다수결을 따르는 신뢰성 확보 수단으로 쓰인다.
탄소 포집
carbon-sequestration
대기 중의 이산화탄소를 흡수하여 저장하는 과정이다. 미생물의 대사 활동이 이 과정에서 핵심 역할을 수행하며 기후 변화 대응의 주요 연구 분야이다.
터보 모델
turbo-model
적은 수의 추론 단계(Step)만으로도 고품질의 결과물을 생성할 수 있도록 최적화된 경량화 모델이다. 주로 실시간 생성이나 빠른 반복 작업이 필요한 환경에서 사용된다.
턴제 전투
turn-based-combat
플레이어와 적이 순서를 번갈아 가며 행동을 수행하는 게임 메커니즘이다. AI가 각 턴의 상태를 정확히 계산하고 서술해야 하므로 높은 논리적 일관성이 요구된다.
텐서 검색
tensor-search
다차원 배열인 텐서를 사용하여 데이터 간의 복잡한 관계를 계산하고 검색하는 고도화된 방식이다. 단순 유사도를 넘어 정교한 머신러닝 랭킹 모델을 실시간으로 적용할 때 사용된다.
텐서 매핑
tensor-mapping
서로 다른 모델 아키텍처나 포맷 간에 가중치 데이터를 올바른 위치와 구조로 연결하는 과정으로, 모델 변환 시 구조적 호환성을 확보하는 핵심 단계이다.
텐서 연산
tensor-operations
다차원 배열인 텐서를 이용한 수학적 계산 과정이다. Vespa 내에서 복잡한 랭킹 모델을 실행하거나 데이터 간의 관계를 계산할 때 핵심적인 역할을 수행한다.
텐서 연산
tensor-computing
다차원 배열인 텐서를 대상으로 하는 수학적 계산 과정이다. 딥러닝의 핵심인 가중치 업데이트와 데이터 처리가 모두 이 연산을 통해 이루어지며, 프레임워크의 효율성을 결정짓는 요소이다.
토큰 비용
token-cost
AI 모델이 텍스트를 처리하는 최소 단위인 토큰당 발생하는 과금 비용이다. 소형 모델은 대형 모델보다 토큰당 비용이 수천 배 저렴하여 경제적이다.
토큰 소모
token-burn
AI 모델을 사용할 때 발생하는 비용이나 처리 용량의 낭비를 의미한다. 특히 에이전트가 무한 루프에 빠지거나 불필요하게 긴 컨텍스트를 반복해서 읽을 때 급격히 증가한다.
토큰 소비
token-consumption
LLM이 텍스트를 처리하는 기본 단위인 토큰의 사용량이다. 에이전틱 시스템은 반복적인 추론과 긴 컨텍스트 유지로 인해 일반적인 챗봇보다 훨씬 많은 토큰을 소비하며 이는 직접적인 비용 상승으로 이어진다.
토큰 순환
token-rotation
보안 강화를 위해 사용 중인 인증 토큰을 정기적으로 또는 특정 조건에 따라 자동으로 교체하는 프로세스이다. 유출된 토큰의 유효 기간을 단축시켜 보안 사고의 피해를 최소화하는 역할을 한다.
토큰 전파
token-propagation
에이전트의 반복적인 도구 호출 과정에서 이전 단계의 질문과 답변이 다음 단계의 입력으로 계속 누적되어 전달되는 현상이다. 이를 방치하면 컨텍스트가 기하급수적으로 늘어나 비용과 지연 시간이 급증한다.
토큰 팽창
token-bloat
대화가 길어지거나 불필요한 정보가 컨텍스트에 계속 누적되어 모델 호출 시마다 사용하는 토큰 수가 급격히 늘어나는 현상이다. 이는 비용 증가와 지연 시간 악화의 원인이 된다.
토큰 확률
token-probability
주어진 문맥에서 다음에 올 가장 적절한 단어나 문자의 확률을 계산하는 방식이다. 현재 LLM이 문장을 생성하는 핵심적인 통계적 메커니즘이다.
토킹 헤드
talking-head
인물의 머리와 어깨 윗부분만 화면에 나오며 직접 말하는 형식의 영상이다. AI 아바타 기술과 결합되어 실제 촬영 없이도 자연스러운 전달력을 확보하는 데 사용된다. 크리에이터의 외모를 복제한 아바타가 텍스트를 읽어주는 방식으로 제작 효율을 높인다.
특징 결합
feature-fusion
서로 다른 소스나 방식으로 생성된 특징 벡터들을 하나로 합쳐 모델의 입력으로 사용하는 기법이다. 임베딩 벡터와 원본 수치 데이터를 결합하여 정보의 풍부함을 더할 때 사용된다.
특징 공간
feature-space
데이터가 가진 특징들이 구성하는 다차원 공간을 의미한다. 텍스트 데이터에서는 어휘의 종류와 빈도가 이 공간의 차원과 구조를 결정하는 핵심 요소가 된다.
특징 추출
feature-extraction
이미지나 문서에서 핵심적인 시각적 정보를 수치화된 벡터로 변환하는 과정이다. 딥러닝 모델이 데이터의 고유한 특성을 추출하여 검색이나 분류에 활용할 수 있게 한다. 이 프로젝트에서는 CNN을 사용하여 CAD 도면의 기하학적 특징을 추출한다.
파일 잠금
file-locking
여러 프로세스나 스레드가 동시에 같은 파일에 접근하여 데이터를 수정할 때 발생할 수 있는 충돌을 방지하기 위한 메커니즘이다. 한 프로세스가 파일을 사용 중일 때 다른 프로세스의 접근을 제한하거나 대기하게 함으로써 데이터의 일관성과 무결성을 보장한다. 공유 캐시 환경에서 필수적인 동기화 기술이다.
퍼지 매칭
fuzzy-matching
정확히 일치하지 않는 문자열 간의 유사도를 계산하여 가장 근접한 데이터를 찾아내는 기법이다. 오타나 표기법 차이가 있는 텍스트 데이터 간의 연결성을 확보하는 데 필수적이다.
퍼지 매칭
fuzzy-match
새로 번역할 문장이 기존 번역 메모리에 저장된 문장과 100% 일치하지는 않지만 일정 수준 이상의 유사성을 가질 때 이를 찾아내는 기술이다.
페일 오픈
fail-open
시스템 장애 발생 시 보안이나 엄격한 규칙을 적용하기보다 서비스의 연속성을 위해 접근을 허용하거나 기본 상태로 유지하는 설계 원칙이다. 설정 오류로 인해 전체 트래픽이 차단되는 것을 막는 역할을 한다.
평판 점수
reputation-points
Stack Overflow 커뮤니티 내에서 사용자의 기여도와 신뢰도를 나타내는 점수 시스템이다. 답변 채택이나 추천을 통해 획득하며 특정 점수 이상이어야 투표나 채팅 참여 등의 권한이 부여된다.
폐쇄 루프
closed-loop
시스템의 출력이 다시 입력에 영향을 주어 제어되는 순환 구조로, AI에서는 감지, 판단, 실행이 중단 없이 연결되어 스스로 최적화되는 상태를 의미한다.
포즈 추정
pose-estimation
이미지나 영상에서 사람의 주요 관절 위치(키포인트)를 찾아내어 신체의 자세와 움직임을 파악하는 컴퓨터 비전 기술이다.
폭발 반경
blast-radius
보안 사고 발생 시 그 영향이 미치는 논리적 범위를 의미한다. AI 에이전트의 경우 부여된 권한이 많을수록 사고 발생 시 데이터 유출이나 시스템 파괴의 범위가 기하급수적으로 커진다.
표준 준수
spec-compliant
소프트웨어가 특정 기술 표준이나 명세(예: HTML5 표준)에 정의된 모든 규칙과 요구사항을 정확하게 따르는 상태를 의미한다. 복잡한 표준일수록 이를 완벽히 구현하기 위해 정교한 검증 과정이 필요하다.
표현 정렬
representation-alignment
서로 다른 AI 모델들이 데이터를 내부적으로 처리할 때 형성하는 벡터 공간의 구조가 유사해지는 현상이다. 성능이 뛰어난 모델일수록 데이터의 본질적인 특징을 유사하게 파악한다는 것을 의미한다.
표현 정리
representer-theorem
재생 커널 힐베르트 공간에서의 최적화 문제의 해가 훈련 데이터 포인트들의 커널 함수 선형 결합으로 표현될 수 있음을 보장하는 정리이다. 무한 차원 문제를 유한 차원으로 변환해준다.
품사 태깅
part-of-speech-tagging
문장 내 단어의 문법적 역할(명사, 동사 등)을 식별하여 표시하는 과정으로, 자연어 이해의 핵심적인 전처리 단계이다.
품질 태그
quality-tag
이미지 생성 시 결과물의 해상도나 디테일을 높이기 위해 모델 학습 단계에서 사용된 특정 키워드이다. masterpiece, best quality와 같은 단어들이 대표적이며, 모델마다 최적화된 태그가 다르다.
퓨샷 러닝
few-shot-learning
매우 적은 수의 예시 데이터만으로도 모델이 새로운 작업을 수행할 수 있도록 학습시키는 기법이다. 문서 처리에서 새로운 양식에 빠르게 적응할 때 유용하다.
피칭 각도
pitching-angle
비행체의 앞부분이 위아래로 기울어지는 각도를 의미한다. 초소형 로봇이 공중제비를 돌거나 급정거를 하기 위해서는 이 피칭 각도를 매우 빠르고 정교하게 제어해야 한다.
하위 집단
sub-population
전체 데이터셋 내에서 특정 공통 속성(예: 나이, 성별, 특정 병원 데이터)을 공유하는 작은 그룹이다. 모델이 전체적으로는 우수하더라도 특정 하위 집단에 대해서만 차별적으로 낮은 성능을 보일 수 있다.
한계 비용
marginal-cost
제품 한 단위를 추가로 생산할 때 발생하는 비용이다. AI 서비스에서는 사용자 요청마다 발생하는 토큰 사용료가 이에 해당하며, 기존 소프트웨어와 달리 0에 수렴하지 않아 수익 구조에 큰 영향을 미친다.
할인 계수
discount-factor
미래에 받을 보상을 현재 가치로 환산할 때 사용하는 0과 1 사이의 값(γ)이다. 미래 보상의 불확실성을 반영하며, 벨만 연산자가 수축 사상이 되도록 만드는 핵심적인 역할을 한다.
함수 호출
function-calling
언어 모델이 사용자의 요청에 따라 특정 API나 함수를 실행하기 위해 필요한 인자값과 함수 이름을 구조화된 데이터(JSON 등)로 생성하는 능력이다. 외부 도구와의 연동을 가능케 하는 핵심 기술이다.
합의 오차
consensus-error
분산 환경에서 각 에이전트가 보유한 로컬 변수 값이 전체 네트워크의 평균값 또는 목표값과 일치하지 않아 발생하는 차이이다. 알고리즘의 수렴 안정성을 저해하는 주요 요인이다.
행동 루프
action-loop
센서 입력부터 판단, 실행, 결과 피드백까지 이어지는 일련의 반복 과정을 의미한다. 에이전트가 환경의 변화에 실시간으로 대응하며 목표를 달성하게 하는 핵심 메커니즘이다. 이 루프의 지연 시간을 줄이고 정확도를 높이는 것이 자율 시스템의 성능을 결정짓는다.
행동 복제
behavior-cloning
전문가의 행동 데이터를 입력값과 출력값의 쌍으로 간주하여 지도 학습 방식으로 정책을 학습하는 모방 학습의 가장 기본적인 기법이다.
행동 포화
action-saturation
에이전트의 출력값이 허용된 범위의 최댓값이나 최솟값에 고정되는 현상이다. 자율주행에서는 핸들을 끝까지 꺾거나 가속 페달을 꽉 밟는 등 불안정한 제어로 나타난다.
허프 변환
hough-transform
이미지 내의 점들을 연계하여 직선이나 원 같은 수학적 도형을 찾아내는 알고리즘이다. 에지 검출 결과에서 기타 줄과 같은 선형 구조를 추출하여 기하학적 특징을 파악하는 데 핵심적인 역할을 한다.
혁신 지표
innovation-metrics
조직이 새로운 아이디어, 제품 또는 프로세스를 얼마나 효과적으로 창출하고 구현하는지 측정하는 기준이다. 본문에서는 AI 도입 후 혁신 역량이 57% 증가했음을 나타내는 근거로 사용되었다.
현실 격차
reality-gap
시뮬레이션 환경에서 학습된 AI 모델이 실제 물리 세계에 배포되었을 때 성능이 저하되는 현상이다. 시뮬레이터의 물리 법칙이나 센서 데이터가 실제와 완벽히 일치하지 않기 때문에 발생하며 월드 모델이 해결해야 할 주요 과제이다.
혈액 도말
blood-smear
현미경 관찰을 위해 유리 슬라이드 위에 혈액을 얇게 펴 바른 표본으로, 세포의 모양과 수를 분석하여 질병을 진단하는 기초적인 검사 방법임.
형태 언어
shape-language
디자인에서 선, 모양, 형태를 통해 특정 감정이나 의미를 전달하는 개념이다. 캐릭터와 배경의 형태를 통일하면 작품 전체의 시각적 일관성과 세계관의 개연성을 강화할 수 있다.
혼동 행렬
confusion-matrix
분류 모델의 예측 결과와 실제 정답을 대조하여 정답과 오답의 유형을 표 형태로 시각화한 성능 평가 도구이다.
혼합 전략
mixed-strategy
게임 이론에서 플레이어가 가능한 여러 행동 중 하나를 특정 확률 분포에 따라 무작위로 선택하는 전략이다. 스포츠 분석에서 단순한 기대값 극대화가 아닌 상대의 대응을 고려한 최적 의사결정에 필요하다.
확률 과정
stochastic-process
시간의 흐름에 따라 확률적으로 변하는 변수들의 집합을 의미한다. 주가 변동이나 환자의 상태 변화처럼 시간에 따라 무작위하게 변하는 동적 데이터를 수학적으로 기술하는 도구이다.
확산 모델
diffusion-model
데이터에 노이즈를 추가했다가 다시 제거하는 과정을 학습하여 고품질 데이터를 생성하는 모델이다. 최근 이미지 생성뿐만 아니라 특정 조건의 데이터 생성에서 자기회귀 모델보다 효율적임이 밝혀졌다.
확장 사고
extended-thinking
모델이 답변을 내놓기 전 내부적으로 더 긴 추론 과정을 거치도록 하는 기능. 복잡한 논리 전개가 필요한 수학이나 코딩 문제 해결에 주로 사용된다.
환각 감지
hallucination-detection
생성형 AI가 사실과 다른 정보를 생성하는 현상을 식별하는 기술이다. AI 기반 테스트 도구의 신뢰성을 확보하기 위해 필수적인 요소이다.
환각 현상
hallucination
AI 모델이 사실과 다르거나 근거 없는 내용을 그럴듯하게 생성하는 현상이다. RAG 시스템에서는 검색 실패나 검색된 정보에 대한 잘못된 해석으로 인해 발생하며, 이를 세분화하여 진단하는 것이 운영의 핵심이다.
횔더 연속
hoelder-continuous
함수의 변화율이 특정 거듭제곱 법칙에 의해 제한되는 연속성의 한 종류이다. 립시츠 연속보다 일반적인 개념으로, 신호의 매끄러운 정도를 수학적으로 정의할 때 사용된다.
후회 경계
regret-bounds
온라인 학습 알고리즘의 성능과 사후적으로 가장 좋은 고정된 예측 모델의 성능 차이의 상한선을 의미한다. 이 값이 작을수록 알고리즘이 최적의 선택에 가깝게 동작함을 보장한다.
희소 보상
sparse-reward
에이전트가 행동을 취해도 보상이 즉각적으로 주어지지 않고 아주 가끔 발생하는 환경을 의미한다. 게임의 끝에서만 보상이 주어지는 경우 에이전트가 어떤 행동이 유익했는지 판단하기 어려워 학습이 매우 힘들어지며, 이를 해결하기 위해 보상 설계나 탐험 전략이 중요해진다.
희소 회귀
sparse-regression
수많은 독립 변수 중 종속 변수에 실제로 영향을 미치는 소수의 변수만을 선택하여 모델을 구축하는 회귀 분석 기법이다. 모델의 해석력을 높이고 과적합을 방지하는 데 필수적이다.
가상 스레드
virtual-threads
자바 21에서 도입된 경량 스레드로, 적은 자원으로 수만 개의 동시 작업을 효율적으로 처리할 수 있게 해준다. 대규모 이미지 인덱싱과 같은 I/O 집약적 작업의 성능을 높이는 데 핵심적인 역할을 한다.
가속 컴퓨팅
accelerated-computing
CPU와 같은 범용 프로세서 대신 GPU 등 특정 작업에 최적화된 하드웨어를 사용하여 연산 속도를 획기적으로 높이는 방식.
거짓 이분법
false-dichotomy
실제로는 다양한 대안이 존재함에도 불구하고 오직 두 가지 상반된 선택지만이 있는 것처럼 제시하는 논리적 오류이다. 교육 담론에서 '스크린 금지' 대 '스크린 중독'의 대립이 대표적인 예시이다.
결합 친화도
binding-affinity
약물 분자가 특정 타겟 단백질에 얼마나 강하게 결합하는지를 나타내는 척도로, 전통적인 신약 개발에서 가장 먼저 고려되는 지표 중 하나이다.
경로 의존성
path-dependency
과거의 결정이나 사건이 현재와 미래의 선택지에 제약을 가하는 현상으로 AI의 기억이 사용자의 향후 반응을 결정짓는 구조를 설명한다.
고객 세분화
customer-segmentation
유사한 특성을 가진 고객들을 그룹화하여 맞춤형 마케팅을 가능하게 하는 기법이다. 클러스터링 알고리즘이 주로 사용된다.
골든 코멘트
golden-comment
숙련된 인간 리뷰어가 반드시 지적해야 한다고 합의된 정답 코멘트 집합이다. AI 모델의 성능을 객관적으로 평가하기 위한 기준점(Ground Truth) 역할을 한다.
공간 생물학
spatial-biology
조직 내 세포의 위치 정보를 유지하면서 유전자나 단백질의 발현을 분석하는 학문이다. 데이터 구조가 복잡하여 고도의 AI 추론 능력이 요구되는 첨단 연구 분야이다.
공조 시스템
hvac
난방, 통풍, 공기 조절(Heating, Ventilation, and Air Conditioning)의 약자로 데이터 센터의 열기를 식히는 핵심 인프라다. 데이터 센터 운영 인력의 상당수가 이 시스템 유지보수를 담당한다.
과학 자동화
automated-science
AI와 로봇 기술을 활용하여 가설 설정, 실험 설계, 데이터 분석, 논문 작성 등 과학 연구의 전 과정을 자동화하려는 시도다. 효율성은 높일 수 있으나 연구의 진정성 훼손 우려가 있다.
광학 컴퓨팅
optical-computing
전기 신호 대신 빛(광자)을 이용해 연산을 수행하는 기술이다. 기존 실리콘 칩보다 속도가 빠르고 열 발생이 거의 없어 전력 효율을 수십 배에서 수백 배까지 높일 수 있는 차세대 하드웨어 기술이다.
교차 어텐션
cross-attention
텍스트 프롬프트와 이미지 데이터를 결합하여 연산하는 핵심 메커니즘으로, 생성 품질과 속도에 직접적인 영향을 미친다.
국소 모델링
local-modeling
전체 데이터셋이 아닌 특정 지역이나 좁은 범위의 데이터만을 사용하여 모델을 학습시키는 방식이다. 해당 지역의 고유한 특성을 잘 반영할 수 있지만, 다른 지역으로의 일반화 성능은 낮을 수 있다.
근사 정확도
approximation-accuracy
특정 모델이 목표로 하는 실제 함수를 얼마나 정밀하게 흉내 낼 수 있는지를 나타내는 척도이다. 보통 오차 epsilon으로 표현하며 이 값이 작을수록 실제 함수에 더 가깝게 모사함을 의미한다.
기계 임대료
machine-rents
인간의 노동 투입 없이 자율적인 기계와 AI 시스템의 가동만으로 발생하는 경제적 잉여 가치이다. 포스트 자본주의 체제에서 보편적 기본 배당을 위한 핵심적인 세원 및 재분배의 근거가 된다.
기능 플래그
feature-flag
코드 수정이나 재배포 없이 특정 기능을 활성화하거나 비활성화할 수 있는 기술적 스위치다. 특정 사용자 그룹에게만 기능을 노출하거나 장애 시 즉시 기능을 차단하는 용도로 사용된다.
노동 생산성
labor-productivity
노동 시간당 산출되는 재화나 서비스의 양을 의미한다. AI가 작업 시간을 단축하고 성공률을 높임으로써 이 지표를 상승시키는 것이 경제 성장의 핵심 동력이 된다.
다중 테넌시
multi-tenancy
단일 소프트웨어 인스턴스나 인프라에서 여러 사용자나 팀을 독립적으로 지원하는 아키텍처이다. 각 팀의 자원 사용을 격리하고 보안을 유지하면서 물리적 자원을 효율적으로 공유할 수 있게 한다.
단위 경제성
unit-economics
제품 한 단위를 판매하거나 서비스 한 건을 제공할 때 발생하는 수익과 비용의 관계이다. AI에서는 한 번의 쿼리 처리에 드는 비용이 수익보다 높은 적자 구조를 설명하는 데 쓰인다.
단일 테넌시
single-tenancy
하나의 소프트웨어 인스턴스가 단일 고객에게만 서비스를 제공하는 아키텍처이다. 데이터가 물리적 또는 논리적으로 완전히 격리되어 보안성과 커스터마이징 측면에서 유리하다.
대량 영양소
macros
탄수화물, 단백질, 지방의 3대 영양소를 의미하며, 개인의 신체 목표에 따라 이들의 섭취 비율을 계산하여 식단을 구성하는 핵심 지표이다.
독점 자본가
robber-barons
19세기 미국에서 부도덕한 방법으로 막대한 부를 축적한 기업가들을 지칭하는 용어로 현재의 빅테크 기업들이 받는 사회적 비판을 상징한다.
동일 연산량
iso-flop
서로 다른 모델의 성능을 비교할 때 총 부동 소수점 연산량(FLOPs)을 동일하게 맞춘 조건이다. 모델의 구조적 효율성을 공정하게 평가하기 위한 표준 지표로 사용된다.
동작 모델링
behavioral-modeling
시스템의 입력값에 따른 출력값의 변화를 관찰하여 해당 시스템의 작동 방식을 재현하는 기술이다. 기타 앰프의 경우, 전기 신호의 왜곡과 증폭 특성을 신경망이 학습하여 실제 하드웨어와 유사한 소리를 내도록 만든다.
동적 계획법
dynamic-programming
복잡한 문제를 여러 개의 작은 하위 문제로 나누어 해결하는 최적화 방법론이다. 제어 이론에서는 벨만 방정식을 통해 시간에 따라 변화하는 시스템의 최적 의사결정 경로를 찾는 데 핵심적으로 사용된다.
동적 라우팅
dynamic-routing
입력된 쿼리의 특성에 따라 적절한 모델이나 경로를 실시간으로 선택하는 기술이다. 비용이 비싼 고성능 모델과 저렴한 모델을 혼합 사용하여 효율성을 극대화한다.
동적 양자화
dynamic-quantization
모델의 각 레이어나 가중치 특성에 따라 양자화 파라미터를 가변적으로 조정하는 방식이다. 중요한 가중치에는 더 많은 비트를 할당하여 성능 저하를 최소화한다.
랜덤 액세스
random-access
데이터의 물리적 위치와 상관없이 임의의 위치에 있는 데이터를 즉각적으로 읽거나 쓰는 방식이다. 순차적 스캔에 최적화된 기존 포맷과 달리, AI 학습 시 셔플링이나 RAG의 특정 행 추출에 필수적이다. I/O 병목을 줄여 GPU 연산 자원의 활용도를 극대화하는 성능 지표이다.
레벨 시프터
level-shifter
서로 다른 전압 레벨을 사용하는 회로 간에 신호를 안전하게 전달하기 위해 전압을 변환해주는 장치이다.
롤링 리저브
rolling-reserve
결제 대금의 일정 비율을 일정 기간 동안 지급 보류하는 리스크 관리 방식이다. 향후 발생할 수 있는 환불이나 분쟁(Dispute)에 대비하여 플랫폼의 재무적 안전성을 확보하는 데 사용된다.
롤링 윈도우
rolling-window
고정된 시각이 아닌 현재 시점부터 일정 시간 전까지의 누적 사용량을 실시간으로 계산하는 방식이다. 예를 들어 5시간 롤링 윈도우는 지난 5시간 동안의 사용량을 기준으로 제한 여부를 결정한다.
리뷰 스키마
review-schema
데이터를 평가하거나 검토할 때 따르는 구조화된 규칙이나 형식의 틀이다. 어떤 항목을 어떤 기준으로 점수화하거나 서술할지 정의함으로써 평가의 일관성과 재현성을 보장하는 역할을 한다.
마린 스노우
marine-snow
수중에서 눈처럼 내리는 유기물 파편으로 영상에서 노이즈를 유발한다. 이는 객체의 윤곽을 흐리게 만들어 컴퓨터 비전 모델의 탐지 정확도를 떨어뜨리는 주요 원인이 된다.
모델 가중치
model-weights
학습된 AI 모델의 핵심 데이터로, 모델의 지능과 능력을 결정하는 수치들의 집합이다. 가중치가 유출되면 안전 장치가 제거된 상태로 악용될 수 있어 물리적·사이버 보안을 통한 엄격한 보호가 필요하다.
모델 번들링
model-bundling
여러 개의 서로 다른 대형 언어 모델을 하나의 물리적 서버 노드에 동시에 배포하는 기술이다. 에이전트 시스템처럼 여러 모델이 협력해야 하는 환경에서 모델 간 이동 시 발생하는 네트워크 지연을 없애고 자원 효율성을 높이는 데 필수적이다.
모델 스위칭
model-switching
동일한 프롬프트를 여러 모델에 입력하여 최적의 결과물을 얻거나 한 모델의 오류를 다른 모델로 교정하는 작업 방식이다. 모델 간의 상호 보완을 통해 전체적인 작업 성공률을 높인다.
문맥 임베딩
context-embedding
모델이 작업을 수행하는 동안 유지하는 내부적인 정보의 수치적 표현입니다. 반복적인 추론 과정에서 이전 단계의 작업 내용이나 수정 사항을 기억하고 다음 단계에 반영하기 위한 메모리 역할을 수행합니다.
문자 오류율
cer
음성 인식 시스템의 정확도를 측정하는 지표로, 전체 문자 수 대비 삽입, 삭제, 대체된 문자의 비율을 의미한다. 수치가 낮을수록 실제 음성과 인식된 텍스트 간의 일치도가 높음을 뜻한다.
미러 데센트
mirror-descent
표준 경사 하강법을 일반화하여 기하학적 구조에 맞는 정규화(브레그먼 발산)를 사용하는 최적화 알고리즘이다. 강화학습에서는 정책 개선 단계를 미러 데센트 업데이트로 해석하여 학습의 안정성을 높이는 데 활용된다.
배런 클래스
barron-class
신경망에 의해 효율적으로 근사될 수 있는 함수들의 집합으로, 차원의 저주를 극복할 수 있는 함수적 특성을 정의하는 데 사용된다.
배치 사이즈
batch-size
한 번의 추론 연산에서 동시에 처리하는 데이터 샘플의 묶음 단위이다. 배치 사이즈가 클수록 전체 처리량은 늘어나지만 개별 데이터의 응답 시간은 길어지는 특성이 있다.
배치 체인지
batch-changes
수백 개의 레포지토리에 걸쳐 코드 수정을 자동화하고 관리하는 기능이다. 검색 쿼리로 대상을 특정하고 선언적 스펙으로 변경 사항을 정의하여 수많은 PR을 일괄 생성 및 추적할 수 있게 한다.
번역 메모리
translation-memory
과거에 번역된 문장들을 데이터베이스에 저장해 두었다가 유사한 문장이 나타날 때 재사용하는 기술이다. 번역의 일관성을 높이고 작업 시간을 단축하는 데 필수적이다.
벡터 임베딩
vector-embedding
텍스트나 이미지 같은 데이터를 고차원 공간의 수치 벡터로 변환하는 기술이다. 단어의 의미적 유사성을 수학적 거리로 표현할 수 있어, 단순 키워드 매칭보다 정교한 문맥 파악이 가능하다. 스팸 탐지에서 변형된 문구의 의도를 파악하는 데 핵심적인 역할을 한다.
벡터 저장소
vector-store
텍스트 데이터를 수치 벡터로 변환한 임베딩을 저장하고 검색하는 데이터베이스이다. 의미적 유사도를 기반으로 관련 정보를 빠르게 찾아내는 RAG(검색 증강 생성) 시스템의 핵심 구성 요소로 사용된다.
벤더 중립성
vendor-agnostic
특정 기업의 하드웨어나 소프트웨어 환경에 종속되지 않고 독립적으로 작동하는 특성이다. 제안된 거버넌스 프로토콜이 다양한 LLM 모델에서 범용적으로 적용될 수 있음을 의미한다.
벨만 방정식
bellman-equation
현재 상태의 가치와 미래 상태 가치 사이의 재귀적 관계를 정의하는 수식으로 강화학습의 이론적 토대이다. 상태 가치 함수나 행동 가치 함수를 업데이트하는 기준이 되며 최적 정책을 찾는 데 필수적이다.
벨만 연산자
bellman-operator
현재 상태의 가치를 다음 상태의 기대 가치와 보상의 합으로 변환하는 수학적 함수이다. 강화학습의 핵심인 가치 반복과 정책 반복의 기초가 되며 반복 적용 시 최적 가치 함수로 수렴하는 수축 특성을 가진다.
벨만 최적성
bellman-optimality
현재 상태의 최적 가치가 미래 상태의 최적 가치와 즉각적 보상의 합으로 표현된다는 원리이다. 이를 통해 복잡한 문제를 작은 부분 문제로 나누어 해결하는 동적 계획법의 기초가 된다.
병렬 샘플링
parallel-sampling
동일한 입력에 대해 LLM이 여러 개의 서로 다른 답변 후보를 동시에 생성하게 하는 방식이다. 생성된 여러 결과 중 가장 우수한 것을 선택함으로써 단일 생성 시보다 정확도를 높일 수 있다.
볼록 최적화
convex-optimization
함수의 모양이 아래로 볼록한 볼록 집합에서 최솟값을 찾는 수학적 최적화 과정이다. 볼록 함수에서는 지역 최솟값이 곧 전역 최솟값이 되므로 경사 하강법으로 항상 최적해를 찾을 수 있음이 보장된다. 머신러닝 알고리즘의 수렴 안정성을 이론적으로 뒷받침하는 핵심 개념이다.
볼륨 마운트
volume-mount
호스트 시스템의 파일이나 디렉토리를 컨테이너 내부의 특정 경로와 연결하여 데이터를 유지하거나 공유하는 방식이다. 인프라 구축 시 데이터 영속성을 보장하기 위해 필수적이며, 경로 설정 오류 시 서비스 작동이 불가능해진다.
부의 불평등
wealth-inequality
사회 구성원 간에 자산과 소득이 불균형하게 분배된 상태를 의미한다. 이 아티클에서는 기술 발전과 정책적 요인이 어떻게 특정 계층에 부를 집중시키고 노동 시장의 기회를 축소하는지 분석하는 핵심 배경으로 쓰인다.
분산 최적화
decentralized-optimization
중앙 서버 없이 네트워크로 연결된 에이전트들이 각자의 로컬 데이터를 사용하여 협력적으로 전체 목표 함수를 최소화하는 기법이다. 통신 비용과 데이터 프라이버시가 중요한 환경에서 필수적이다.
분자 접착제
molecular-glue
두 단백질 사이의 상호작용을 유도하여 질병 유발 단백질을 분해하거나 기능을 조절하는 소분자 화합물이다. 기존 약물로 표적하기 어려운 단백질을 공략할 수 있어 차세대 신약 개발 기술로 주목받는다.
분자 클로닝
molecular-cloning
분자 클로닝(Molecular Cloning)은 특정 DNA 서열을 복제하여 유전적으로 동일한 분자 집단을 만드는 기술이다. 현대 생명공학 연구의 핵심적인 기초 공정이며, 실험 절차가 정교하여 AI를 통한 최적화 요구가 높다.
분포 일반화
distribution-generalization
학습 데이터의 분포와 다른 새로운 환경(Out-of-Distribution)에서도 모델이 안정적인 성능을 유지하는 능력이다. 단순한 정확도 향상을 넘어 데이터 생성 과정의 불변하는 특성을 학습하는 것이 핵심이다.
사물 인터넷
iot
물리적 사물에 센서와 소프트웨어를 탑재하여 인터넷을 통해 데이터를 주고받는 기술로, 모든 사물을 지능화하는 기반이 된다.
사전 필터링
pre-filter
데이터베이스 검색 쿼리를 실행하기 전에 사용자가 접근 가능한 데이터 범위를 미리 제한하는 기법이다. RAG에서는 권한 있는 문서 ID 목록을 먼저 확보하여 벡터 DB 검색 조건에 포함시킴으로써 보안 사고를 원천 차단한다.
사후 필터링
post-filter
데이터베이스에서 검색 결과를 먼저 받아온 후, 각 항목에 대해 권한 유무를 하나씩 검증하여 부적절한 데이터를 제외하는 방식이다. 구현이 상대적으로 단순하지만 검색 결과 중 권한 없는 데이터가 많을 경우 효율이 떨어진다.
상태 비저장
stateless
에이전트가 이전의 상호작용이나 대화 기록을 기억하지 않고 각 요청을 독립적으로 처리하는 방식이다. 시스템 구조를 단순화하고 컨텍스트 고립을 강화하는 데 유리하다.
상태 크리프
status-creep
단순한 초안이나 제안 수준의 정보가 반복적으로 공유되면서 점차 공식적인 사실이나 정책처럼 받아들여지는 현상이다. AI 생성물이 검증 없이 권위를 얻게 되는 위험을 설명할 때 사용된다.
샘플 효율성
sample-efficient
모델이 새로운 작업이나 도메인을 학습할 때 필요한 데이터의 양이 적음을 의미한다. 데이터 확보가 어려운 전문 분야에서 AI를 효과적으로 활용하기 위해 매우 중요한 성능 지표이다.
선반 가격표
sel
소매점 선반 모서리에 부착된 가격표로 제품명, 가격, 바코드 등의 정보를 포함한다. AI 모델이 이를 인식하여 제품과 가격 정보를 매칭하는 핵심 데이터 소스가 된다.
선형 프로빙
linear-probing
모델의 내부 표현층에 간단한 선형 분류기를 연결하여 특정 정보의 존재 여부를 확인하는 분석 기법이다. 모델이 학습 과정에서 의도치 않게 습득한 지식이나 현재 상황에 대한 인지 여부를 파악하는 데 사용된다.
설명 가능성
explainability
AI 모델이 특정 결과나 결정을 내린 이유를 인간이 이해할 수 있도록 설명하는 능력이다. 법률 분야와 같이 신뢰와 책임이 중요한 영역에서 AI 도입을 위한 필수적인 기술적 요구사항으로 꼽힌다.
설문 가중치
survey-weights
표본 조사 결과가 전체 모집단을 정확히 대표할 수 있도록 각 응답에 부여하는 통계적 가중치이다. 특정 인구 집단의 과소 또는 과대 대표 문제를 보정하여 분석의 정확도를 높이는 역할을 한다.
숏폼 콘텐츠
short-form-content
틱톡이나 릴스처럼 1분 내외의 짧은 영상 형식을 의미한다. 모바일 환경에서 높은 몰입도와 전파력을 가져 마케팅 핵심 수단으로 활용된다.
수분 매개자
pollinator
꿀벌처럼 꽃가루를 옮겨 식물의 수정을 돕는 생물이다. 농업 생태계 유지와 생물 다양성 보존에 필수적인 역할을 수행하며, 최근 기후 변화와 질병으로 인해 개체수가 급감하여 보호가 시급한 상황이다.
수정 가능성
corrigibility
시스템의 목표나 행동이 인간의 의도와 다를 때 이를 안전하게 수정할 수 있는 성질이다. AI가 공적 권력을 행사할 때 사회적 합의에 따라 규칙을 변경할 수 있어야 한다는 맥락에서 중요하다.
수직 계열화
vertical-integration
기업이 가치 사슬의 여러 단계를 직접 통제하는 전략이다. Railway는 타사 클라우드 위에 서비스를 구축하는 대신 자체 데이터 센터와 하드웨어를 직접 설계 및 운영함으로써 비용을 절감하고 배포 속도를 극대화했다.
순열 불변성
permutation-invariance
입력 데이터의 순서가 바뀌어도 모델의 출력 결과가 변하지 않는 성질이다. 그래프 데이터는 노드 번호가 임의로 매겨지므로 GNN 모델이 신뢰성을 가지려면 반드시 갖춰야 할 특성이다.
습식 실험실
wet-lab
습식 실험실(Wet Lab)은 액체 상태의 화학 물질이나 생물학적 샘플을 직접 다루는 실험 공간이다. AI의 가상 시뮬레이션과 대비되는 실제 물리적 실험 환경을 의미하며, AI가 현실 세계의 복잡한 변수를 제어할 수 있는지 평가하는 중요한 무대이다.
식별 가능성
identifiability
주어진 데이터로부터 모델의 파라미터나 구조를 유일하게 결정할 수 있는 성질로, 인과 추론의 신뢰성을 보장하는 핵심 개념이다.
신경 가소성
neuroplasticity
뇌가 새로운 경험이나 학습, 부상에 대응하여 신경 회로의 구조와 기능을 스스로 재구성하는 능력이다. 이 연구에서 쥐가 인공적인 빛 신호를 새로운 감각으로 인식하게 된 핵심 원리이다.
신경 렌더링
neural-rendering
딥러닝 모델을 활용하여 3D 장면으로부터 새로운 시점의 이미지를 생성하는 기술이다. 전통적인 그래픽스 파이프라인에 AI를 결합하여 복잡한 조명이나 질감을 사실적으로 표현한다. NeRF와 3DGS가 대표적인 예시이다.
심층 리서치
deep-research
AI가 웹 검색을 수행하고 여러 소스의 정보를 종합하여 복잡한 질문에 대해 상세한 보고서 형태의 답변을 생성하는 기능이다. 단순 검색보다 높은 수준의 분석력을 요구한다.
아리 알렉사
arri-alexa
영화 산업에서 표준으로 사용되는 하이엔드 디지털 시네마 카메라 시스템이다. 프롬프트에 이 명칭을 포함하면 특유의 필름 질감과 넓은 다이내믹 레인지를 가진 영화적 이미지를 생성하는 데 도움을 준다.
양자 컴퓨팅
quantum-computing
양자 역학의 원리를 이용해 기존 슈퍼컴퓨터보다 기하급수적으로 빠른 연산을 수행하는 차세대 컴퓨팅 기술이다. 복잡한 분자 시뮬레이션이나 암호 해독 등 AI의 한계를 넘는 영역에 활용된다.
엣지 컴퓨팅
edge-computing
데이터가 생성되는 현장 장치에서 직접 연산을 수행하여 클라우드 전송 없이 결과를 도출하는 방식이다. 로봇의 실시간 제어를 위해 지연 시간을 최소화해야 하는 환경에서 Jetson과 같은 하드웨어가 주로 사용된다. 네트워크 의존성을 줄이고 보안성을 높이는 장점이 있다.
엣지 케이스
edge-case
알고리즘이 예상하지 못한 드물거나 특이한 상황을 의미한다. 로봇이 스스로 해결하기 어려운 돌발 상황에서 인간의 개입이 필요한 지점을 설명할 때 사용된다.
연구 프리뷰
research-preview
정식 출시 전 기술의 가능성을 확인하기 위해 특정 사용자에게 미리 공개하는 단계로, 기능이 불안정할 수 있으나 최신 기술을 먼저 체험할 수 있는 기회를 제공한다.
연방 우선권
preemption
연방 법률이 주 법률에 우선하여 적용된다는 법적 원칙이다. 이 아티클에서는 트럼프 행정부가 주 정부의 독자적인 AI 규제 법안을 무력화하고 연방 차원의 단일 규제 체계를 강제하기 위한 전략적 도구로 사용된다.
영구 메모리
persistent-memory
시스템이 재시작되거나 프로세스가 종료되어도 데이터가 사라지지 않고 유지되는 저장 공간이다. 에이전트가 과거의 작업 내용과 학습한 사실을 기억하고 연속성을 유지하는 데 필수적이다.
오픈 가중치
open-weights
모델의 학습된 가중치(파라미터)를 공개하여 누구나 로컬 환경에서 실행하거나 파인튜닝할 수 있게 한 모델이다. 학습 데이터나 소스코드까지 모두 공개하는 '완전 오픈 소스'와는 차이가 있을 수 있다.
오픈 웨이트
open-weight
모델의 학습된 가중치를 공개하여 누구나 자신의 인프라에서 모델을 실행하거나 수정할 수 있도록 허용한 형태이다. 폐쇄형 API와 달리 모델의 내부 구조를 파악하고 직접 최적화할 수 있는 장점이 있다.
온도 샘플링
temperature-sampling
언어 모델이 다음 토큰을 선택할 때 확률 분포의 무작위성을 조절하는 파라미터이다. 온도가 높을수록 더 다양하고 창의적인 결과물이 생성된다.
용도 지역법
zoning-laws
토지의 이용 목적과 건물의 크기 등을 제한하는 법규로 데이터 센터 건립 시 이를 우회하는 특혜가 공정성 논란을 일으킨다.
월드 모델링
world-modeling
에이전트가 자신이 처한 환경의 물리적 법칙이나 인과 관계를 내부적인 모델로 학습하는 기법이다. 이를 통해 에이전트는 실제로 행동하기 전에 결과를 미리 시뮬레이션하여 학습 효율성을 높이고 복잡한 계획을 수립할 수 있다.
위험 계층화
risk-stratification
환자를 발병이나 재발 위험도에 따라 여러 그룹으로 나누어, 각 그룹에 최적화된 치료 및 관리 전략을 수립하는 의료 프로세스이다.
유닛 테스트
unit-test
소스 코드의 개별 단위가 의도한 대로 정확히 작동하는지 검증하는 테스트 방법이다. 코드의 안정성을 보장하며 AI 생성 코드에서 이 과정이 누락되면 예기치 못한 버그가 발생하기 쉽다.
유전 부호화
genetic-encoding
생물의 유전 정보를 디지털 코드로 변환하여 알고리즘상에서 변이와 선택이 가능하도록 만드는 기법이다. 이를 통해 형태학적 구조나 신경망의 특성을 세대 간에 전달하고 진화시킬 수 있다. 복잡한 시스템의 최적 구조를 탐색하는 데 유용하다.
유향 그래프
directed-graph
노드 간의 연결에 방향성이 있는 그래프 구조로, LangGraph에서 에이전트의 작업 순서와 상태 전이를 정의하는 데 사용된다.
음성 클로닝
voice-cloning
특정 개인의 짧은 음성 샘플을 AI가 학습하여 그 사람의 고유한 목소리, 억양, 톤을 그대로 재현하는 기술이다. ALS 환자처럼 목소리를 잃어가는 사람들이 자신의 정체성을 유지하며 소통할 수 있게 돕는 데 핵심적인 역할을 한다.
이진 양자화
binary-quantization
부동 소수점(Float)으로 이루어진 벡터의 각 요소를 0 또는 1의 비트 값으로 변환하는 기술이다. 메모리 사용량을 최대 32배까지 절감할 수 있으며, CPU의 비트 연산을 통해 검색 속도를 획기적으로 높일 수 있다.
인과 생물학
causal-biology
질병의 발생과 진행 과정에서 나타나는 단순한 상관관계를 넘어, 유전적 변이나 환경적 요인이 질병에 미치는 직접적인 인과 관계를 규명하는 연구 분야이다. 이를 통해 질병의 근본 원인을 타겟팅하는 정밀한 치료제를 설계할 수 있으며, 신약 개발의 성공 가능성을 획기적으로 높인다.
인물 유사성
likeness
생성 AI 분야에서 특정 인물이나 대상의 고유한 외형적 특징이 결과물에 얼마나 정확하게 유지되는지를 나타내는 척도이다.
있는 그대로
as-is
제품이나 서비스의 현재 상태 그대로를 수용하며, 향후 발생할 수 있는 결함이나 성능 미달에 대해 판매자가 보증하지 않는다는 조건이다.
자기 일관성
self-consistency
동일한 질문에 대해 여러 추론 경로를 생성하고 가장 많이 나온 답변을 선택하는 기법입니다. 개별 추론의 오류를 상쇄하여 신뢰성을 극대화합니다.
자동 라벨링
auto-labeling
AI 모델을 활용해 데이터에 정답(라벨)을 자동으로 부여하는 기술이다. 인간의 개입을 최소화하여 데이터 구축 비용과 시간을 획기적으로 줄여주는 효율적인 방법론이다.
자본 집약적
capital-intensive
생산 과정에서 노동력보다 기계, 설비, 인프라 등 자본의 투입 비중이 압도적으로 높은 산업 구조를 의미한다. 데이터 센터는 막대한 하드웨어 비용 대비 운영 인력이 적은 대표적 사례다.
자율 테스팅
autonomous-testing
사람이 개입하지 않고 AI가 스스로 테스트 케이스를 생성, 실행, 유지보수하는 소프트웨어 품질 검증 방식이다. 기존 자동화와 달리 변화하는 UI나 데이터에 맞춰 스스로 시나리오를 수정하는 능력을 포함한다.
작업 효율성
action-efficiency
특정 목표에 도달하기 위해 수행한 유효한 행동의 총 횟수를 측정하여 지능의 경제성과 통찰력을 평가하는 지표이다.
잔차 양자화
rq-quantization
벡터 데이터를 더 작은 비트로 압축하면서도 검색 정확도를 유지하기 위해 잔차를 사용하는 양자화 기법으로 메모리 효율을 극대화한다.
전산 언어학
cl
컴퓨터를 이용하여 인간의 언어를 분석하고 처리하는 학문 분야로, 자연어 처리(NLP)의 학문적 토대이다. 언어의 구조와 의미를 수학적, 전산적으로 모델링하는 데 집중한다.
전역 어텐션
global-attention
입력 데이터의 모든 부분 간의 관계를 계산하여 멀리 떨어진 정보 간의 연결성을 파악하는 메커니즘으로, CNN의 국소적 수용장 한계를 극복하는 데 도움을 준다.
정수 계획법
integer-programming
최적화 문제에서 결정 변수의 일부 또는 전부가 정수여야 한다는 제약 조건이 있는 수리 계획법이다. 네트워크 구조 탐색과 같은 조합 최적화 문제에 활용된다.
정적 타이핑
static-typing
변수의 타입을 컴파일 시점에 결정하여 코드의 안정성을 높이는 프로그래밍 방식이다. 코딩 에이전트가 코드의 구조와 의도를 더 명확하게 파악할 수 있게 도와주어 에이전트의 코드 생성 정확도를 높이는 데 기여한다. TypeScript나 Python의 Type Hinting 등이 이에 해당한다.
정형 데이터
structured-data
API 응답이나 데이터베이스 테이블처럼 미리 정의된 형식과 구조에 따라 체계적으로 구성된 데이터이다. LLM의 비정형 텍스트와 달리 기계가 해석하고 검증하기 용이하여 시스템의 정확도를 높이는 기준점으로 사용된다.
제트 재구성
jet-reconstruction
고에너지 충돌 시 발생하는 입자들의 다발(Jet)을 하나의 물리적 단위로 묶어 분석하는 과정이다. 쿼크나 글루온의 성질을 연구하는 데 핵심적인 역할을 한다.
지식 그래프
knowledge-graph
개체 간의 관계를 네트워크 형태로 표현한 데이터 구조이다. 코드베이스 내의 함수 호출, 클래스 상속 등의 복잡한 의존성을 시각화하고 검색하는 데 사용된다.
지식 노동자
knowledge-worker
정보를 분석하고 창의적인 사고를 통해 가치를 창출하는 전문직 종사자를 의미한다. AI는 이들의 반복 업무를 줄여주고 복잡한 문제 해결을 보조함으로써 생산성을 극대화하는 역할을 한다.
채널 스태킹
channel-stacking
서로 다른 시점의 프레임을 하나의 이미지 채널(RGB)로 합치는 기법이다. 이를 통해 2D 네트워크가 단일 이미지 내에서 시간적 변화량을 학습할 수 있게 하여 움직이는 객체 탐지 성능을 높인다.
추론 디코딩
inference-decoding
대형 언어 모델이 텍스트를 생성할 때 토큰을 하나씩 순차적으로 만들어내는 과정이다. 이 단계는 연산 능력보다 메모리에서 데이터를 읽어오는 속도(대역폭)가 성능을 결정하므로, 메모리 구조가 최적화된 전용 가속기를 사용할 때 효율이 매우 높다.
추론 인프라
inference-infrastructure
학습된 AI 모델이 실제 사용자 요청에 따라 결과를 만들어내는 과정(추론)을 수행하기 위한 하드웨어 및 소프트웨어 환경이다. Together AI는 이를 최적화하여 빠른 속도와 낮은 비용으로 API 서비스를 제공한다.
추론 효율성
inference-efficiency
모델이 주어진 입력에 대해 답을 생성하는 과정에서 소비하는 시간과 계산 자원의 효율을 의미한다. 사용자 경험 개선과 운영 비용 절감을 위해 필수적인 요소이다.
추정 시퀀스
estimating-sequences
최적화 알고리즘의 수렴 속도를 수학적으로 분석하기 위해 목적 함수의 하한을 반복적으로 추적하는 함수들의 수열이다. 가속 알고리즘의 성능을 증명하는 핵심 도구로 사용된다.
출시 후보판
release-candidate
정식 제품으로 출시되기 직전의 소프트웨어 버전으로, 모든 기능이 구현되었으나 최종 버그 수정을 위해 공개된 단계이다. 개발자들은 이를 통해 정식 출시 전 미리 기능을 테스트하고 피드백을 제공할 수 있다.
컨셉 시각화
concept-visualization
추상적인 아이디어나 전략을 구체적인 이미지나 형태로 표현하여 이해를 돕는 과정이다. 디자인 의도를 명확히 전달하여 의사결정을 가속화하는 역할을 한다.
코드 스니펫
snippet
재사용 가능한 작은 코드 조각으로 특정 기능을 수행하는 독립적인 단위를 의미한다. 개발자가 복잡한 기능을 구현할 때 참고하거나 복사하여 사용할 수 있는 검증된 코드 단위이다.
콜드 스타트
cold-start
실행 중인 인스턴스가 없는 상태에서 새로운 컨테이너를 띄우고 모델을 메모리에 로드하기까지 걸리는 지연 시간이다. 모델 크기가 클수록 이 시간이 길어져 사용자 경험을 해친다.
타입 안정성
type-safety
프로그램 내에서 데이터 타입이 올바르게 사용되도록 보장하는 성질이다. 컴파일 시점이나 정적 분석 단계에서 타입 오류를 발견하여 런타임 에러를 방지하고 코드의 신뢰성을 높인다.
텐서 병렬화
tensor-parallelism
대규모 모델의 연산을 여러 개의 GPU에 나누어 동시에 처리하는 병렬화 기법이다. 단일 GPU 메모리에 담기 힘든 거대 모델을 구동하거나 추론 속도를 높이기 위해 필수적으로 사용된다.
토큰 사용량
token-usage
AI 모델이 텍스트를 처리하는 기본 단위인 토큰의 소비량이다. Claude Code는 명령을 내릴 때마다 현재 컨텍스트를 다시 계산하므로 토큰 소진이 매우 빠를 수 있다.
토큰 효율성
token-efficiency
LLM 서비스 이용 시 발생하는 비용과 처리량의 척도인 토큰 사용량을 최소화하는 것을 의미한다. 불필요한 컨텍스트 주입이나 반복적인 호출을 줄임으로써 운영 비용을 절감하고 응답 속도를 개선할 수 있다.
튜링 완전성
turing-complete
어떤 계산기나 언어가 모든 계산 가능한 함수를 실행할 수 있는 능력을 의미한다. 1차원 세계에서도 특정 규칙(Rule 110 등)을 통해 복잡한 논리 연산과 지능이 발현될 수 있는 이론적 근거가 된다.
팬서 레이크
panther-lake
인텔의 차세대 프로세서 코드명으로, 인텔 18A 공정을 사용하여 제조되는 Core Ultra Series 3 제품군을 의미한다.
퍼즈 테스팅
fuzz-testing
소프트웨어의 취약점이나 버그를 찾기 위해 무작위이거나 조작된 데이터를 입력하여 시스템의 비정상적인 동작을 유도하는 자동화된 테스트 기법이다. 에이전트가 작성한 코드의 안정성을 검증하는 루프의 일부로 활용될 수 있다.
평가 하네스
evaluation-harness
평가 작업을 자동화하여 실행하고 결과를 수집 및 분석하는 인프라 소프트웨어이다. 에이전트에게 필요한 도구와 환경을 제공하고, 여러 시도를 병렬로 처리하며, 채점 로직을 적용하여 최종 리포트를 생성하는 역할을 한다.
피처 스토어
feature-store
머신러닝 모델 학습과 추론에 필요한 특징(Feature)들을 저장하고 관리하는 중앙 저장소로 데이터 재사용성과 일관성을 보장한다.
합성 데이터
synthetic-data
실제 사용자가 생성한 데이터가 아닌 알고리즘이나 모델을 통해 인위적으로 생성된 데이터다. 실제 데이터가 부족한 초기 개발 단계에서 모델을 학습시키거나 테스트 환경을 구축하는 데 사용된다.
합성 미디어
synthetic-media
AI 기술을 사용하여 인공적으로 생성하거나 조작한 텍스트, 이미지, 영상, 오디오 등의 디지털 콘텐츠를 총칭한다. 현실의 데이터를 학습하여 실제와 유사한 결과물을 만들어내는 것이 특징이다.
합성 사용자
synthetic-user
실제 고객 데이터를 기반으로 생성된 가상의 페르소나이다. 제품 테스트나 인터뷰 시뮬레이션에 활용되어 실제 사용자 없이도 빠른 피드백 확보를 가능하게 한다.
해석 가능성
interpretability
AI 모델이 내린 결정이나 결과의 근거를 인간이 이해할 수 있는 형태로 설명할 수 있는 정도를 의미한다.
형상 최적화
shape-optimization
주어진 제약 조건 하에서 목적 함수를 만족하도록 물체의 기하학적 형태를 수학적으로 수정하는 과정이다. 하중과 재료 특성을 고려하여 최적의 구조를 도출한다.
혼합 정밀도
mixed-precision
FP32와 BF16/FP16 정밀도를 혼합 사용하여 연산 속도를 높이면서도 모델의 정확도 손실을 최소화하는 학습 기술이다.
회귀 테스트
regression-testing
새로운 코드 변경이나 모델 업데이트 이후에도 기존에 정상적으로 작동하던 기능들이 여전히 잘 동작하는지 확인하는 테스트이다. 에이전트의 성능 개선이 다른 부분의 성능 저하를 일으키지 않았는지 보장하는 안전장치 역할을 한다.
횔더 연속성
hoelder-continuity
함수의 매끄러운 정도를 나타내는 수학적 개념으로, 립시츠 연속성보다 일반화된 형태이다. 신호의 변화율을 제한하여 수렴 속도를 분석하는 기초가 된다.
희소 데이터
sparse-data
전체 데이터 세트에서 유효한 값이 차지하는 비중이 매우 낮은 상태를 의미한다. 모든 사용자가 설문에 참여하지 않기 때문에 발생하는 데이터 부족 문제를 해결하기 위해 기존 행동 데이터를 피처로 활용하는 기법이 중요하게 다뤄진다.
희소 활성화
sparse-activation
모델의 전체 파라미터 중 특정 입력에 필요한 일부 뉴런만 활성화하는 방식이다. 메모리 사용량과 연산량을 획기적으로 줄여 거대 모델의 추론 속도를 높이는 데 기여한다.
가짜 상관관계
spurious-correlation
두 변수 사이에 실제 인과관계가 없음에도 불구하고 제3의 요인이나 우연에 의해 통계적으로 관계가 있는 것처럼 보이는 현상이다. AI 모델이 질병 자체가 아닌 영상의 특정 노이즈를 근거로 진단하는 등의 오류를 유발한다.
개념 드리프트
concept-drift
학습 데이터의 통계적 특성이 시간이 지남에 따라 변하여 모델의 예측 성능이 저하되는 현상이다. 강화학습에서는 환경의 규칙이나 보상 구조가 변하는 상황을 의미하며, 에이전트의 적응력을 테스트하는 핵심 요소이다.
군집 로보틱스
swarm-robotics
다수의 로봇이 상호작용하며 협력하여 하나의 큰 목표를 수행하는 기술 체계로, 마이크로 로봇의 활용도를 높인다.
궤도 비의존형
orbital-free
양자 역학적 궤도 함수를 직접 계산하지 않고 전자 밀도만을 이용해 에너지를 구하는 방식이다. 계산 효율은 높지만 수치적 불안정성이 크다는 단점이 있다.
기술 봉건주의
techno-feudalism
자본주의 이후의 체제로 소수의 기술 엘리트가 데이터와 컴퓨팅 자원을 독점하고 대다수 시민은 경제적 가치 사슬에서 배제되는 형태이다. 노동-임금 순환이 끊겼을 때 나타날 수 있는 디스토피아적 시나리오이다.
뉴런 어셈블리
neuronal-assembly
특정 자극이나 정보를 처리하기 위해 일시적으로 동기화되어 활동하는 뉴런들의 집합체이다. 뇌가 복잡한 개념을 효율적으로 표상하고 저장하는 기본 단위로 간주된다.
동적 컨텍스트
dynamic-context
모델 실행 시점에 필요한 정보를 실시간으로 검색하거나 도구를 통해 가져와 프롬프트에 포함하는 방식이다. 모든 정보를 미리 제공하는 정적 방식보다 효율적이며 모델이 더 정확한 판단을 내리도록 돕는다.
리드 스코어링
lead-scoring
잠재 고객의 행동 데이터를 바탕으로 구매 가능성이나 가치를 수치화하는 기법이다. Clarm은 GitHub 활동 데이터를 분석하여 우선순위가 높은 영업 대상을 식별하는 데 이를 활용한다.
맘바 아키텍처
mamba
상태 공간 모델(SSM)을 기반으로 한 새로운 신경망 구조로, 시퀀스 길이에 따라 연산량이 선형적으로 증가하여 기존 Transformer의 제곱 비례 문제를 해결한 기술이다.
멀티 에이전트
multi-agent
여러 개의 독립적인 AI 에이전트가 협력하여 복잡한 작업을 수행하는 아키텍처이다. 각 에이전트 간의 역할 분담, 메모리 동기화, 목표 정렬 과정에서 혼선이 발생하기 쉬워 운영 난이도가 매우 높다.
명목 커버리지
nominal-coverage
신뢰 구간이 실제 파라미터 값을 포함할 것으로 기대되는 이론적인 확률이다. 예를 들어 95% 신뢰 구간은 반복된 실험에서 실제 값이 구간 내에 있을 확률이 95%여야 함을 의미한다.
미드 트레이닝
mid-training
일반적인 사전 학습과 사후 학습 사이에서 특정 도메인 데이터나 긴 컨텍스트 데이터를 집중적으로 학습시켜 모델의 전문성을 높이는 단계이다.
범용 인공지능
agi
특정 작업뿐만 아니라 인간이 수행할 수 있는 모든 지적 작업을 수행할 수 있는 수준의 인공지능을 의미한다.
변분 베이지안
variational-bayes
복잡한 사후 분포를 다루기 쉬운 분포로 근사하여 추론하는 기법이다. MCMC보다 계산 속도가 매우 빠르지만, 분포의 형태를 단순화하는 과정에서 정확도가 낮아질 수 있다.
부정 프롬프트
negative-prompt
모델이 생성하지 말아야 할 요소나 피해야 할 스타일을 명시하는 기법이다. '엠대시를 사용하지 마라'와 같은 지시가 이에 해당하며, 모델의 출력 범위를 제한하여 품질을 높이는 데 필수적이다.
상시 알고리즘
anytime-algorithm
실행 도중 어느 시점에서든 중단하더라도 그 시점까지 계산된 최선의 결과를 반환할 수 있는 알고리즘으로, 실행 시간이 길어질수록 결과의 품질이 향상된다.
상태 드리프트
state-drift
에이전트가 여러 단계를 거치며 추론하는 과정에서 초기 의도나 데이터의 맥락이 조금씩 변질되거나 누적된 오류로 인해 엉뚱한 방향으로 흐르는 현상이다. 이는 장기적인 대화나 복잡한 워크플로우에서 에이전트의 신뢰성을 떨어뜨리는 주요 원인이 된다.
서브 에이전트
sub-agent
메인 AI 모델의 지시를 받아 특정 세부 작업을 수행하는 하위 인스턴스로, 복잡한 전체 작업을 효율적으로 분할하여 처리할 때 사용되는 구조이다.
서킷 브레이커
circuit-breaker
시스템 장애나 무한 루프 확산을 막기 위해 특정 조건 충족 시 프로세스를 강제로 차단하는 설계 패턴이다. 이 글에서는 에이전트의 반복적인 환각이나 무의미한 검색 루프를 멈추는 안전장치로 활용했다.
슈퍼 에이전트
super-agent
여러 개의 하위 에이전트나 도구들을 총괄하고 조율하는 중앙 허브 역할을 하는 AI 에이전트이다. 복잡한 조직 내 워크플로우를 통합 관리한다.
스킬 마크다운
skill-md
AI 에이전트가 수행할 수 있는 특정 작업이나 능력을 구조화된 텍스트 형식으로 정의한 파일이다. 에이전트의 시스템 프롬프트나 도구 설명에 포함되어 실행 지침 역할을 하며, 명확한 작성이 에이전트 성능의 핵심이다.
실험 드리프트
experiment-drift
모델 학습 환경이나 파라미터의 미세한 변화로 인해 실험 결과가 일관되지 않게 변하는 현상을 의미한다. 이를 방지하기 위해 엄격한 설정 관리가 필요하다.
안전 가드레일
safety-guardrails
AI 모델이 유해하거나 위험한 답변을 생성하지 못하도록 설정한 기술적 제한 사항이다. 앤스로픽은 이를 통해 자율 무기 개발이나 감시 활동 등 부적절한 용도의 사용을 차단하고 있다.
엣지 네트워크
edge-network
사용자와 물리적으로 가까운 위치에 서버를 배치하여 데이터 전송 지연 시간을 최소화하는 네트워크 구조다. Railway는 글로벌 엣지 네트워크를 통해 전 세계 어디서든 빠른 애플리케이션 접근과 배포를 지원한다.
영업 레버리지
operating-leverage
고정비(인력 등)를 크게 늘리지 않으면서도 매출이나 업무 처리량을 획기적으로 증가시킬 수 있는 능력을 의미한다. 에이전틱 AI 도입을 통해 동일한 인원으로 훨씬 더 많은 상품군(SKU)을 정밀하게 관리함으로써 기업의 수익성을 높이는 핵심 기제로 작용한다.
오픈 리스폰스
open-responses
에이전트 중심의 워크로드를 위해 설계된 새로운 개방형 추론 API 표준이다. 기존 Chat Completion의 한계를 극복하고 텍스트, 이미지, 비디오 생성 및 자율적 에이전트 루프를 일관된 방식으로 지원하여 모델 간 상호운용성을 높이는 것을 목표로 한다.
원샷 프롬프팅
one-shot-prompting
AI 모델에게 추가적인 예시나 피드백 루프 없이 단 한 번의 지시(Prompt)만으로 결과물을 생성하도록 하는 방식이다. 복잡한 로직이나 긴 코드를 작성할 때는 한계가 명확하다.
유전 데이터셋
genetic-dataset
수백 개의 유전 정보를 포함한 수천만 개의 세포 데이터 묶음으로 머신러닝 모델의 학습과 처리 대상이 된다.
유전 알고리즘
genetic-algorithm
생물의 진화 과정을 모방하여 최적화 문제를 해결하는 탐색 알고리즘이다. 선택, 교차, 변이 과정을 반복하며 최적의 해를 찾아내며 복잡한 비선형 회귀 문제 등에 적용 가능하다.
이분 네트워크
bipartite-network
노드들을 두 개의 서로 다른 집합으로 나누었을 때, 같은 집합에 속한 노드들 사이에는 에지가 존재하지 않는 네트워크 구조이다. 사용자-상품 구매 관계나 저자-논문 관계 등을 모델링할 때 주로 사용된다.
임상 코파일럿
clinical-copilot
의료진의 진료 과정을 실시간으로 보조하여 환자의 안전 문제를 감지하거나 처방 오류를 방지하는 AI 시스템이다. 의사의 의사결정을 지원함으로써 의료 사고를 줄이고 진료 효율성을 높이는 역할을 한다.
자동 머신러닝
automl
머신러닝 모델 개발 과정의 데이터 전처리, 모델 선택, 하이퍼파라미터 튜닝을 자동화하는 기술이다. 전문가의 개입을 최소화하면서도 최적의 성능을 내는 모델을 빠르게 구축할 수 있게 돕는다.
자율 에이전트
autonomous-agent
인간의 지속적인 개입 없이 스스로 목표를 설정하고 도구를 사용하여 복잡한 작업을 수행하는 AI 시스템이다. LLM을 두뇌로 삼아 계획 수립, 메모리 관리, 외부 도구 사용 능력을 갖춘다.
제로 트러스트
zero-trust
내부 네트워크에 있더라도 아무도 신뢰하지 않고 모든 접근 요청에 대해 엄격한 인증과 권한 검증을 수행하는 보안 모델이다. TTMDocs에서는 사용자의 기존 문서 접근 권한을 AI 검색 시에도 그대로 적용하는 방식으로 구현된다.
채팅 네이티브
chat-native
사용자 인터페이스의 중심이 그래픽 버튼이나 메뉴가 아닌 대화 자체가 되는 설계 방식이다. 인공지능과의 자연스러운 상호작용을 통해 복잡한 작업을 수행하도록 최적화된 앱 경험을 구축하는 데 필수적인 개념이다.
청크 드리프트
chunk-drift
검색된 텍스트 조각(Chunk)이 질문의 핵심 맥락과 미세하게 어긋나서 결과적으로 잘못된 답변을 유도하는 현상이다. 임베딩 모델의 한계나 부적절한 텍스트 분할 전략으로 인해 발생하며 검색 정확도를 저해하는 주요 요인이다.
추론 스케일링
inference-scaling
모델의 크기를 키우는 대신 추론 단계에서 더 많은 연산 자원이나 사고 시간을 투입하여 답변의 정확도를 높이는 전략이다.
추론 클라우드
inference-cloud
AI 모델의 학습이 아닌, 학습된 모델을 실제로 실행하여 결과를 도출하는 '추론' 작업에 최적화된 클라우드 인프라이다. 대규모 사용자 요청을 실시간으로 처리하기 위해 고대역폭 메모리와 효율적인 연산 장치를 갖추는 것이 특징이다.
추론 트레이스
reasoning-trace
모델이 최종 답변을 내놓기 위해 거치는 내부 사고 과정의 기록이다. 오픈 리스폰스에서는 이를 content 필드로 표준화하여 제공하며, 개발자는 이를 통해 에이전트의 논리적 흐름을 디버깅하고 모델의 판단 근거를 투명하게 파악할 수 있다.
코딩 에이전트
coding-agent
사용자의 명령을 받아 스스로 코드를 작성, 수정, 실행하는 자율형 AI 도구이다. 프로젝트 구조를 이해하기 위해 많은 양의 데이터를 읽는 특성이 있다.
텐서 프로세싱
tensor-processing
다차원 배열인 텐서 데이터를 병렬로 처리하는 연산 방식이다. AI 모델의 행렬 연산을 가속화하는 핵심 메커니즘으로, 최근에는 전력 효율을 높이기 위해 빛을 이용한 광학 방식이 연구되고 있다.
특성 스케일링
feature-scaling
데이터의 각 특성이 가지는 값의 범위를 표준화하거나 정규화하여 일정하게 맞추는 전처리 기법이다. 특성 간 스케일 차이가 크면 경사 하강법 수행 시 특정 방향으로만 기울기가 치우쳐 수렴 속도가 매우 느려지는 현상이 발생한다. 이를 통해 최적화 경로를 직선화하고 학습 효율을 극대화한다.
확인 프로토콜
confirmation-protocol
자율주행차가 불확실한 상황에서 안전을 위해 원격 운영자나 시스템의 승인을 요청하는 절차이다. 안전성을 높이지만 요청이 몰릴 경우 시스템 전체의 지연을 초래할 수 있다.
환각 가드레일
hallucination-guardrails
LLM이 사실과 다른 정보를 생성하는 환각 현상을 방지하기 위한 안전장치이다. 출력 데이터의 형식을 검증하거나 외부 지식 베이스와 대조하는 과정을 워크플로에 포함시켜 생성된 결과물의 품질과 정확성을 보장한다.
회로 토폴로지
circuit-topology
양자 프로세서 내에서 큐비트들이 물리적으로 연결된 구조나 배열 방식이다. 양자 알고리즘의 효율성에 영향을 미치며, 이 구조가 노출될 경우 알고리즘의 논리적 구조가 역공학될 위험이 있다.
히팅 메커니즘
heating
틱톡 등에서 운영자가 특정 콘텐츠의 노출을 인위적으로 높이는 내부 시스템으로, 알고리즘의 자율성 뒤에 숨겨진 인간의 개입을 의미한다.
히팅 메커니즘
heating-mechanism
플랫폼 운영자가 특정 콘텐츠의 노출도를 인위적으로 높이기 위해 수동으로 개입하는 운영 방식이다. 순수한 알고리즘 추천의 한계를 보완하고 전략적인 사용자 확보를 위해 사용되는 기법이다.
구글 테이크아웃
google-takeout
구글 계정에 저장된 데이터를 사용자가 직접 다운로드할 수 있게 해주는 서비스이나, 사진의 경우 메타데이터가 별도의 JSON 파일로 분리되어 제공되는 특징이 있다.
다중 이해관계자
multistakeholder
기업, 정부, 시민사회, 학계 등 특정 사안에 영향을 받거나 영향을 주는 다양한 집단이 참여하는 의사결정 방식이다.
독점 소프트웨어
proprietary-software
소스 코드가 공개되지 않고 개발자나 기업이 소유권을 독점하는 소프트웨어이다. 오픈소스와 반대되는 개념으로, 기업의 핵심 기술 자산이자 영업비밀로 보호받는다. 이번 논란은 MiniMax가 Kimi의 이러한 독점적 내부 도구를 무단으로 복제했다는 의혹에서 시작됐다.
모델 애그노스틱
model-agnostic
특정 AI 모델에 종속되지 않고 필요에 따라 다양한 모델을 선택하여 사용할 수 있는 설계를 뜻한다. 기술 변화에 유연하게 대응하는 데 필수적이다.
변분 오토인코더
variational-autoencoder
데이터의 잠재적인 확률 분포를 학습하여 특징을 추출하고 새로운 데이터를 생성하는 신경망 구조이다. 인코더를 통해 데이터를 잠재 공간으로 압축하고 디코더로 복원하는 과정을 거치며, 본 연구에서는 인과 구조를 반영한 잠재 표현을 학습하는 기반 틀로 사용된다.
변분 오토인코더
vae
데이터를 저차원의 잠재 공간으로 압축했다가 다시 복원하는 신경망 구조이다. 현대 생성 AI에서는 고해상도 이미지를 효율적으로 처리하기 위한 중간 단계로 필수적으로 사용된다.
전용 엔드포인트
dedicated-endpoint
특정 고객이나 작업을 위해 할당된 독립적인 서버 자원 및 API 주소이다. 공유 자원을 사용하는 방식보다 성능이 안정적이고 지연 시간이 낮아 대규모 기업용 서비스 운영에 적합하다.
추론 엔드포인트
inference-endpoint
학습된 모델을 실제 서비스에 적용하여 새로운 데이터에 대한 예측값을 반환할 수 있도록 열어둔 API 통신 지점이다.
코드 인텔리전스
code-intelligence
코드의 구조, 의존성, 정의 및 참조 관계를 분석하여 개발자가 코드를 더 쉽게 이해하고 탐색할 수 있도록 돕는 기술이다. 대규모 코드베이스에서 특정 기능의 위치나 영향 범위를 파악할 때 필수적이다.
평가 프레임워크
evaluation-framework
평가 프레임워크(Evaluation Framework)는 AI 모델의 성능, 안전성, 효율성을 특정 기준에 따라 체계적으로 측정하고 비교하기 위해 설계된 도구와 방법론의 집합이다. 모델의 실질적인 유용성을 검증하고 잠재적 위험을 사전에 파악하는 역할을 한다.
나노 세그먼테이션
nano-segmentation
고객 데이터를 극도로 세분화하여 개인별 맞춤형 메시지를 전달하는 마케팅 기법이다. 과거에는 인력 한계로 불가능했으나 AI 에이전트를 통해 대규모로 구현 가능해지며 마케팅의 효율성을 극대화한다.
대사 재프로그래밍
metabolic-reprogramming
세포의 에너지 대사 경로를 인위적으로 조절하여 세포의 기능을 강화하거나 수명을 연장하는 기술로, 여기서는 T세포의 항암 능력을 유지하는 데 쓰인다.
로컬 거대언어모델
local-llm
클라우드 서버가 아닌 사용자의 개인 컴퓨터에서 직접 실행되는 언어 모델이다. 데이터 프라이버시를 보호하고 오프라인 환경에서도 문서 분석 기능을 수행할 수 있게 한다.
벡터 데이터베이스
vector-database
데이터를 수치 벡터로 변환하여 저장하고 유사도 기반 검색을 수행하는 저장소다. AI 에이전트에게 장기 기억력을 부여하는 핵심 기술로 활용된다.
벡터 데이터베이스
vector-db
데이터를 고차원 벡터(임베딩) 형태로 저장하고 유사도 기반 검색을 수행하는 저장소이다. RAG 파이프라인에서 질문과 가장 관련성이 높은 문서 조각을 빠르게 찾아내는 핵심 역할을 수행한다.
제로 할루시네이션
zero-hallucination
AI가 사실이 아닌 정보를 지어내는 현상을 완전히 방지하는 아키텍처를 의미한다. 검증된 데이터 소스에서만 정보를 추출하여 응답의 신뢰성을 보장하는 것이 핵심이다.
보안 오케스트레이션, 자동화 및 대응
soar
다양한 보안 도구를 통합하고 반복적인 대응 과정을 자동화하는 기술이다. 보안 사고 발생 시 정해진 절차(플레이북)에 따라 자동으로 조치를 취해 대응 시간을 단축한다.
정적 애플리케이션 보안 테스트
sast
애플리케이션을 실행하지 않고 소스 코드 수준에서 보안 취약점을 분석하는 기술이다. 개발 초기 단계에서 코드의 논리적 오류나 보안 결함을 찾아내는 데 중요하게 사용된다.
동적 클라이언트 등록
dcr
OAuth 클라이언트가 런타임에 인증 서버에 자신을 자동으로 등록하는 메커니즘이다. 수많은 AI 에이전트 클라이언트가 존재하는 MCP 환경에서 관리자의 수동 개입 없이도 각 클라이언트가 고유한 식별자를 가질 수 있게 해준다.
비전 트랜스포머 휴즈
vit-h
Vision Transformer 아키텍처 중 가장 큰 파라미터 규모를 가진 모델로, SAM에서 가장 높은 정밀도의 세그멘테이션 성능을 제공하는 체크포인트이다.
근사 베이지안 계산
abc
우도 함수를 직접 계산하기 어려울 때, 시뮬레이션 데이터를 관측 데이터와 비교하여 사후 분포를 근사하는 통계적 방법이다.
동적 컨텍스트 발견
dynamic-context-discovery
모든 정보를 프롬프트에 미리 넣지 않고, 에이전트가 작업을 수행하는 과정에서 필요한 정보를 스스로 검색하여 컨텍스트 창에 추가하는 방식이다. 이는 토큰 효율성을 높이고 불필요한 정보로 인한 모델의 혼란을 방지하는 데 중요하다.
서브 가우시안 분포
sub-gaussian-distribution
꼬리 부분이 가우시안(정규) 분포보다 얇거나 비슷하게 감소하는 확률 분포군이다. 통계적 학습 이론에서 확률 변수의 집중 현상을 분석하고 오차 범위를 증명하는 데 중요한 역할을 한다.
은닉 마르코프 모델
hmm
시스템이 숨겨진 상태와 관측 가능한 결과로 구성되어 있다고 가정하고, 관측 데이터를 통해 숨겨진 상태를 추론하는 통계 모델이다. 이 연구에서는 텔레메트리 신호로 상대의 배터리 충전 상태를 추측하는 데 활용된다.
통합 스트레스 반응
isr
세포가 외부 스트레스에 대응하여 단백질 합성을 조절하는 신호 전달 경로이다. 이 반응이 과도하거나 비정상적일 경우 신경 퇴행성 질환을 유발할 수 있다. RTX-117은 이 경로를 억제하여 질병의 근본 원인을 해결한다.
로봇 프로세스 자동화
rpa
반복적이고 정형화된 업무를 소프트웨어 로봇이 자동으로 수행하게 하는 기술이다. IDP와 결합하여 문서 기반 업무를 자동화한다.
멀티 에이전트 시스템
multi-agent-system
여러 개의 독립적인 AI 에이전트가 서로 협력하거나 경쟁하며 복잡한 과제를 수행하는 구조이다. 각 에이전트가 특정 역할(예: 코딩, 검토, 실행)을 분담하여 전체 시스템의 효율성과 정확도를 높인다.
미국 의료정보 보호법
hipaa
의료 정보의 기밀성과 보안을 유지하기 위한 미국의 법률이다. AI 모델이 의료 현장에서 사용되기 위해서는 이 규정을 준수하여 환자 데이터를 안전하게 처리해야 한다.
완전 자율주행 서비스
fully-autonomous-ride
차량 내에 안전 요원이 탑승하지 않은 상태에서 승객만을 태우고 목적지까지 이동하는 서비스이다. 기술적 완성도와 법적 승인이 모두 충족되어야 가능하며, 웨이모는 현재 미국 여러 도시에서 이를 운영 중이다.
인지 프로세스 자동화
cognitive-process-automation
단순 반복 업무를 넘어 인간의 사고, 판단, 분석이 필요한 지적 활동을 AI 모델을 통해 자동화하는 기술적 접근 방식이다.
제품 요구사항 정의서
prd
제품의 기능, 목적, 사용자 가치 등을 상세히 기술한 문서로 개발팀과 기획팀 사이의 소통 기준이 된다. AI 에이전트 시대에는 이 문서 자체가 코드를 생성하는 정교한 프롬프트 역할을 수행하게 된다.
증강 라그랑주 승수법
augmented-lagrangian-multiplier
제약 조건이 있는 최적화 문제를 제약 없는 문제의 일련의 과정으로 변환하여 해결하는 알고리즘 기법으로, 복잡한 제약 조건 하에서 수렴성을 확보하는 데 효과적이다.
화학 머신러닝 플랫폼
chemml
인시트로가 개발한 AI 기반 의약 화학 플랫폼으로, 대규모 실험 데이터와 머신러닝을 결합하여 약물의 효능과 안전성을 동시에 최적화하는 기술이다.
다중 에이전트 강화학습
marl
다수의 에이전트가 공통의 환경에서 상호작용하며 학습하는 강화학습의 한 분야이다. 각 에이전트의 행동이 다른 에이전트에게 영향을 미치므로 복잡도가 높으며, 협력이나 경쟁 관계를 모델링하는 데 중요하다.
멀티 에이전트 워크플로
multi-agent-workflow
서로 다른 전문 기능을 가진 여러 AI 에이전트들이 협력하여 하나의 복잡한 업무를 완수하도록 설계된 작업 흐름이다.
멀티 프로세스 아키텍처
multi-process-architecture
하나의 프로그램을 여러 개의 독립된 프로세스로 나누어 실행하는 구조로, 특정 프로세스의 오류가 전체 시스템으로 확산되는 것을 방지하여 안정성을 높인다.
모델 컨텍스트 프로토콜
model-context-protocol
AI 모델이 Slack, GitHub, 데이터베이스 등 외부 데이터 소스에 표준화된 방식으로 접근할 수 있게 해주는 개방형 프로토콜이다. 에이전트가 코드 외의 다양한 비즈니스 맥락을 이해하도록 확장성을 제공한다.
모델 컨텍스트 프로토콜
mcp
AI 모델이 로컬 데이터나 외부 도구와 안전하고 쉽게 연결될 수 있도록 돕는 오픈 표준 규약이다. 모델과 데이터 소스 간의 통합 과정을 단순화하여 에이전트 구축 효율성을 높인다.
제로 트러스트 아키텍처
zero-trust-architecture
내부 네트워크에 있더라도 아무도 신뢰하지 않고 모든 접근 요청에 대해 엄격한 인증과 검증을 요구하는 보안 모델이다. 신원 중심의 보안을 강조하며 공격자가 네트워크 내부에서 횡적으로 이동하는 것을 차단하는 데 중점을 둔다.
제로 리던던시 옵티마이저
zero
데이터 병렬 처리 시 발생하는 메모리 중복을 제거하여 더 큰 모델을 학습할 수 있게 하는 최적화 기술이다. 파라미터와 상태를 샤딩하여 GPU 간 메모리 효율을 극대화하며, DeepSpeed 라이브러리의 핵심 기술로 알려져 있다.
다중 에이전트 오케스트레이션
multi-agent-orchestration
여러 개의 특화된 AI 에이전트가 각각의 역할(예: 작성, 검토, 감독)을 맡아 협력하며 복잡한 작업을 수행하도록 관리하는 기술이다. 각 에이전트의 책임을 분리함으로써 전체 시스템의 정확도와 안정성을 높이는 데 기여한다.
응용 프로그램 프로그래밍 인터페이스
api
소프트웨어 간에 데이터를 주고받기 위한 규약으로, 개발자가 OpenAI의 모델을 자신의 서비스에 연결하여 사용할 수 있게 해준다. 이를 통해 별도의 모델 학습 없이도 고성능 AI 기능을 외부 앱에 통합할 수 있다.
멀티 에이전트 그룹 상대 정책 최적화
m-grpo
멀티 에이전트 시스템의 효율적 학습을 위한 강화학습 기법이다. 에이전트 간의 협업 능력과 복잡한 추론 과정을 최적화하여 시스템 전체의 성능을 극대화한다.
균일 매니폴드 근사 및 투영
umap
고차원 데이터를 저차원으로 시각화하기 위한 차원 축소 알고리즘이다. 데이터 간의 국소적 구조를 보존하여 유사한 대화 내용끼리 가깝게 배치하는 데 사용된다.
가치 스트림 관리
value-stream-management
아이디어 구상부터 최종 고객에게 가치가 전달되기까지의 전 과정을 시각화하고 최적화하는 관리 기법이다. 개발 프로세스 내의 병목 현상을 제거하고 비즈니스 성과를 극대화하는 데 목적이 있다.
고속 푸리에 변환
fft
시간 영역의 신호를 주파수 영역으로 빠르게 변환하는 알고리즘이다. 이 모델에서는 컨볼루션 연산을 효율적으로 수행하여 연산 복잡도를 줄이는 데 사용된다.
근사 최근접 이웃
ann
방대한 벡터 데이터셋에서 쿼리와 가장 유사한 항목을 빠르게 찾아내는 알고리즘으로, 정확도를 일부 희생하는 대신 검색 속도를 비약적으로 향상시킨다.
내부 개발자 포털
idp-internal-developer-portal
개발자가 인프라, 도구, 워크플로우를 한곳에서 관리하고 접근할 수 있게 해주는 내부 플랫폼이다. AI가 기업 내부의 복잡한 개발 환경을 이해하기 위해 참조해야 하는 핵심 컨텍스트 저장소 역할을 한다.
도커 레이어 캐싱
docker-layer-caching
도커 빌드 시 변경되지 않은 레이어를 재사용하여 속도를 높이는 기술이다. 하지만 상위 레이어가 변경되면 하위 레이어 캐시가 모두 무효화되어 대용량 파일 처리 시 병목이 발생한다.
밀도 범함수 이론
density-functional-theory
다체계의 양자 역학적 상태를 전자 밀도의 함수로 설명하는 이론이다. 복잡한 파동 함수 대신 밀도를 사용해 계산량을 줄이는 현대 양자 화학의 핵심 기법이다.
분류 자유도 조절
cfg-scale
모델이 프롬프트를 얼마나 엄격하게 따를지 결정하는 수치이다. 값이 높을수록 프롬프트에 충실하지만 이미지가 왜곡될 수 있고, 낮을수록 창의적이지만 프롬프트 반영도가 떨어진다. 이미지의 안정성과 품질 사이의 균형을 맞추는 데 중요하다.
신경 스타일 전이
neural-style-transfer
하나의 이미지에서 콘텐츠 구조를 추출하고 다른 이미지에서 스타일 특징을 가져와 새로운 이미지를 생성하는 딥러닝 기술이다. CNN의 중간 계층에서 추출한 정보를 조합하여 예술적인 결과물을 만들어낸다.
신경 탄젠트 커널
ntk
무한히 넓은 신경망의 학습 과정을 커널 방법으로 근사하여 분석하는 이론적 도구이다. 신경망의 최적화와 일반화 특성을 수학적으로 이해하는 데 사용된다.
연립 방정식 모델
simultaneous-equation-model
여러 변수 간의 상호 의존 관계를 여러 개의 방정식으로 동시에 표현하는 통계 모델이다. 계량 경제학에서 주로 사용되며, 변수 간의 복잡한 피드백 루프나 인과 구조를 설명하는 데 적합하다.
오픈 웨이트 모델
open-weight-model
모델의 가중치(Weight)가 공개되어 누구나 내려받아 자신의 인프라에서 실행하고 미세 조정할 수 있는 AI 모델이다. Llama나 DeepSeek가 대표적이며, 기업들이 특정 업체에 종속되지 않고 통제권을 갖기 위해 선호하는 방식이다.
외장 그래픽 카드
egpu
노트북이나 PC 외부에 별도의 케이스를 통해 연결하는 그래픽 카드이다. 주로 썬더볼트 인터페이스를 사용하며, 내부 장착 대비 대역폭 손실이 발생할 수 있다.
우도 미포함 추론
likelihood-free-inference
모델의 우도 함수가 명시적으로 주어지지 않거나 계산이 불가능한 상황에서 사후 분포를 추정하는 기법들의 총칭이다.
의료 판독문 생성
medical-report-generation
의료 영상을 분석하여 의학적 소견을 텍스트로 자동 작성하는 기술이다. 정확한 의학 용어 사용과 영상 데이터와의 일치성이 매우 중요하다.
잠재 전문가 혼합
latent-moe
잠재 공간(Latent Space)에서 전문가를 선택하고 할당하는 진화된 MoE 방식이다. NVIDIA의 차기 대형 모델에 적용될 예정이며, 더욱 정교한 전문가 활용을 목표로 한다.
전진 단계별 선택
forward-stepwise-selection
변수가 없는 상태에서 시작하여 모델의 성능을 가장 많이 향상시키는 변수를 하나씩 추가해 나가는 변수 선택 방법이다. 계산이 빠르지만 선택 과정이 다소 불안정할 수 있다.
직접 에너지 무기
direct-energy-weapon
레이저, 마이크로파 등의 에너지를 한곳으로 집중시켜 목표물을 파괴하거나 무력화하는 무기 체계이다. 탄약 제한이 없고 빛의 속도로 공격이 가능하여 드론이나 미사일 방어에 효과적이다.
콜드 스타트 문제
cold-start-problem
새로운 사용자나 아이템이 추가되었을 때 충분한 상호작용 데이터가 없어 적절한 추천을 제공하지 못하는 현상이다. 추천 시스템의 초기 성능과 사용자 경험을 결정짓는 핵심 난제이다.
탄성 가중치 통합
elastic-weight-consolidation
새로운 작업을 학습할 때 이전 작업에 중요했던 가중치가 크게 변하지 않도록 규제하는 알고리즘이다. 이를 통해 신경망이 새로운 정보를 배우면서 기존 지식을 잊어버리는 파괴적 망각 현상을 방지한다.
텐서 특이값 분해
t-svd
텐서를 행렬의 SVD와 유사하게 분해하는 기법으로 t-product 연산을 기반으로 다차원 데이터의 구조를 유지하며 저차원 근사를 수행하는 방식이다.
확장 가능한 제어
scalable-control
AI 시스템이 인간의 지능을 넘어서거나 복잡해지더라도 인간이 지속적으로 시스템을 안전하게 통제하고 감독할 수 있도록 설계된 메커니즘이다. 자동화된 모니터링과 평가 도구를 통해 인간의 개입 효율을 극대화하는 것이 핵심이다.
희소 전문가 혼합
sparse-moe
전체 파라미터 중 일부(전문가)만 선택적으로 활성화하여 추론하는 방식으로, 모델의 용량은 키우면서 실제 연산 비용은 낮게 유지하는 기법이다.
고객 데이터 플랫폼
cdp
여러 소스에서 수집된 고객 데이터를 통합하여 단일한 고객 뷰를 제공하는 플랫폼이다. Grab에서는 1,000개 이상의 사용자 속성을 관리하며 마케팅 및 운영 의사결정의 핵심 기반으로 활용된다.
기계 판독형 스키마
machine-readable-schema
사람이 아닌 컴퓨터 프로그램이나 AI 에이전트가 데이터의 구조와 의미를 즉각적으로 해석하고 처리할 수 있도록 정의된 데이터 규격이다. AI 에이전트가 API를 통해 자율적으로 작업을 수행하는 데 필수적이다.
오픈 아이디 커넥트
oidc
사용자의 신원을 확인하기 위해 OAuth 2.0 프로토콜 위에 구축된 인증 레이어로, 안전한 데이터베이스 접근 제어를 가능하게 한다.
유향 비순환 그래프
directed-acyclic-graph
노드 간의 방향은 존재하지만 순환하는 경로가 없는 그래프 구조입니다. 인과 추론에서 변수 간의 인과 관계를 표현하는 표준적인 도구로 사용되며, 부모 노드에서 자식 노드로 흐르는 인과적 흐름을 명확히 정의합니다.
유향 비순환 그래프
dag
노드 간의 방향은 존재하지만 순환하는 경로가 없는 그래프 구조이다. 인과 추론에서 변수 간의 인과 관계를 모델링하는 데 필수적인 도구로 사용된다.
인간 개입형 시스템
human-in-the-loop
AI의 판단 결과에 사람이 개입하여 검증하거나 수정함으로써 시스템의 정확도와 신뢰성을 높이는 프로세스이다. 금융 등 고정확도가 필요한 분야에서 필수적이다.
직접 선호도 최적화
dpo
두 가지 답변 중 사람이 선호하는 것을 선택한 데이터를 사용하여 모델을 인간의 가치관에 정렬시키는 기법이다. 별도의 보상 모델 없이도 효율적으로 모델의 품질을 높일 수 있다.
평균 플롭스 활용도
mfu
하드웨어가 이론적으로 낼 수 있는 최대 연산 성능 대비 실제 모델 학습이나 추론에 사용된 연산량의 비율이다. 이 수치가 낮을수록 하드웨어 자원이 낭비되고 있음을 의미하며 최적화의 여지가 크다는 지표로 활용된다.
미분 가능한 래스터화
differentiable-rasterization
3D 데이터를 2D 이미지로 변환하는 과정에서 미분이 가능하도록 설계한 기술이다. 이를 통해 렌더링된 이미지와 실제 이미지 사이의 오차를 역전파하여 3D 모델의 파라미터를 최적화할 수 있다. 3DGS의 학습을 가능하게 하는 핵심 메커니즘이다.
법률 분야의 강화학습
rl-in-law
법률적 판단이나 문서 작성 결과에 대해 전문가의 피드백을 주어 모델의 정확도와 신뢰성을 높이는 기법이다. 법률과 같이 정답의 기준이 엄격한 분야에서 모델 성능을 고도화하는 데 필수적이다.
설명 가능한 인공지능
explainable-ai
AI가 특정 결정을 내린 이유를 인간이 이해할 수 있는 방식으로 설명하는 기술이다. 자율주행처럼 안전이 직결된 분야에서 사고 원인 분석 및 신뢰성 확보를 위해 매우 중요하다.
위성 이미지 머신러닝
satml
위성 이미지 데이터와 머신러닝 알고리즘을 결합하여 지구 표면의 변화, 식생, 기후 등을 분석하는 기술이다. 광범위한 지역을 효율적으로 모니터링할 수 있어 환경 보호 및 도시 계획에 필수적이다.
지수 가중치 알고리즘
exponential-weights-algorithm
여러 예측 모델의 가중치를 과거 성능에 따라 지수적으로 조절하며 결합하는 방식이다. 온라인 학습에서 최적의 예측 조합을 찾기 위해 널리 사용되는 메타 알고리즘이다.
미분 가능한 시뮬레이션
differentiable-simulation
시뮬레이션 결과의 변화를 입력 파라미터에 대해 미분할 수 있게 설계하여, 최적화 알고리즘을 통해 로봇의 동작이나 설계를 효율적으로 개선할 수 있게 하는 기술이다.
합성 소수자 오버샘플링 기법
smote
불균형한 데이터셋에서 적은 수의 클래스 데이터를 늘리기 위해 기존 샘플들 사이의 가상 샘플을 생성하는 기법이다. 정형 데이터 증강에서 널리 사용된다.
개별 참여자 데이터 추정량
ipd-estimator
분산된 모든 개별 로우 데이터를 직접 통합하여 계산한 추정치로, 통계적 추론에서 달성할 수 있는 가장 이상적이고 정확한 기준점이 된다.
코드 교환용 증명 키
pkce
OAuth 2.0 인증 코드 그랜트 방식에서 보안을 강화하기 위한 확장 기능이다. 클라이언트가 무작위 문자열인 Code Verifier를 생성하고 그 해시값인 Code Challenge를 전송하여, 인증 코드가 탈취되더라도 실제 클라이언트임을 증명하지 못하면 토큰을 발급받지 못하게 한다.
번역 메모리 교환 형식
tmx
서로 다른 번역 도구 간에 번역 메모리 데이터를 원활하게 주고받기 위해 만들어진 XML 기반의 표준 파일 형식이다.
연산 파티션 실행 모드
cpx
AMD GPU를 최대 8개의 독립적인 연산 파티션으로 나누는 모드이다. 각 파티션은 소프트웨어에 별개의 가상 GPU로 노출되어 병렬 워크로드 처리를 가능하게 한다.
최대 표준화 섭취 계수
suvmax
PET-CT 검사에서 종양 조직이 방사성 의약품을 얼마나 강하게 섭취하는지 나타내는 수치로, 암세포의 대사 활동성과 악성도를 평가하는 핵심 지표다.
첨단 운전자 보조 시스템
adas
운전자의 안전과 편의를 위해 차량이 스스로 주변 상황을 인지하고 제어하는 기술의 총칭이다. 차선 유지, 자동 긴급 제동 등이 포함되며 자율주행으로 가는 중간 단계이다.
고속 푸리에 변환 컨볼루션
fft-convolution
고속 푸리에 변환(FFT)을 사용하여 컨볼루션 연산을 주파수 영역에서 수행하는 기법이다. 시간 영역에서의 복잡한 연산을 단순한 곱셈으로 변환하여 특히 긴 시퀀스 데이터 처리 시 연산 속도를 획기적으로 높여준다.
인간 피드백 기반 강화학습
rlhf
인간의 선호도를 반영하여 AI 모델을 미세 조정하는 기법이다. 모델의 답변이 인간의 윤리나 의도에 부합하도록 유도하지만 외부적 제약에 가깝다는 비판도 존재한다.
오픈 비주얼 추론 및 신경망 최적화
openvino
인텔이 개발한 오픈소스 툴킷으로, 다양한 하드웨어 플랫폼에서 AI 모델의 추론 성능을 최적화하고 실행할 수 있게 돕는다.
분당 비트 수
bpm
Beats Per Minute의 약자로 음악의 속도를 나타내는 단위이다. AI 음악 생성 시 리듬감과 곡의 분위기를 결정하는 핵심 파라미터로 작용한다.
지연 시간 벽
latency-wall
데이터 전송이나 연산 처리 속도의 한계로 인해 모델의 성능 향상이 물리적으로 제약받는 현상이다. 2030년까지 AI 확장을 가로막는 가장 큰 기술적 장애물 중 하나로 꼽힌다.
초당 쿼리 수
qps
시스템이 1초 동안 처리할 수 있는 검색 요청의 개수이다. 시스템의 처리량(Throughput)을 나타내는 핵심 지표로, 높을수록 많은 사용자의 요청을 동시에 처리할 수 있다.
초당 토큰 수
t-s
LLM이 1초당 생성하는 텍스트의 단위를 의미하며, 모델의 추론 속도를 측정하는 가장 핵심적인 지표이다. 수치가 높을수록 사용자가 체감하는 응답 속도가 빨라진다.
가격 인하 계획
markdown-planning
재고 소진과 마진 확보를 위해 판매 추이에 따라 상품 가격을 단계적으로 낮추는 리테일의 핵심 전략이다. 수많은 변수를 고려해야 하는 복잡한 작업으로 에이전틱 AI가 실시간 데이터를 바탕으로 최적의 시점과 폭을 결정할 때 큰 효과를 볼 수 있다.
가상 사설 서버
vps
물리적 서버를 가상화하여 사용자에게 할당한 서버로, AI 모델을 직접 설치하여 운영할 수 있으나 관리 부담과 고정 비용이 발생한다.
개인 식별 정보
pii
이름, 이메일 등 개인을 특정할 수 있는 민감한 데이터이다. 리슨 랩스는 AI를 통해 이를 자동으로 마스킹하여 데이터 보안을 강화한다.
객체 수명 주기
ttl
객체가 시스템 내에서 유효하게 유지되는 기간을 의미하며, 이 기간이 지나면 자동으로 삭제되거나 만료 처리되어 데이터 관리를 자동화한다.
검색 증강 생성
rag
외부 지식 베이스에서 관련 정보를 검색하여 LLM의 답변 생성에 활용하는 기법이다. 프로덕션 환경에서는 데이터 품질과 검색 전략에 따라 성능이 크게 좌우되며, 단순 모델 성능보다 파이프라인 설계가 중요하다.
고객 관계 관리
crm
고객 데이터, 거래 이력, 공급망 정보를 통합 관리하는 소프트웨어 시스템이다. AI 에이전트가 과거 거래 내역을 기억하고 적절한 가격을 책정하며 공급업체를 관리하는 데 핵심적인 데이터 소스로 활용됐다.
고객 생애 가치
ltv
한 명의 고객이 비즈니스와 관계를 유지하는 전체 기간 동안 발생시키는 총 수익의 기대치이다. SaaS 기업에서 마케팅 비용 집행과 재무 계획 수립의 핵심 지표로 활용된다.
고정 예산 설정
fixed-budget-setting
데이터를 수집하거나 실험을 수행할 수 있는 총 횟수(예산)가 사전에 엄격하게 정해진 상태에서 오류 확률을 최소화하도록 설계된 실험 환경이다.
곡선 아래 면적
auc
모델의 분류 성능을 나타내는 지표로, ROC 곡선 아래의 면적을 의미하며 1에 가까울수록 성능이 우수함을 나타낸다.
광학 문자 인식
ocr
이미지나 PDF 내의 텍스트를 기계가 읽을 수 있는 데이터로 변환하는 기술이다. 스캔된 문서나 복잡한 레이아웃의 문서에서 텍스트를 추출할 때 사용된다.
교차 모달 검색
cross-modal-retrieval
서로 다른 형태의 데이터 간에 정보를 검색하는 기술로, 여기서는 이미지 쿼리를 사용해 PDF 내의 시각 정보를 찾는 기능을 의미한다. 데이터의 형식에 구애받지 않고 통합적인 검색 경험을 제공하는 것이 핵심이다.
구매 가능 예산
open-to-buy
특정 기간 동안 추가로 구매 가능한 재고 예산 한도이다. 에이전틱 도구는 수요 예측 변화에 따라 이 예산을 동적으로 재조정하여 현금 흐름을 최적화한다.
구면 조화 함수
spherical-harmonics
구 표면에서 정의되는 직교 함수계로, 3D 공간에서 시점에 따른 색상 변화를 효율적으로 표현하기 위해 사용된다. 3DGS에서는 각 가우시안의 색상을 시점에 따라 다르게 보이게 하여 사실적인 질감을 구현하는 데 쓰인다.
국방 산업 기반
defense-industrial-base
군사 장비와 물자를 생산, 유지, 보수하는 데 필요한 국가의 산업 역량과 공급망을 의미한다. 국가 안보를 위해 필수적인 자재와 기술을 자국 내에서 안정적으로 확보하는 능력을 포함한다.
근거 기반 지각
grounded-perception
AI가 시각적 질문에 답할 때 이미지 내 특정 좌표나 영역을 바운딩 박스로 명시하는 기술이다. 답변의 근거를 시각적으로 증명함으로써 사용자가 AI의 판단 과정을 검증하고 신뢰할 수 있게 한다.
근본 원인 분석
root-cause-analysis
문제의 표면적인 증상만이 아니라 발생하게 된 근본적인 이유를 찾아내는 과정이다. Gemini 3 Flash가 시스템 로그와 신호를 분석하여 장애의 핵심 원인을 식별함으로써 정확한 처방을 가능하게 한다.
깁스 사후 분포
gibbs-posterior
손실 함수를 기반으로 정의된 사후 분포로, 전통적인 베이지안 사후 분포의 일반화된 형태이다. 모델의 파라미터가 데이터와 얼마나 잘 맞는지와 사전 지식을 결합하여 확률적으로 표현한다.
꼬리 지연 시간
tail-latency
시스템 응답 시간 중 가장 느린 상위 퍼센트의 지연 시간이다. 에이전트처럼 여러 단계의 호출이 필요한 시스템에서 전체 사용자 경험을 결정짓는 중요한 성능 지표이다.
논리 추론 계층
logical-reasoning-layer
모델이 정보를 처리할 때 단순 패턴 매칭이 아닌 단계별 논리적 사고 과정을 거치도록 설계된 아키텍처이다. 복잡한 도메인 지식을 결합하여 인과 관계나 구조적 정밀도가 필요한 작업에 활용된다.
다음 토큰 예측
next-token-prediction
주어진 문맥 다음에 올 가장 확률 높은 단어를 예측하는 LLM의 핵심 학습 메커니즘이다. 이 방식이 실제 언어 이해를 가능케 하는지, 아니면 정교한 통계적 모방에 그치는지에 대한 대립의 중심에 있다.
다중 서열 정렬
msa
Multiple Sequence Alignment의 약자로, 세 개 이상의 생물학적 서열을 비교하여 상동성을 찾는 기법이다. BioML 분야에서 단백질 구조와 기능을 예측하는 데 중요한 기초 단계이다.
다중 참조 입력
multi-reference-input
이미지 생성 시 한 장이 아닌 여러 장의 참고 이미지를 모델에 입력으로 제공하는 기법이다. 이를 통해 특정 인물이나 사물의 다양한 각도와 특징을 모델이 더 정확하게 파악하여 생성 결과물에서 일관성을 유지할 수 있게 한다.
다중 참조 편집
multi-reference-editing
여러 장의 이미지를 입력으로 제공하여 생성되는 이미지의 스타일, 캐릭터, 제품의 일관성을 유지하는 기술이다. 이를 통해 특정 인물이나 사물의 정체성을 유지하면서 다양한 구도와 배경의 이미지를 생성할 수 있다.
대형 언어 모델
llm
방대한 양의 텍스트 데이터를 학습하여 인간처럼 자연스러운 언어를 이해하고 생성할 수 있는 AI 모델이다. Character.AI의 캐릭터 대화 시스템의 기반이 되는 기술이다.
도구 공간 간섭
tool-space-interference
AI 에이전트에게 너무 많은 외부 도구를 제공할 경우 발생하는 통계적 노이즈로 인해 오히려 추론 성능이 저하되는 현상이다. 효율적인 에이전트 설계를 위해 도구의 수를 최적화하는 것이 중요하다.
동적 가격 결정
dynamic-pricing
시장 수요, 경쟁사 가격, 재고 수준 등 실시간 데이터를 기반으로 상품 가격을 유연하게 변경하는 전략이다. AI 에이전트는 수천 개의 SKU에 대해 실시간으로 최적의 가격을 계산하고 적용함으로써 수익을 극대화한다.
로그 선행 기입
wal
데이터베이스의 원자성과 내구성을 보장하기 위해 실제 데이터 파일에 변경 사항을 적용하기 전, 로그 파일에 먼저 기록하여 장애 발생 시 복구를 가능하게 하는 기법이다.
로봇 운영 체제
ros
로봇 응용 프로그램을 개발하기 위한 오픈소스 프레임워크로, 하드웨어 추상화와 프로세스 간 메시지 전달 기능을 제공하여 복잡한 로봇 시스템 구축을 돕는다.
로컬 학습 규칙
local-learning-rule
네트워크 전체의 오차를 전파하는 대신, 해당 시냅스에 연결된 뉴런들의 활동 정보만을 이용해 가중치를 업데이트하는 방식이다. 생물학적 뇌의 시냅스 가소성(Plasticity)과 유사하며 하드웨어 구현 시 병렬 처리에 유리하다.
멀티 토큰 예측
mtp
한 번의 추론 단계에서 다음 하나의 토큰이 아닌 여러 개의 토큰을 동시에 예측하는 기법이다. 학습 효율을 높이고 추론 속도를 가속화하는 데 기여한다.
명세 기반 개발
spec-driven-development
코드를 작성하기 전 상세한 기술 명세서를 먼저 정의하고, 이를 바탕으로 AI 에이전트가 구현을 담당하게 하는 개발 방법론이다. 구조화된 워크플로를 지향하지만 수정 비용이 높을 수 있다.
명세 중심 설계
spec-driven-design
구현에 앞서 API의 작동 방식과 데이터 구조를 명확한 명세서(Spec)로 먼저 정의하는 방식이다. AI 에이전트가 시스템을 이해하고 정확하게 호출하기 위한 필수적인 토대가 된다.
모델 기반 채점
model-graded-scoring
더 강력한 성능을 가진 대형 언어 모델을 판사(Judge)로 활용하여 다른 모델의 출력물을 평가하는 방식이다. 단순한 일치 여부를 넘어 명확성이나 논리성 같은 정성적인 지표를 수치화할 수 있어 에이전트 최적화 루프의 핵심 평가 지표로 사용된다.
모델 예측 제어
model-predictive-control
모델 예측 제어는 시스템의 수학적 모델을 사용하여 미래의 거동을 예측하고 최적의 제어 입력을 결정하는 기법이다. 매 시점마다 최적화 문제를 해결해야 하므로 계산량이 많지만, 복잡한 제약 조건을 고려한 정밀한 제어가 가능하다. 이 연구에서는 로봇의 고난도 기동을 계획하는 전문가 역할을 수행한다.
목표 상태 사양
desired-state-specs
시스템이나 코드가 도달해야 하는 최종적인 상태를 명확하게 정의한 지침이다. 코딩 에이전트가 작업을 수행할 때 판단의 기준점이 되며 사양이 모호할 경우 에이전트가 잘못된 결과물을 생성할 위험을 방지한다.
문항 반응 이론
irt
개별 문항의 특성과 응답자의 능력을 확률 모델로 연결하는 통계적 방법론이다. AI 평가에서는 모델의 정답률뿐만 아니라 문제의 난이도와 변별력을 함께 고려하여 역량을 정밀하게 측정하는 데 쓰인다.
문항 반응 이론
item-response-theory
피험자의 능력과 문항의 특성 사이의 관계를 확률 모델로 설명하는 통계적 이론이다. AI 평가에서는 모델의 점수뿐만 아니라 각 테스트 문항이 모델의 능력을 얼마나 잘 측정하는지를 분석하는 데 사용되어 평가의 정밀도를 높인다.
밀도 비율 추정
density-ratio-estimation
두 확률 분포의 밀도 함수 간의 비율을 직접 추정하는 기법이다. 각 분포를 개별적으로 추정하는 것보다 효율적이며 이상치 탐지, 변화점 감지, 공변량 시프트 적응 등 다양한 머신러닝 작업의 핵심 요소로 활용된다.
보안 운영 센터
soc
조직의 보안 상태를 모니터링하고 위협을 탐지 및 대응하는 중앙 집중식 부서이다. 인력과 도구를 통합하여 보안 사고에 대응하는 핵심 역할을 수행한다.
보조 공학 기술
assistive-technology
장애를 가진 사람들의 기능을 향상시키거나 유지하기 위해 사용되는 장비나 소프트웨어를 의미한다. 이 아티클에서는 AI를 결합하여 기존 보조 기기의 속도와 감정 표현 한계를 극복하는 사례로 다뤄진다.
보편 가치 이슈
valence-issue
모든 유권자나 대중이 공통적으로 선호하거나 혐오하는 주제이다. 논쟁의 여지가 없는 선악 구도를 형성하여 정치적이나 사회적으로 가장 안전한 비판의 근거가 된다.
복사 시점 쓰기
copy-on-write
데이터를 실제로 수정하기 전까지는 원본 리소스를 공유하다가, 수정이 발생하는 시점에만 해당 데이터를 복사하여 별도로 저장하는 효율적인 자원 관리 기법이다.
볼록 공액 함수
convex-conjugate
함수의 기울기와 변수 사이의 최대 차이를 나타내는 변환으로, 르장드르-펜첼 변환이라고도 한다. 정규화된 MDP에서 최적 정책을 계산할 때 정규화 함수의 공액 함수 기울기를 사용하여 닫힌 형태의 해를 구하는 데 필수적이다.
북극 진단 지표
arctic-diagnostics
시베리아 눈 덮임, 해빙 범위 등 북극의 상태를 나타내는 지표들이다. 중위도 겨울 날씨의 변동성을 결정짓는 핵심적인 물리적 변수로 활용된다.
분할 상환 계산
amortized-computation
초기 설정이나 일회성 계산 비용을 여러 번의 반복 작업에 나누어 배분함으로써, 전체적인 작업당 평균 비용을 낮추는 최적화 방식이다.
분할 상환 추론
amortized-inference
오프라인에서 미리 모델을 학습시켜 두어, 새로운 데이터가 들어왔을 때 반복적인 계산 없이 즉각적으로 추론 결과를 내놓는 방식이다. 초기 학습 비용은 높지만 반복 사용 시 전체 비용이 크게 절감된다.
분해 가능 밀도
factorizable-density
고차원 확률 밀도 함수가 여러 개의 저차원 성분들의 곱으로 표현될 수 있는 구조를 말한다. 베이지안 네트워크 등에서 흔히 발견되며 이러한 구조를 활용하면 고차원 데이터 학습의 복잡도를 크게 낮출 수 있다.
붉은 여왕 가설
red-queen-hypothesis
생태계의 생물들이 주변 환경이나 경쟁자에 맞춰 끊임없이 진화하지 않으면 도태된다는 원리다. AI 분야에서는 에이전트가 고정된 목표가 아닌 변화하는 경쟁 상대에 맞춰 계속 발전해야 하는 동적 적대 환경을 의미한다.
사전 확률 선택
prior-selection
사전 확률 선택은 베이지안 추론에서 데이터를 관측하기 전 모델의 매개변수나 함수 형태에 대해 가정하는 초기 확률 분포를 결정하는 과정이다. 적절한 사전 확률은 모델의 수렴 속도와 예측 성능에 큰 영향을 미치며, 특히 신경망의 불확실성을 정확히 모델링하기 위한 핵심 단계이다.
상태 공간 모델
ssm
시계열 데이터나 긴 시퀀스를 효율적으로 처리하기 위해 상태 방정식을 사용하는 아키텍처이다. 트랜스포머의 제곱 복잡도 문제를 선형 복잡도로 해결하여 추론 효율성을 높이는 것이 핵심이다.
성과 기반 학습
outcome-based-learning
학습자가 교육 과정을 마친 후 실제로 수행할 수 있는 구체적인 능력이나 결과물에 초점을 맞추는 교육 설계 방식이다. 학습 목표를 명확히 하여 교육의 효율성을 높이는 데 중요하다.
소스 코드 절도
source-code-theft
타인의 소프트웨어 설계도인 소스 코드를 무단으로 복제하거나 사용하는 행위이다. 이는 저작권법 및 부정경쟁방지법에 저촉되는 심각한 법적 문제이다. AI 업계에서는 모델 가중치뿐만 아니라 이를 구동하는 내부 로직의 보안 유지가 기업 경쟁력의 핵심으로 간주된다.
소형 언어 모델
slm
수십억 개 수준의 상대적으로 적은 파라미터를 가진 언어 모델이다. 적은 연산 자원으로도 구동 가능하여 스마트폰이나 엣지 기기에서 개인정보 보호와 속도를 동시에 확보할 수 있다.
수면 다원 검사
polysomnography
수면 중 발생하는 뇌파, 안구 운동, 근육 긴장도, 심전도, 호흡 등을 종합적으로 기록하는 검사이다. 수면 장애 진단의 표준 방법이며, 본 연구에서는 이 방대한 생체 신호를 AI 학습의 기초 데이터로 활용했다.
시각 언어 모델
vlm
이미지와 텍스트를 동시에 이해하고 처리할 수 있는 AI 모델이다. 문서의 시각적 구조를 직접 분석하여 텍스트와 레이아웃 정보를 한 번에 파악하는 데 활용된다.
신경 하위 공간
neural-subspace
수많은 신경세포의 활동 중 특정 작업이나 기능을 수행할 때 나타나는 고유한 활동 패턴의 집합이다. 연구진은 서로 다른 작업들이 이 하위 공간(인지 블록)을 공유함으로써 효율적인 학습이 일어남을 확인했다.
심층 거리 변환
deep-distance-transform
이미지 내 객체의 중심으로부터 경계까지의 거리를 학습하여 객체를 분리하고 식별하는 딥러닝 기법이다. 개별 객체가 밀집된 환경에서 인스턴스 분할 성능을 높이는 데 핵심적인 역할을 한다. 나무 수관처럼 서로 겹쳐 있는 객체를 개별적으로 구분하는 데 효과적이다.
언어 처리 장치
lpu
Language Processing Unit의 약자로, 대규모 언어 모델의 추론 속도를 극대화하기 위해 설계된 Groq의 특수 목적 하드웨어 가속기이다. 에이전트의 다단계 추론 과정에서 발생하는 지연 시간을 획기적으로 줄여준다.
연간 반복 매출
arr
구독형 비즈니스 모델에서 1년 동안 발생할 것으로 예상되는 매출 지표이다. 클로드 코드가 단기간에 10억 달러 ARR을 달성했다는 것은 해당 제품의 시장 적합성과 성장성이 매우 높음을 의미한다.
원격 코드 실행
rce
공격자가 대상 시스템에서 임의의 명령어나 코드를 실행할 수 있는 보안 취약점이다. AI 코딩 도구가 시스템 권한을 가질 경우 심각한 보안 사고로 이어질 수 있다.
월간 반복 매출
mrr
구독 기반 서비스에서 매달 발생하는 고정적인 매출이다. 인디 개발자의 비즈니스 성공 여부를 판단하는 핵심 지표로 사용된다.
유한 샘플 환경
finite-sample-regime
데이터의 양이 무한히 많다고 가정하는 점근적 상황과 대조적으로, 실제로 가용한 데이터의 수가 제한적인 상황을 의미한다. 소규모 데이터에서의 통계적 유의성 확보가 중요하다.
유한 요소 분석
finite-element-analysis
복잡한 구조물을 유한한 수의 작은 요소로 나누어 각 요소에서의 물리적 변화를 계산함으로써 전체 구조의 변형이나 응력을 예측하는 수치 해석 기법이다. 설계의 안정성을 검증하는 데 필수적이다.
인간 지능 계층
human-intelligence-layer
AI의 자동화된 결과물에 인간의 검증, 맥락 이해, 경험을 결합하여 신뢰성을 확보하는 구조적 단계를 의미한다. 저품질 생성 콘텐츠와 차별화되는 고품질 데이터를 유지하기 위한 전략적 개념이다.
인공 일반 지능
agi-artificial-general-intelligence
특정 분야를 넘어 인간이 수행할 수 있는 모든 지적 작업을 수행할 수 있는 AI이다. 재귀적 자가 개선은 AGI에 도달하기 위한 핵심적인 기술적 단계 중 하나로 간주된다.
인과 표현 학습
causal-representation-learning
저차원의 관측 데이터에서 고차원의 독립적인 인과 변수를 추출하는 기술로, 모델의 강건성과 해석력을 높이는 데 중요하다.
인지 부하 이론
cognitive-load-theory
인간의 뇌가 정보를 처리할 때 사용하는 작업 기억의 한계를 설명하는 이론으로, 이 아티클에서는 모델이 불필요한 정보 처리에 자원을 낭비하는 현상을 설명하는 데 사용된다.
일괄 처리 작업
batch-operation
여러 개의 데이터를 하나의 그룹으로 묶어 한꺼번에 처리하는 방식이다. 미드저니 웹에서 수백, 수천 개의 이미지를 동시에 다운로드하거나 분류할 때 사용되며 작업 효율성을 극대화한다.
자기 선호 편향
self-preference-bias
모델이 자신이 이전에 생성한 실패한 궤적이나 답변을 과도하게 신뢰하여 오류를 반복하는 경향이다. 이를 해결하기 위해 다른 모델을 통한 외부 검토가 필요하다.
자율 드론 스웜
autonomous-drone-swarm
다수의 드론이 중앙의 직접적인 통제 없이 상호 통신하며 협동하여 임무를 수행하는 체계이다. AI를 통해 복잡한 환경에서 스스로 경로를 탐색하고 목표를 식별함으로써 군사 작전의 효율성을 극대화한다.
장기 계획 수립
long-horizon-planning
복잡하고 긴 단계가 필요한 목표를 달성하기 위해 일련의 행동을 미리 설계하고 관리하는 능력이다. 에이전트가 단기적 과제를 넘어 프로젝트 단위의 업무를 수행하는 핵심 기술이다.
재고 관리 코드
sku
Stock Keeping Unit의 약자로, 재고 관리를 위한 최소 단위의 식별자이다. 에이전틱 시스템은 수만 개의 SKU를 실시간으로 개별 모니터링하여 최적의 재고 수준을 유지한다.
전력 사용 효율
pue
데이터 센터의 총 전력 사용량을 IT 장비 전력 사용량으로 나눈 값이다. 1.0에 가까울수록 효율적이며, 냉각 및 기타 설비에 낭비되는 에너지가 적음을 의미한다.
전방 강도 함수
forward-intensity-function
특정 시점 이후에 사건이 발생할 즉각적인 확률을 모델링하는 함수이다. 시계열 데이터에서 동적인 변화를 반영하여 미래 사건의 발생 가능성을 정밀하게 추적하는 데 사용된다.
전역 사전 학습
global-pretraining
방대한 전 지구적 데이터를 사용하여 모델을 먼저 학습시키는 과정이다. 일반적인 특징을 먼저 배운 후 특정 작업에 맞춰 미세 조정함으로써 학습 효율을 높이는 데 사용된다.
전자 건강 기록
ehr
환자의 진료 이력, 검사 결과, 처방 내역 등을 디지털 형태로 저장한 기록 체계이다. AI 학습의 핵심 데이터로 사용되지만 민감한 개인정보를 포함하고 있어 엄격한 관리가 요구된다.
전자 증거 개시
e-discovery
소송과 관련된 디지털 데이터를 수집, 보존, 검토하는 법적 절차로, AI를 활용해 방대한 문서 중 증거 가치가 있는 자료를 선별하는 속도를 획기적으로 높인다.
전체 자율 주행
fsd
테슬라의 자율주행 시스템으로, 운전자의 개입 없이 차량이 스스로 주행하는 것을 목표로 한다. 최근 머스크는 단순 규칙 기반이 아닌 AI 추론 능력을 도입하여 성능을 개선하겠다고 발표했다.
정류 선형 유닛
relu
입력이 0보다 작으면 0을, 0보다 크면 입력값을 그대로 출력하는 활성화 함수이다. 신경망 학습 시 기울기 소실 문제를 완화하며 계산 효율성이 높아 널리 사용된다.
주변 구조 모델
marginal-structural-model
인과 추론에서 교란 요인을 통제하여 처치의 인과적 효과를 추정하기 위해 사용되는 모델이다. 주로 가중치 산출 방식을 통해 전체 집단의 평균적 처치 효과를 계산하는 데 쓰인다.
중간 소실 현상
lost-in-the-middle
긴 문맥의 중간에 위치한 정보에 대해 모델의 주의력이 급격히 떨어지는 현상이다. 이로 인해 초기 시스템 프롬프트에 정의된 복잡한 규칙들이 긴 대화 도중 무시되기 쉽다.
증권 담보 대출
margin-loan
보유한 주식을 담보로 자금을 빌려 추가 주식을 매수하는 레버리지 투자 방식이다. 상승장에서는 수익을 극대화하지만, 주가 하락 시 담보 가치 미달로 인한 강제 청산(Margin Call)을 유발하여 시장 붕괴를 가속화하는 원인이 된다.
지도 미세 조정
supervised-fine-tuning
사전 학습된 모델을 특정 데이터셋과 정답 쌍을 사용하여 추가로 학습시켜 특정 작업에 최적화하는 과정이다. 강화학습을 적용하기 전 모델의 기초적인 행동 양식을 설정하는 단계로 자주 활용된다.
지도 미세 조정
sft
미리 정의된 프롬프트와 정답 쌍을 사용하여 모델을 특정 작업이나 스타일로 직접 학습시키는 과정이다. 모델이 지시사항을 따르는 능력을 향상시키는 데 핵심적인 역할을 한다.
지리 공간 매핑
geospatial-mapping
지구 표면의 위치 정보와 관련된 데이터를 수집하고 분석하여 시각화하는 기술이다. 위성 이미지 분석이나 자율주행 지도 제작에 필수적이다.
지수 이동 평균
ema
학습 과정에서 모델 가중치의 지수 이동 평균을 별도로 유지하는 기법이다. 최신 가중치보다 과거 가중치의 영향을 점진적으로 줄여가며 평균을 산출하여 모델의 일반화 성능을 높인다. 학습 중 발생하는 노이즈를 억제하고 추론 시 더 안정적인 결과를 제공한다.
지시 이행 능력
instruction-following
모델이 사용자의 구체적인 명령이나 제약 조건을 얼마나 정확하게 따르는지를 나타내는 성능 지표이다. 특정 단어나 기호 사용을 금지하는 등의 세밀한 제어 능력을 포함한다.
지침 계층 구조
instruction-hierarchy
여러 출처의 명령이 충돌할 때 어떤 명령을 우선할지 결정하는 체계이다. OpenAI의 경우 플랫폼 지침이 사용자 지침보다 높은 우선순위를 가지며, 이것이 모델의 반응을 제한하는 원인이 되기도 한다.
참조 횟수 계산
reference-counting
객체를 가리키는 참조의 개수를 추적하여 0이 되면 즉시 메모리를 해제하는 방식이다. 파이썬의 가장 기본적이고 즉각적인 메모리 관리 기법으로 실시간 자원 회수를 가능하게 한다.
책임 제한 한도
liability-cap
기업이 서비스 오류나 사고 발생 시 사용자에게 지불해야 하는 최대 보상 금액을 미리 정해두는 법적 장치이다.
초과 위험 경계
excess-risk-bound
학습된 모델의 기대 위험과 최적 모델의 최소 위험 사이의 차이에 대한 수학적 상한선이다. 알고리즘이 데이터 양이나 노이즈 수준에 따라 얼마나 최적해에 가까워질 수 있는지를 이론적으로 보장한다.
최소 권한 원칙
principle-of-least-privilege
사용자나 프로세스에 업무 수행에 필요한 최소한의 권한만 부여하여 보안 사고 발생 시 피해 범위를 최소화하는 보안 설계 원칙이다.
최소 권한 원칙
least-privilege
사용자나 시스템에 특정 작업을 수행하는 데 필요한 최소한의 권한만 부여하는 보안 원칙이다. AI 에이전트가 민감한 파일이나 네트워크에 무분별하게 접근하는 것을 방지하기 위해 필수적이다.
최신 정보 편향
recency-bias
모델이 문맥의 끝부분에 있는 정보를 더 중요하게 처리하는 경향이다. 이 특성을 활용해 의사결정 직전에 지침을 주입함으로써 에이전트의 행동 제어력을 극대화할 수 있다.
추론 시간 연산
inference-time-compute
모델이 답변을 내놓기 전에 더 많은 연산 자원을 사용하여 사고 과정을 거치는 기법이다. OpenAI의 o1 모델처럼 모델이 더 오래 생각하게 함으로써 복잡한 추론 문제를 해결하는 능력을 극대화한다.
추론 지연 시간
inference-latency
AI 모델이 입력을 받아 결과를 생성하기까지 걸리는 시간을 의미한다. 실시간 대화형 서비스에서 사용자 경험을 결정짓는 핵심 지표로, 하드웨어 성능과 최적화에 따라 단축될 수 있다.
추상 구문 트리
ast
프로그래밍 언어의 소스 코드 구조를 트리 형태로 표현한 것이다. 코드의 문법적 관계를 정의하며, LLM이 단순 텍스트가 아닌 코드의 논리적 구조를 이해하는 데 필수적이다.
커널 릿지 회귀
kernel-ridge-regression
선형 릿지 회귀에 커널 트릭을 결합하여 비선형 관계를 모델링하는 기법이다. 고차원 특징 공간으로 데이터를 매핑하여 복잡한 패턴을 학습하면서도 L2 규제를 통해 과적합을 방지한다.
태그 중복 제거
tag-deduplication
프롬프트 내에서 중복되는 단어나 태그를 자동으로 찾아 하나만 남기고 제거하는 과정이다. 여러 스타일을 동시에 적용할 때 발생할 수 있는 프롬프트의 불필요한 비대화를 방지한다. 모델이 특정 태그에 과도하게 가중치를 두는 현상을 막아 결과물의 품질을 일정하게 유지하는 역할을 한다.
텐서 처리 장치
tpu
구글이 머신러닝 워크로드를 가속화하기 위해 독자적으로 개발한 커스텀 집적 회로(ASIC)이다. 텐서 연산에 최적화되어 일반적인 CPU나 GPU보다 AI 학습 및 추론에서 높은 전력 효율과 성능을 제공한다.
통합 개발 환경
ide
코드 작성, 편집, 디버깅, 컴파일 등 소프트웨어 개발에 필요한 모든 도구를 하나의 인터페이스에서 제공하는 프로그램이다. Cursor는 AI 기능이 통합된 차세대 IDE에 해당한다.
평균 복구 시간
mttr
장애가 발생한 시점부터 서비스가 정상화될 때까지 걸리는 평균 시간이다. 시스템의 복원력과 운영 팀의 효율성을 측정하는 핵심 지표로 활용된다.
평균 제곱 오차
mean-squared-error
예측값과 실제값의 차이를 제곱하여 평균한 값으로, 회귀 모델의 예측 정확도를 평가하는 가장 대표적인 지표이다. 값이 작을수록 모델의 성능이 우수함을 의미한다.
폭이 없는 문자
zero-width-character
화면에 표시되는 폭이 없어 인간의 눈에는 보이지 않지만 데이터상으로는 존재하는 유니코드 문자이다. AI 모델은 이를 텍스트 데이터로 인식하여 처리할 수 있다.
횔더 연속 함수
holder-continuous-function
함수의 변화량이 입력 값 변화량의 특정 거듭제곱에 비례하여 제한되는 연속 함수의 한 종류이다. 일반적인 연속성보다 강한 조건을 가지며 함수 근사 이론에서 성능 분석의 표준 클래스로 사용된다.
감쇄 파동 방정식
damped-wave-equation
시간이 지남에 따라 에너지가 줄어드는 파동의 움직임을 설명하는 물리 방정식이다. 언어 데이터에서 멀리 떨어진 토큰 간의 영향력이 서서히 줄어드는 특성을 모델링하는 데 활용된다.
교대 미러 하강법
alternating-mirror-descent
두 플레이어가 순차적으로 자신의 전략을 업데이트하는 미러 하강법의 변형으로, 주로 빌리니어 제로섬 게임의 평형점을 찾는 데 사용된다. 각 단계에서 근접 항(proximity term)을 사용하여 업데이트를 안정화하며, 게임 이론적 최적화 문제의 핵심 알고리즘이다.
국소 선형 추정량
local-linear-estimator
특정 지점 근처의 데이터에 가중치를 두어 선형 회귀를 수행함으로써 복잡한 비선형 함수를 추정하는 비모수적 방법이다. 경계 편향을 줄이는 데 효과적이며 함수의 도함수 추정에도 강점이 있다.
근사 교대 최소화
proximal-alternating-minimization
여러 변수가 얽힌 함수를 최적화할 때 각 변수를 순차적으로 업데이트하며, 근사 항(Proximal term)을 추가하여 수렴의 안정성을 유도하는 방식이다.
근사 동적 계획법
approximate-dynamic-programming
복잡한 최적 제어 문제를 해결하기 위해 가치 함수나 정책을 근사화하여 계산 효율을 높이는 방법이다. 현대의 심층 강화학습(Deep RL)과 밀접한 관련이 있다.
근사 정책 최적화
ppo
Proximal Policy Optimization의 약자로, 강화학습에서 널리 쓰이는 정책 최적화 알고리즘이다. 학습 과정의 안정성이 높고 구현이 비교적 쉬워 다양한 로봇 제어 작업의 기본 알고리즘으로 권장된다.
노동 소득 분배율
labor-share
국민 소득 중 노동의 대가로 노동자에게 돌아가는 보상의 비율이다. 이 수치가 낮아진다는 것은 경제 성장의 혜택이 노동자보다 기업의 이윤이나 자본가에게 더 많이 돌아가고 있음을 의미한다.
미세 전극 어레이
microelectrode-array
뇌 표면에 이식되어 개별 뉴런의 전기적 활동을 정밀하게 기록하는 장치다. 수백 개의 미세한 전극이 동시에 신호를 수집하여 머신러닝 모델에 풍부한 데이터를 제공한다.
벨만 최적 방정식
bellman-optimality-equation
현재 상태의 최적 가치를 다음 상태의 최적 가치와 즉각적인 보상의 합으로 표현한 재귀 방정식이다. 모든 상태에서 최대의 기대 보상을 얻기 위한 최적의 의사결정 구조를 정의하며, 강화학습 알고리즘의 이론적 토대가 된다.
분포 강건 최적화
distributionally-robust-optimization
훈련 데이터의 분포가 테스트 시점에 변할 수 있음을 가정하고, 가능한 최악의 분포 상황에서도 모델이 일정한 성능을 유지하도록 최적화하는 기법이다. 단순한 평균 성능 극대화보다 모델의 안정성과 신뢰성을 높이는 데 중점을 둔다.
손실 추측 디코딩
lossy-speculative-decoding
타겟 모델의 출력과 완벽하게 일치하지 않더라도 최종 품질에 영향이 없다면 드래프트 토큰을 수용하는 방식이다. 약간의 정확도를 희생하고 더 높은 속도 향상을 얻는다.
시간 기반 역전파
bptt
Backpropagation Through Time의 약자로, 순환 신경망(RNN)이나 LSTM에서 시계열 데이터를 학습시키기 위해 오차를 시간 역방향으로 전파하는 기법이다. 에이전트의 과거 행동이 현재에 미치는 영향을 학습하는 데 필수적이다.
위험 기반 테스팅
risk-based-testing
소프트웨어의 결함 발생 가능성과 비즈니스 영향도를 분석하여 우선순위가 높은 영역에 테스트 자원을 집중하는 전략이다. AI가 확보해준 시간을 이 분석 작업에 투자하는 것이 핵심이다.
인간 승인 게이트
human-approval-gate
AI 에이전트가 자율적으로 작업을 수행하되, 파일 삭제나 외부 API 호출과 같이 위험도가 높은 작업을 실행하기 전 반드시 사람의 명시적인 승인을 받도록 하는 안전 장치이다. 에이전트의 오작동으로 인한 피해를 막는 핵심적인 보안 패턴이다.
인과 식별 가능성
causal-identifiability
관측된 데이터의 분포로부터 인과 효과를 유일하게 결정할 수 있는지 여부를 의미합니다. 모든 인과 관계가 데이터만으로 파악되는 것은 아니기에, 특정 조건 하에서 인과 매개변수를 계산할 수 있는지 판별하는 것이 인과 추론의 핵심입니다.
좌표 참조 시스템
crs
지표면의 위치를 수치로 나타내기 위해 사용하는 기준 체계이다. AI 모델이 위성 이미지나 지도 데이터를 처리할 때 실제 지리적 위치와 일치시키기 위해 반드시 정의되어야 하는 기술적 요소이다.
좌표 참조 시스템
coordinate-reference-system
지구상의 위치를 좌표로 나타내기 위한 체계이다. AI 모델이 지리 데이터를 실제 지형과 일치시켜 해석하기 위해 필수적인 기술적 요소이다.
차량 호출 서비스
ride-hailing
모바일 앱을 통해 승객과 차량을 연결해주는 서비스이다. 웨이모는 이를 운전자 없는 자율주행 차량으로 구현하여 24시간 운영 가능한 이동 서비스를 제공한다.
초기 다수 수용자
early-majority
기술 수용 주기에서 혁신가와 초기 수용자 다음으로 기술을 받아들이는 대중 집단이다. 이 단계에 진입했다는 것은 기술이 실험적 단계를 지나 시장에 안정적으로 안착하고 대중화되기 시작했음을 의미한다.
초기 침투 브로커
initial-access-broker
기업 네트워크에 대한 초기 접근 권한을 획득한 후 이를 랜섬웨어 운영자 등 다른 범죄자에게 판매하는 중개인이다. 이들은 피싱이나 취약점 공격을 통해 권한을 확보하며 사이버 범죄 생태계의 분업화를 가속화하는 핵심 역할을 수행한다.
폐쇄 루프 시스템
closed-loop-system
데이터 생성과 모델 학습이 상호 피드백을 주고받으며 지속적으로 성능을 개선하는 구조로, AI 신약 개발의 효율성을 극대화하는 방식이다.
학습 관리 시스템
lms
Learning Management System의 약자로, 온라인으로 교육 콘텐츠를 배포하고 학습 과정을 관리하며 성적을 추적하는 소프트웨어 플랫폼이다. Google Classroom이나 Canvas가 대표적인 사례이다.
헥스 코드 정확도
hex-code-accuracy
디지털 색상 표기법인 Hex 코드를 모델이 정확히 인식하여 브랜드 고유 컬러 등을 정밀하게 재현하는 기능이다. 기업의 브랜드 가이드라인을 준수하는 데 필수적이다.
회전 위치 임베딩
rope
회전 행렬을 사용하여 토큰의 상대적 위치 정보를 주입하는 기법으로 현재 대부분의 LLM에서 표준으로 사용된다.
경계 경로 프로토콜
bgp
인터넷에서 서로 다른 네트워크(AS) 간에 라우팅 정보를 교환하는 핵심 프로토콜이다. 이를 조작하거나 철회하면 특정 네트워크를 인터넷에서 고립시킬 수 있어 로그 AI 대응 시나리오에서 주요 통제 수단으로 검토된다.
경계 관문 프로토콜
bgp-border-gateway-protocol
인터넷상의 서로 다른 네트워크(AS) 간에 라우팅 정보를 교환하는 핵심 프로토콜이다. 데이터 패킷이 목적지까지 가는 최적의 경로를 결정하며, 이를 조작하거나 차단하면 특정 지역이나 전 세계의 인터넷 연결을 마비시킬 수 있다.
광학 풀드 스크리닝
optical-pooled-screening
수천 개의 유전자를 한꺼번에 편집한 후 현미경 이미징을 통해 각 세포의 변화를 대규모로 관찰하는 기법이다. 방대한 이미지 데이터를 생성하므로 이를 해석하기 위한 고도의 분석 기술이 요구된다.
모델 기반 강화학습
mbrl
에이전트가 환경의 모델을 직접 학습하여 실제 행동을 취하기 전에 결과를 예측하고 계획을 세우는 강화학습 기법이다. 시행착오를 줄이고 학습 효율을 높이는 데 중요하다.
오픈 소스 인공지능
open-source-ai
모델의 가중치, 학습 데이터, 코드 등을 공개하여 누구나 사용하고 개선할 수 있도록 하는 생태계이다. 2025년에는 중국의 DeepSeek과 Qwen 등이 이 분야를 주도하며 폐쇄형 모델과의 간극을 좁혔다.
인과 추론 머신러닝
causal-ml
단순한 상관관계를 넘어 변수 간의 인과관계를 파악하고 특정 개입이 결과에 미치는 영향을 추정하는 기술이다. 마케팅의 업리프트 모델링이나 정책 효과 분석 등에 필수적으로 활용된다.
입자 흐름 알고리즘
particle-flow
검출기의 다양한 정보를 결합하여 충돌에서 생성된 개별 입자를 식별하고 재구성하는 기술이다. 물리학의 표준 모델 연구를 위해 필수적인 기초 데이터 처리 단계이다.
자기 개선 스캐폴드
self-improving-scaffold
에이전트가 스스로 과제를 설정하고 수행 결과를 평가하여 학습 데이터를 생성하는 구조적 프레임워크이다. 이를 통해 인간의 직접적인 개입 없이도 새로운 환경이나 복잡한 메뉴 조작 등의 기술을 습득할 수 있다.
장기 실행 에이전트
long-horizon-agent
단발성 명령 수행을 넘어 수 시간 혹은 수일 동안 자율적으로 목표를 추구하며 복잡한 워크플로우를 완수하는 AI 시스템이다. 시행착오를 거치며 스스로 경로를 수정하는 능력이 핵심이다.
장기 실행 에이전트
long-running-agent
수 시간에서 수일 동안 중단 없이 복잡한 목표를 달성하기 위해 자율적으로 사고하고 행동하는 AI 시스템이다. 단발성 응답을 넘어 지속적인 피드백 루프를 통해 결과물을 완성해 나가는 것이 특징이다.
재귀 분할 알고리즘
recursive-division
공간을 반복적으로 나누어 벽을 세움으로써 미로를 생성하는 결정론적 알고리즘으로, 대규모 합성 데이터셋 생성을 위해 사용되었다.
추론 시간 스케일링
inference-time-scaling
모델이 답변을 생성하는 과정에서 더 많은 연산 자원을 투입하여 복잡한 문제를 해결하는 기법이다. 사고의 사슬(CoT)을 길게 생성하거나 여러 경로를 탐색함으로써 추론 능력을 극대화한다. 이는 학습 단계의 스케일링을 넘어 추론 단계에서도 성능 향상을 꾀할 수 있다는 점에서 중요하다.
추상 추론 벤치마크
arc-agi-2
인간의 지능과 유사한 일반적인 문제 해결 능력을 측정하는 테스트이다. 모델이 이전에 학습하지 않은 새로운 규칙과 패턴을 얼마나 잘 파악하고 실시간으로 적응하여 해결하는지 평가하며 지능의 핵심 지표로 활용된다.
행동 기반 머신러닝
behavioral-ml
사용자의 클릭, 구매, 체류 시간 등 행동 데이터를 분석하여 추천이나 랭킹을 수행하는 시스템으로 데이터의 진위 여부가 매우 중요하다.
노드 기반 워크플로우
node-workflow
시각적 블록(노드)을 선으로 연결하여 AI 모델의 실행 순서와 데이터 흐름을 제어하는 방식이다. ComfyUI와 같은 도구에서 주로 사용되며 복잡한 생성 과정을 세밀하게 조정할 수 있게 해준다.
로컬 차분 프라이버시
local-differential-privacy
데이터가 중앙 서버로 전송되기 전 사용자 기기에서 직접 노이즈를 추가하여 개인정보를 보호하는 기술이다. 신뢰할 수 없는 관리자로부터 데이터를 보호할 수 있지만, 추가된 노이즈로 인해 데이터 분석의 정확도가 낮아지는 단점이 있다.
제도 카피 파이프라인
zero-copy-pipeline
데이터를 메모리 간에 복사하지 않고 직접 참조하여 전송 오버헤드를 없애는 고성능 데이터 처리 방식이다. 저장소와 컴퓨팅 엔진 간의 데이터 이동을 최소화하여 대규모 데이터셋의 학습 및 추론 속도를 극대화한다.
참조 표현 세그멘테이션
referring-expression-segmentation
자연어 설명을 입력받아 이미지 내 해당 객체의 영역을 픽셀 단위로 구분하는 기술이다. '바닥'이나 '벽' 같은 텍스트 쿼리를 통해 특정 영역만 추출할 수 있다.
고차 제어 리아푸노프 함수
hoclf
시스템을 원하는 목표 상태로 수렴하게 만드는 에너지 함수 기반의 제어 기법으로, 안전성(HOCBF)과 성능(HOCLF) 사이의 균형을 맞추는 데 사용된다.
소스 코드 인텔리전스 프로토콜
scip
코드의 의미론적 정보를 캡처하는 언어 중립적 인덱싱 포맷으로, 리포지토리 간의 정밀한 코드 탐색을 가능하게 하는 핵심 기술이다.
재생 커널 힐베르트 공간
rkhs
커널 함수를 통해 정의되는 함수 공간으로 복잡한 비선형 관계를 고차원 특징 공간에서의 선형 관계로 변환하여 다룰 수 있게 하는 수학적 프레임워크이다.
오픈 뉴럴 네트워크 익스체인지
onnx
서로 다른 AI 프레임워크 간에 모델을 공유하고 최적화하여 실행할 수 있도록 돕는 개방형 표준 포맷이다. Vespa와 같은 검색 엔진에서 다양한 임베딩 모델을 하드웨어 가속을 통해 효율적으로 추론하는 데 사용된다.
비전 기반 데이터 추출
vision-based-extraction
문서의 텍스트 코드뿐만 아니라 시각적 레이아웃과 구조를 이미지로 인식하여 데이터를 추출하는 방식이다. 표나 복잡한 서식의 위치 관계를 파악하여 데이터 왜곡을 최소화하는 데 중요하다.
생존 가능 시스템 모델
viable-system-model
스태퍼드 비어(Stafford Beer)가 제안한 모델로, 복잡한 환경에서 조직이 자율성을 유지하며 생존하기 위해 필요한 5가지 하위 시스템과 그들 간의 피드백 관계를 정의한다.
언어 서버 인덱스 포맷
lsif
SCIP 이전에 사용되던 코드 인덱싱 표준 포맷으로, 정적 분석 결과를 저장하여 IDE와 같은 탐색 기능을 제공한다.
역할 기반 액세스 제어
rbac
사용자나 에이전트의 역할에 따라 시스템 자원 및 도구에 대한 접근 권한을 차등 부여하는 보안 모델이다. 에이전트가 최소 권한 원칙에 따라 필요한 데이터에만 접근하도록 제한하는 데 필수적이다.
의료 영상 판독문 생성
medical-imaging-report-generation
엑스레이나 MRI 같은 의료 영상을 분석하여 의사가 작성하는 것과 유사한 전문적인 진단 보고서를 AI가 자동으로 작성하는 기술이다. 단순한 사물 인식을 넘어 의학적 지식과 문맥 이해가 필수적이다.
원격 직접 메모리 액세스
rdma
CPU의 개입 없이 한 컴퓨터의 메모리에서 다른 컴퓨터의 메모리로 데이터를 직접 전송하는 기술로, 분산 학습 시 GPU 간 통신 지연을 최소화하는 데 필수적입니다.
폐쇄 루프 데이터 인프라
closed-loop-data-infrastructure
데이터 생성, 모델 학습, 실험 검증이 하나의 자동화된 시스템 내에서 반복되는 구조이다. 실험 결과가 즉시 AI 학습에 반영되어 모델의 정확도를 실시간으로 개선한다.
대비 제한 적응형 히스토그램 평활화
clahe
이미지의 국부적인 대비를 개선하는 알고리즘이다. 일반적인 평활화와 달리 노이즈 증폭을 억제하면서 손금과 같은 미세한 특징을 부각하는 데 효과적이다.
부분 관측 가능한 확률 게임
posg
여러 에이전트가 참여하며 각 에이전트가 환경의 전체 상태를 알 수 없는 상태에서 상호작용하는 게임 이론적 모델이다. F1에서는 상대의 배터리 잔량을 알 수 없는 상태에서 경쟁하는 상황을 모델링하는 데 사용된다.
완전 샤딩 데이터 병렬 처리
fsdp
모델 파라미터, 그래디언트, 옵티마이저 상태를 여러 GPU에 분산하여 저장함으로써 메모리 사용량을 줄이는 기법이다. 대규모 모델을 제한된 GPU 메모리 환경에서 학습시킬 때 필수적으로 사용되는 병렬화 전략이다.
고차 제어 장벽 함수
hocbf
시스템의 상태가 안전한 집합 내에 머물도록 강제하는 수학적 도구로, 고차 미분 항을 포함하여 복잡한 동역학 시스템에서도 안전 경계를 유지하게 한다.
관계 기반 접근 제어
rebac
사용자와 리소스 간의 관계(예: 소유자, 편집자, 뷰어)를 그래프 형태로 모델링하여 권한을 결정하는 방식이다. 단순한 역할 기반(RBAC)보다 복잡하고 동적인 권한 구조를 표현하는 데 유리하며 RAG 시스템의 세밀한 보안에 적합하다.
기존 도구 활용 공격
living-off-the-land
시스템에 이미 설치된 합법적인 도구(예: AppleScript, PowerShell)를 악용하여 공격을 수행하는 방식이다. 별도의 악성 파일을 생성하지 않아 탐지가 매우 어렵고 기존 보안 솔루션의 감시를 우회하기 용이하다.
독립 동일 분포 가정
iid-assumption
모든 데이터 샘플이 서로 독립적이며 동일한 확률 분포에서 추출되었다는 통계적 가정이다. 많은 표준 기계학습 알고리즘의 기반이 되지만 지리적으로 인접한 데이터가 서로 연관된 공간 데이터에서는 이 가정이 깨지기 쉽다.
보안 규정 준수 인증
soc2
서비스 조직의 보안, 가용성, 처리 무결성 등을 평가하는 감사 기준이다. 기업용 소프트웨어 개발 시 반드시 준수해야 하는 보안 표준 중 하나이다.
분자 역학 대리 모델
molecular-dynamics-surrogates
계산 비용이 매우 높은 전통적인 분자 역학 시뮬레이션을 대체하기 위해 딥러닝으로 학습된 모델이다. 단백질과 같은 거대 분자의 움직임과 상호작용을 수 밀리초 단위로 빠르게 예측할 수 있어, 수만 개의 후보 물질을 신속하게 스크리닝하고 최적화하는 데 필수적이다.
비전 언어 행동 모델
vla-model
시각 정보(Vision)와 언어(Language)를 결합하여 로봇의 구체적인 물리적 행동(Action)을 생성하는 차세대 AI 모델이다.
사건 발생 시간 분석
time-to-event-analysis
특정 사건이 일어날 때까지 걸리는 시간을 분석하는 통계 기법이다. 의료 분야의 생존 분석이나 제조 분야의 고장 시간 예측 등 다양한 도메인에서 활용된다.
의료 정보 교환 표준
fhir
서로 다른 의료 시스템 간에 데이터를 빠르고 정확하게 교환하기 위한 현대적 표준 규격이다. Claude의 에이전트 스킬은 이 표준을 활용해 시스템 간 상호운용성을 높인다.
자가 수정 실행 루프
self-correcting-loop
AI가 코드를 생성한 직후 가상 환경(샌드박스)에서 이를 직접 실행하고 테스트하는 과정이다. 실행 중 오류가 발생하면 AI가 이를 감지하고 스스로 코드를 수정하여 완성도를 높이는 자율적 워크플로우를 의미한다.
자산 수명 주기 관리
asset-lifecycle-management
산업 자산의 설계부터 운영, 유지보수, 폐기까지 전 과정을 관리하여 효율성을 극대화하고 비용을 최적화하는 기법이다.
제약 조건 준수 생성
constrained-generation
출력물의 길이, 특정 단어 포함 여부, 형식 등 사용자가 설정한 엄격한 규칙을 지키며 텍스트를 생성하는 기술이다. 일반적인 LLM이 가장 어려워하는 분야 중 하나이다.
책임 있는 확장 정책
rsp
AI 모델의 능력이 커짐에 따라 발생할 수 있는 파괴적 위험을 관리하기 위해 기업이 자발적으로 수립한 안전 프레임워크이다. 특정 위험 임계치에 도달할 경우 안전 조치가 완료될 때까지 학습이나 배포를 중단하는 내용을 포함한다.
확산 기반 언어 모델
diffusion-based-lm
이미지 생성에서 주로 쓰이던 확산 모델(Diffusion Model) 원리를 텍스트 생성에 적용한 연구 분야이다. 기존의 자동 회귀(Autoregressive) 방식과 다른 생성 메커니즘을 통해 텍스트의 다양성과 품질을 개선하려는 시도이다.
그룹 상대 정책 최적화
grpo
강화학습을 통해 모델의 정책을 최적화하는 알고리즘이다. 그룹 내 상대적 보상을 활용하여 모델의 자아 인식과 행동 전이 능력을 높이며 특히 추론 능력이 강화된 모델의 사후 학습에 핵심적인 기술로 활용된다.
단일 명령 다중 데이터
simd
하나의 명령어로 여러 개의 데이터를 동시에 처리하는 병렬 컴퓨팅 방식이다. 대규모 수치 연산이 필요한 AI 가속기에서 핵심적인 역할을 하며, 벡터 연산을 통해 처리량을 극대화하는 데 사용된다.
멀티 헤드 잠재 어텐션
mla
KV 캐시 메모리 사용량을 줄이기 위해 키와 값 벡터를 저차원 잠재 공간으로 압축했다가 추론 시 복원하는 효율적인 어텐션 기법이다.
양파 선물 거래 금지법
onion-futures-act
1958년 미국에서 제정된 법률로, 양파에 대한 선물 거래를 금지하는 특수한 규제이다. AI 에이전트가 일반적인 비즈니스 상식만으로는 알기 어려운 실제 법적 제약 조건을 보여주는 사례로 인용되었다.
현대 미국 영어 말뭉치
coca
10억 단어 이상의 방대한 규모를 가진 현대 영어 말뭉치로, 실제 언어 사용 양상을 분석하는 데 가장 널리 쓰이는 학술적 자원이다.
국제 학습 표현 컨퍼런스
iclr
딥러닝의 핵심인 표현 학습을 전문적으로 다루는 세계적인 AI 학술 대회이다. 매년 혁신적인 신경망 구조와 학습 알고리즘이 소개되며, AI 연구의 최전선을 이끄는 커뮤니티로 평가받는다.
최근 최소 사용 교체 정책
lru-eviction
메모리가 가득 찼을 때 가장 오랫동안 사용되지 않은 항목을 우선적으로 제거하여 새로운 데이터를 수용하는 자원 관리 알고리즘이다.
행동 위험 요인 감시 체계
brfss
미국 질병통제예방센터(CDC)에서 매년 실시하는 세계 최대 규모의 전화 설문 조사 데이터셋이다. 건강 관련 위험 행동, 만성 질환 상태, 예방 서비스 이용 등을 조사하며 보건 의료 연구에서 널리 활용된다.
유럽 석유 탐사 그룹 좌표계
epsg
전 세계의 좌표계와 타원체 등에 고유 번호를 부여한 표준 시스템이다. 지도 데이터의 정확한 위치를 정의하기 위해 사용된다.
음성 인식 및 합성
stt-tts
음성을 텍스트로 변환(STT)하거나 텍스트를 음성으로 변환(TTS)하는 기술이다. 로컬 AI 비서가 사용자와 대화하기 위한 필수적인 인터페이스 역할을 수행한다.
자본 지출 및 운영 비용
capex-opex
서버나 GPU 구매 같은 인프라 구축 비용(CapEx)과 모델 실행 및 유지보수에 드는 경상 비용(OpEx)을 뜻한다. AI 기업의 막대한 지출 구조를 나타내는 핵심 지표이다.
연방 위험 및 인증 관리 프로그램
fedramp
미국 정부 기관이 클라우드 서비스를 안전하게 사용할 수 있도록 표준화된 보안 평가 및 인증을 제공하는 프로그램이다. 엔터프라이즈 AI 도입의 핵심 보안 기준이다.
단어 빈도-역문서 빈도
tf-idf
특정 단어가 문서 내에서 얼마나 중요한지를 나타내는 통계적 수치이다. 수많은 데이터 중 관련성 높은 정보를 빠르게 필터링하여 LLM의 연산 부하를 줄이는 전처리 기법으로 활용된다.
번역 후 편집
post-editing
기계 번역이나 번역 메모리가 생성한 결과물을 전문 번역가가 검토하고 문맥에 맞게 수정하여 최종 품질을 확보하는 작업 단계이다.
우수 암 식별
good-arm-identification
여러 선택지 중 평균 보상이 미리 정해진 특정 임계값을 초과하는 대안(Good Arm)을 하나 이상 찾아내는 것을 목표로 하는 밴딧 문제의 한 유형이다.
추론 대 확률
inference-vs-probability
AI가 단순히 데이터상에서 다음에 올 확률이 높은 단어를 선택하는 것과, 주어진 전제 조건 사이의 논리적 관계를 분석하여 결론을 도출하는 과정의 차이를 의미한다.
텐서 열 분해
tensor-train-decomposition
고차원 텐서를 3차원 텐서들의 체인 형태로 표현하여 파라미터 수를 지수적으로 줄이는 기법으로, 차원의 저주 문제를 해결하는 데 효과적이다.
학제 간 연구
interdisciplinary
한 학문 분야만으로는 해결하기 어려운 복잡한 문제를 풀기 위해 여러 분야의 전문가들이 협력하는 방식으로, SQI는 신경과학과 컴퓨터 공학의 융합을 꾀한다.
분포 외 데이터
out-of-distribution
모델이 학습한 데이터 범위를 벗어난 새로운 유형의 데이터를 의미한다. 과학적 발견을 위해서는 기존 지식(분포 내)을 넘어선 이러한 데이터를 탐색하는 능력이 필수적이다.
신호 대 잡음비
signal-to-noise-ratio
유용한 정보(신호)와 불필요한 정보(잡음)의 비율로, AI 리뷰에서는 실제 수정이 필요한 유의미한 코멘트의 비중을 의미한다.
안티 봇 시스템
anti-bot-system
자동화된 스크립트나 AI 에이전트의 접근을 차단하기 위해 캡차(CAPTCHA), 행동 분석, IP 차단 등을 사용하는 보안 체계이다. 에이전트의 자율적인 웹 탐색과 작업 수행을 방해하는 주요 기술적 장애물 중 하나이다.
제품 내 디렉토리
in-product-directory
특정 소프트웨어 제품 내부에서 제공되는 앱이나 서비스의 목록 및 검색 시스템이다. ChatGPT 사용자가 외부 플랫폼을 거치지 않고 승인된 다양한 확장 기능을 직접 찾아보고 즉시 실행할 수 있는 생태계의 허브 역할을 한다.
분류 및 우선순위 지정
triaging
쏟아지는 보안 경고 중 실제 위협인 것과 오탐인 것을 구분하고 처리 우선순위를 정하는 과정이다. 분석가의 업무 효율을 결정짓는 SOC의 핵심 단계이다.
면책 및 배상 책임
indemnification
사용자의 행위로 인해 기업이 제3자로부터 소송을 당하거나 손해를 입었을 때 사용자가 그 비용과 책임을 대신 지는 조항이다.
비전 투 액션 모델
vision-to-action-model
시각적 입력 정보를 분석하여 로봇의 물리적 동작이나 제어 신호로 직접 변환하는 AI 모델이다. 이 아티클에서는 로봇이 자신의 얼굴 이미지를 보고 모터 제어 값을 학습하는 데 사용되었다.
음성 대 음성 번역
speech-to-speech
중간에 텍스트로 변환하는 단계 없이 음성 입력을 다른 언어의 음성으로 직접 번역하는 기술로 대화의 흐름과 화자의 음성 특성을 유지하는 것이 핵심이다.
함수 대 함수 회귀
function-on-function-regression
입력(공변량)과 출력(응답)이 모두 단일 수치가 아닌 시간에 따른 함수 형태인 회귀 분석 모델이다. 복잡한 동적 시스템의 관계를 분석하는 데 사용된다.
추상 및 추론 코퍼스
arc-agi
프랑수아 숄레가 제안한 AI 벤치마크로, 학습 데이터에 없는 새로운 규칙을 추론하고 적용하는 능력을 평가하여 일반 인공지능(AGI)에 대한 근접도를 측정한다.
우도 (가능도)
likelihood
특정 가설이나 클래스 하에서 관측된 데이터가 나타날 가능성을 수치화한 것이다. 나이브 베이즈에서는 각 특징의 조건부 확률들을 곱하여 전체 우도를 산출한다.
에코-신학
eco-theology
전통적인 종교 대신 환경 보호 활동을 통해 도덕적 죄책감을 씻고 자신의 정체성을 확인하려는 현대적 현상이다. 환경 비판이 일종의 종교적 정화 의식으로 작동함을 의미한다.
검벨-소프트맥스
gumbel-softmax
이산적인 범주형 분포에서 미분 가능한 방식으로 샘플링을 수행할 수 있게 해주는 기법이다. 모델 증류 시 방대한 출력 분포를 효율적으로 샘플링하여 저장 비용을 줄이는 데 활용된다.
로그-오목 측도
log-concave-measure
로그를 취했을 때 오목 함수(Concave Function)가 되는 확률 분포의 특성이다. 이러한 특성을 가진 분포는 고차원 공간에서도 효율적인 샘플링과 최적화가 가능하다는 장점이 있다.
부모-자식 청킹
parent-child-chunking
문서를 작은 조각(자식)으로 나누어 검색하고, 실제 답변 생성 시에는 해당 조각이 포함된 큰 문맥(부모)을 사용하는 기법이다. 검색의 정밀도와 생성의 풍부함을 동시에 확보하기 위해 사용한다.
징글-쟁글 오류
jingle-jangle-fallacy
동일한 개념을 다른 이름으로 부르거나 다른 개념을 같은 이름으로 불러 발생하는 평가의 오류다. AI 벤치마크의 난립 속에서 측정 대상의 본질을 명확히 규정하고 평가의 타당성을 확보하기 위해 경계해야 할 심리학적 현상이다.
바움-웰치 알고리즘
baum-welch-algorithm
은닉 마르코프 모델(HMM)의 매개변수를 추정하기 위해 사용되는 기대값 최대화(EM) 알고리즘의 일종이다. 관측된 데이터만을 가지고 모델의 전이 확률과 방출 확률을 최적화하는 데 필수적이다.
편향-분산 트레이드오프
bias-variance-tradeoff
모델의 복잡도에 따라 학습 데이터에 대한 오차(편향)와 새로운 데이터에 대한 예측 변동성(분산) 사이의 균형을 맞추는 원리이다. 모델이 너무 단순하면 편향이 높고, 너무 복잡하면 분산이 높아져 과적합이 발생한다. 이 균형을 이해하는 것은 모델의 일반화 성능을 높이는 데 필수적이다.
시각-언어-행동 모델
vla
시각 정보(Vision)와 언어(Language)를 결합하여 로봇의 구체적인 물리적 행동(Action)을 결정하는 멀티모달 AI 모델로 로보틱스의 핵심 기술이다.
전제/설정
premise
이야기의 시작점이 되는 기본 상황이나 배경 설정을 말한다. 사용자가 직접 작성하거나 AI가 자동 생성하여 스토리의 방향성을 결정하는 기초가 된다.
출처/기원
provenance
데이터나 저작물의 생성부터 현재까지의 이력을 추적할 수 있는 정보이다. AI 맥락에서는 특정 텍스트가 어떤 모델과 설정을 통해 생성되었는지 증명하는 근거가 되며, 신뢰성 확보에 필수적이다.
분기/종 분화
bifurcation
시스템의 매개변수 변화에 따라 해의 구조가 급격히 변하는 현상으로 여기서는 제약 조건 충돌 시 인구 집단을 분할하는 메커니즘을 의미한다.
덤 존
dumb-zone
LLM의 컨텍스트 윈도우가 거의 가득 찼을 때 모델의 추론 능력과 지시 이행 능력이 급격히 떨어지는 구간을 의미한다. 컨텍스트가 많아질수록 모델은 길을 잃거나 부정확한 답변을 내놓을 확률이 높아진다.
뇌 정렬
brain-alignment
인공 신경망의 내부 표현이나 활성화 패턴이 실제 생물학적 뇌의 신경 데이터와 통계적으로 얼마나 일치하는지 평가하는 방법론이다.
덕 윤리
virtue-ethics
행위의 규칙이나 결과보다 행위자의 성품과 덕목을 중시하는 윤리 체계이다. AI가 단순히 규칙을 따르는 것을 넘어, 인간의 도덕적 탁월함을 모방하거나 지원할 수 있는지 탐구한다.
데 노보
de-novo
라틴어로 '처음부터' 또는 '새롭게'라는 뜻이며, 이 연구에서는 사전 학습 없이 구조 자체만으로 생성된 초기 상태를 의미한다.
딥 서치
deep-search
단순 키워드 매칭을 넘어 자연어 이해를 바탕으로 코드의 의미와 맥락을 검색하는 고도화된 검색 기술이다. 개발자가 질문 형식으로 코드를 찾거나 복잡한 로직의 의도를 파악하는 데 도움을 준다.
쓴 교훈
the-bitter-lesson
리처드 서튼이 제안한 개념으로, AI 발전에서 인간의 지식을 직접 주입하는 것보다 대규모 계산 자원과 일반적인 검색 및 학습 알고리즘을 활용하는 것이 장기적으로 더 효과적이라는 통찰이다.
쓴 교훈
bitter-lesson
리처드 서튼이 제안한 개념으로, AI 발전의 장기적 동력은 인간의 지식을 모방하는 것이 아니라 계산 자원을 활용하는 알고리즘이라는 주장이다. 현재는 대규모 자본 투입과 모델 확장을 정당화하는 논리로 자주 인용된다.
총 보상
total-compensation
기본급 외에 주식(RSU), 보너스, 사이닝 보너스 등을 모두 합친 전체 연봉 패키지를 의미한다.
킬 체인
kill-chain
공격 대상의 탐지부터 타격까지 이르는 일련의 군사 작전 단계를 의미한다. 스타링크가 우크라이나의 드론 유도 시스템에 통합되면서 민간 네트워크가 군사적 살상 체계의 일부가 되었음을 뜻한다.
톱 쿼크
top-quark
가장 무거운 기본 입자 중 하나로, 표준 모델의 핵심 구성 요소이다. 매우 짧은 수명을 가지며 붕괴 시 복잡한 입자 신호를 남긴다.
헵 학습
hebbian-learning
신경세포 간의 연결 강도가 자극에 의해 변하는 원리로, '함께 활성화되는 뉴런은 함께 연결된다'는 신경과학 법칙이다. 이 시스템에서는 성공적인 작업 경로의 가중치를 높여 시스템을 최적화하는 데 사용된다.
힙 힌지
hip-hinge
데드리프트 시 허리를 펴고 고관절을 축으로 상체를 숙이는 동작으로, 척추 부상을 방지하고 하체 근력을 효율적으로 사용하기 위한 핵심 자세이다.
맵 엘리트
map-elites
품질과 다양성을 동시에 최적화하는 진화 알고리즘으로, 단순히 최고 성능의 개체만 찾는 것이 아니라 다양한 특성을 가진 우수한 개체군을 유지한다.
셸 액세스
shell-access
운영체제의 핵심 기능에 접근하여 명령어를 직접 실행할 수 있는 권한이다. AI 에이전트가 이 권한을 가지면 파일 삭제나 소프트웨어 설치 등 시스템 전반에 걸친 제어가 가능해져 보안상 매우 민감하다.
앱 인텐트
app-intents
AI 에이전트가 특정 작업을 수행하기 위해 외부 애플리케이션의 기능을 호출할 수 있도록 정의된 인터페이스다. 이를 통해 AI 비서가 플랫폼 내부 기능뿐만 아니라 서드파티 앱의 기능까지 실행할 수 있다.
역 렌더링
inverse-rendering
이미지나 영상으로부터 그 안에 담긴 물체의 모양, 재질, 조명 상태를 역으로 계산하여 분리해내는 기술이다. 이 과정을 통해 조명 정보를 제거한 순수 재질 데이터만 추출할 수 있다. 이는 생성된 3D 장면에 새로운 조명을 적용하거나 물리적 일관성을 유지하는 데 필수적이다.
인 실리코
in-silico
컴퓨터 시뮬레이션이나 가상 실험을 통해 연구를 수행하는 방식이다. 생물학적 실험을 디지털 환경에서 재현하여 시간과 비용을 획기적으로 줄여준다.
점 표기법
dot-notation
객체의 속성에 접근할 때 점(.)을 사용하는 방식으로, CLI에서 중첩된 설정값을 간편하게 변경할 때 주로 사용된다.
킬 스위치
kill-switch
시스템이 예상치 못한 동작을 하거나 위험한 상황이 발생했을 때 즉시 작동을 중단시키는 비상 정지 장치이다. AI 에이전트가 통제 불능 상태에 빠지는 것을 방지하는 핵심 안전 메커니즘이다.
핫 리로딩
hot-reloading
앱을 완전히 재시작하지 않고도 변경된 코드나 설정을 즉시 반영하는 기술입니다. 개발 과정에서 수정 사항을 실시간으로 확인하며 작업 효율을 높이는 데 필수적입니다.
핫 스와핑
hot-swapping
시스템 가동 중 장치나 구성 요소를 교체하는 기술로 여기서는 추론 중 메모리 내 AI 모델을 즉각 교체하는 하드웨어 가속 기법을 의미한다.
갱 스케줄링
gang-scheduling
여러 개의 Pod가 하나의 작업 단위로 묶여 있을 때, 모든 Pod가 동시에 스케줄링될 수 있는 상태에서만 배치를 수행하는 방식입니다. 분산 학습 시 일부 자원만 점유하고 대기하는 교착 상태를 방지하여 자원 효율성을 높입니다.
긴 컨텍스트
long-context
AI 모델이 한 번에 처리하고 기억할 수 있는 정보의 양이 매우 큰 상태를 의미한다. LoCoBench-Agent와 같은 벤치마크는 방대한 코드베이스를 다루는 소프트웨어 엔지니어링 에이전트의 성능을 평가하는 데 이 능력을 중요하게 다룬다.
깃 워크트리
git-worktree
하나의 저장소에서 여러 개의 작업 디렉토리를 동시에 운영할 수 있게 하는 Git 기능이다. Cursor에서는 이를 활용해 여러 AI 에이전트가 서로의 파일을 간섭하지 않고 독립적으로 코드를 수정하고 테스트할 수 있게 한다.
린 스타트업
lean-startup
적은 자본으로 빠르게 제품을 출시하고 시장의 반응을 살펴 사업 모델을 유연하게 변경하는 경영 방식이다. AI 도구의 발전으로 초기 고용 없이도 제품 개발과 마케팅이 가능해지면서 2025년 스타트업들의 핵심 전략이 되었다.
풀 리퀘스트
pull-request
개발자가 수정한 코드를 메인 코드 저장소에 반영하기 전, 동료들에게 검토 및 승인을 요청하는 단계이다. 코드 품질 유지와 협업의 핵심적인 절차로 활용된다.
홈 어시스턴트
home-assistant
다양한 스마트 기기를 하나의 플랫폼에서 제어할 수 있게 해주는 오픈소스 스마트홈 시스템이다. 로컬 환경에서 구동되어 프라이버시 보호에 유리하다.
앱 소프트웨어 개발 키트
apps-sdk
ChatGPT 내에서 작동하는 애플리케이션을 개발하기 위해 OpenAI가 제공하는 도구와 라이브러리 모음이다. 개발자가 대화형 인터페이스에 특화된 기능을 효율적으로 구현하고 플랫폼의 API와 연동할 수 있도록 지원하는 핵심 기술 요소이다.
풀 리퀘스트 주기 시간
pr-cycle-time
코드 변경 사항이 제출되어 리뷰를 거쳐 최종 머지되기까지 걸리는 시간이다. 엔지니어링 속도와 효율성을 측정하는 가장 대표적인 지표 중 하나이다.
웜 데이터 경로
warm-data-path
자주 접근하는 데이터를 메모리나 SSD 등 빠른 저장 매체에 상주시켜 응답 속도를 높이는 구조이다. 느린 객체 스토리지 접근을 최소화하여 일관된 저지연 성능을 보장한다.
첫 오디오 생성 시간
ttfa
사용자의 입력이 끝난 후 시스템이 첫 번째 오디오 데이터를 생성하기 시작할 때까지 걸리는 시간(Time to First Audio)이다. 실시간 대화형 AI에서 대기 시간을 줄여 자연스러운 대화를 유지하는 데 중요한 성능 지표이다.
긴 문맥 이해
long-context-understanding
방대한 양의 텍스트 데이터를 한 번에 입력받아 그 흐름과 세부 정보를 정확히 파악하는 능력이다. 수백 페이지의 문서나 대규모 코드 베이스를 분석할 때 필수적인 성능 요소이다.
데 노보 설계
de-novo-design
기존에 존재하는 템플릿이나 구조를 수정하는 것이 아니라 처음부터(from scratch) 새로운 분자나 단백질을 설계하는 방식이다. 자연계에 없는 최적화된 기능을 가진 단백질을 만드는 데 필수적이다.
룰 기반 로봇
rule-based-robot
미리 정의된 명확한 규칙과 조건에 따라 정형화된 업무를 반복적으로 수행하는 전통적인 RPA 로봇이다. 예외 상황 처리가 어렵지만 정해진 절차 내에서는 높은 정확도와 속도를 보장한다.
총 변동 거리
total-variation-distance
두 확률 분포 사이의 차이를 측정하는 척도로, 모든 가능한 사건에 대해 두 분포가 할당하는 확률 값의 최대 차이를 의미한다.
뇌 영감 아키텍처
brain-inspired-architecture
인간이나 동물의 뇌 구조와 신경학적 작동 원리에서 아이디어를 얻어 설계된 인공신경망 구조이다. 기존 딥러닝 모델의 한계를 극복하고 더 유연하며 에너지 효율적인 학습 능력을 갖춘 차세대 AI 개발을 목표로 한다.
첫 토큰 생성 시간
ttft
사용자의 요청 후 모델이 첫 번째 응답 토큰을 출력할 때까지 걸리는 시간이다. 실시간 서비스의 사용자 경험을 결정짓는 핵심적인 지연 시간 지표이다.
칩 간 상호 연결
ici
여러 개의 TPU 칩을 직접 연결하여 하나의 거대한 계산 시스템처럼 작동하게 만드는 고속 네트워크 기술이다. 아이언우드에서는 9.6 Tb/s의 속도로 수천 개의 칩을 연결하여 대규모 확장을 가능하게 한다.
도-계산법
do-calculus
주드아 펄(Judea Pearl)이 제안한 인과 추론 규칙으로, 관측 데이터로부터 개입(Intervention)의 효과를 계산하는 방법론이다. 에이전트가 특정 행동을 했을 때의 결과를 예측하거나 반사실적 시나리오를 분석할 때 필수적인 도구이다.
뇌-컴퓨터 인터페이스
bci
뇌의 신경 신호를 직접 컴퓨터나 외부 기기로 전달하여 제어하는 기술이다. 뇌파를 측정하고 이를 알고리즘으로 해석하여 의수나 텍스트 입력 장치를 작동시킨다.
뇌-컴퓨터 인터페이스
brain-computer-interface
뇌의 신호를 직접 컴퓨터나 외부 기기와 연결하여 정보를 주고받는 기술이다. 생각만으로 기기를 제어하거나 외부 정보를 뇌에 직접 입력하는 것을 목표로 한다.
0차 최적화
zeroth-order-optimization
함수의 경사도(미분값) 정보를 직접 사용하지 않고 함수의 결괏값만을 샘플링하여 최적화를 수행하는 방식이다. 미분이 불가능하거나 계산 비용이 너무 큰 블랙박스 모델의 최적화에 주로 활용된다.
욜로11
yolo11
최신 객체 검출 및 포즈 추정 모델로, 이전 버전보다 높은 정확도와 속도를 제공하여 실시간 영상 분석에 최적화된 아키텍처이다.
규칙 110
rule-110
스티븐 울프람이 제시한 1차원 셀룰러 오토마타의 일종이다. 매우 단순한 규칙만으로도 튜링 완전함을 증명하여, 1차원 환경에서도 복잡한 시스템 구축이 가능함을 보여준다.
시스템 1 및 시스템 2
system-1-and-system-2
인간의 사고 체계를 빠른 직관(시스템 1)과 느린 논리적 추론(시스템 2)으로 나눈 개념이다. 웨이모는 이를 모방해 즉각적인 반응과 복잡한 상황 판단을 동시에 수행하는 아키텍처를 구현했다.
브레인 부동소수점 16비트
bfloat16
구글이 개발한 16비트 부동소수점 형식으로, FP32와 동일한 지수 범위를 가지면서 메모리 사용량을 절반으로 줄여 딥러닝 학습 효율을 높인다.
브레인 플로트 16
bf16
구글 브레인에서 개발한 16비트 부동소수점 형식으로, 기존 FP16보다 넓은 수 범위를 표현할 수 있어 딥러닝 학습 시 수치적 안정성이 높다. 최신 GPU에서 하드웨어적으로 지원된다.
인텔 18A
intel-18a
인텔의 최첨단 1.8nm급 반도체 제조 공정으로, 전력 효율과 트랜지스터 밀도를 극대화하여 고성능 AI 연산을 가능하게 하는 기술이다.
리눅스용 윈도우 하위 시스템 2
wsl2
Windows 내에서 가상 머신 없이 리눅스 환경을 직접 실행할 수 있게 해주는 마이크로소프트의 기술이다. Docker와 같은 컨테이너 도구를 Windows에서 효율적으로 구동하기 위한 핵심 기반이 된다.
비밀번호 기반 키 유도 함수 2
pbkdf2
사용자의 비밀번호를 입력받아 해시 함수를 수만 번 반복 적용하여 강력한 암호화 키를 생성하는 기법이다. 무차별 대입 공격에 대한 저항력을 높여 시스템의 전반적인 보안 수준을 강화한다.
시스템 2 사고
system-2-thinking
빠르고 직관적인 반응 대신 논리적 추론과 단계별 사고 과정을 거쳐 결론을 도출하는 인지 모델이다. AI가 답변 전 스스로 추론 과정을 거쳐 정확도를 높이는 데 사용된다.
맘바2 아키텍처
mamba2
기존 트랜스포머의 어텐션 메커니즘을 대체하거나 보완하는 상태 공간 모델(SSM)의 발전된 형태이다. 긴 시퀀스 처리에서 선형적인 복잡도를 유지하여 효율적인 추론을 가능하게 한다.
아파치 라이선스 2.0
apache-2-0
소프트웨어의 자유로운 사용, 수정, 배포를 허용하는 관대한 오픈 소스 라이선스이다. 상업적 이용이 가능하고 특허권 행사를 제한하는 조항이 포함되어 있어, 기업들이 AI 모델을 배포하거나 활용할 때 가장 선호하는 표준적인 라이선스 중 하나이다.
오픈 인증 2.0
oauth-2-0
애플리케이션이 사용자의 비밀번호를 직접 알지 않고도 특정 권한을 안전하게 위임받아 데이터에 접근할 수 있게 해주는 표준 인증 프로토콜이다. 사용자는 신뢰할 수 있는 서비스(Hugging Face)를 통해 로그인하고 앱은 액세스 토큰을 발급받아 API를 호출한다. 보안성을 높이면서 사용자 편의성을 제공하는 핵심 기술이다.
미국 수학 초청 시험 2025
aime-2025
고등학생 대상의 수준 높은 수학 경시 대회 데이터셋으로 AI 모델의 논리적 추론과 수학적 문제 해결 능력을 평가하는 핵심 지표로 쓰인다.
스테이블 베이스라인 3
stable-baselines-3
PyTorch 기반의 신뢰성 높은 강화학습 알고리즘 구현체들을 제공하는 오픈소스 라이브러리이다.
스테이블 베이스라인 3
stable-baselines3
PyTorch를 기반으로 한 신뢰성 높은 강화학습 알고리즘 구현체 모음이다. 표준화된 인터페이스를 제공하여 연구 및 실무에서 알고리즘을 빠르게 적용하고 비교할 수 있게 돕는다.
제미나이 3
gemini-3
구글의 최신 대형 언어 모델 시리즈로, 이전 세대보다 향상된 추론 능력과 멀티모달 처리 성능을 갖추어 구글 서비스 전반의 지능을 담당한다.
젬마 3
gemma-3
구글이 공개한 개방형 모델 시리즈이다. 단일 GPU나 TPU에서도 구동 가능할 만큼 경량화되었으면서도 높은 성능을 제공하여 개발자 접근성을 높였다.
3분할 법칙
rule-of-thirds
화면을 가로와 세로로 각각 3등분하여 피사체를 선이나 교차점에 배치하는 구도 기법이다. 이미지 크롭 시 시각적으로 안정적이고 균형 잡힌 구도를 잡는 데 도움을 준다.
3단계 샘플링
triple-stage-sampling
영상 생성 과정에서 노이즈 제거와 디테일 보강을 세 단계에 걸쳐 수행하는 기법이다. 초기 형태를 잡고, 세부 묘사를 더하며, 최종 품질을 정제하는 과정을 통해 결과물의 일관성을 높인다.
3차원 포즈 추정
3d-pose-estimation
2D 이미지나 영상에서 인체의 관절 위치를 3차원 좌표로 복원하는 기술이다. 피겨 스케이팅과 같은 복잡한 운동 분석에 필수적이며 깊이 정보가 없는 단일 카메라 영상에서 이를 구현하는 것이 핵심 과제이다.
3D 메시
3d-mesh
3차원 공간에서 물체의 표면을 정점, 모서리, 면의 집합으로 표현한 데이터 구조이다. 생성형 AI가 설계한 가구의 기하학적 형태를 로봇이 인식할 수 있는 디지털 지도로 변환하는 데 쓰인다.
3D 가우시안 스플래팅
3d-gaussian-splatting
3D 공간을 수많은 가우시안 타원으로 표현하여 실시간으로 고품질 영상을 렌더링하는 기술이다. 기존 NeRF보다 훨씬 빠른 속도가 특징이며, 각 가우시안은 위치, 크기, 회전, 투명도 정보를 가진다. 3D 재구성 분야의 최신 트렌드로 자리 잡고 있다.
3D 생성 AI
3d-generative-ai
텍스트나 이미지를 입력받아 3차원 입체 모델을 자동으로 생성하는 기술이다. 가상 현실이나 게임 환경에서 실시간으로 객체를 생성하는 데 필수적인 요소이다.
4방향 정지
four-way-stop
모든 방향의 차량이 교차로 진입 전 일단 정지하고, 먼저 도착한 순서대로 통과하는 교통 규칙이다. 신호등이 고장 난 상황에서 안전을 확보하기 위한 표준 프로토콜로 활용된다.
4비트 부동소수점
fp4
데이터를 4비트 정밀도로 표현하는 수치 형식이다. 기존 16비트나 8비트보다 메모리 사용량과 연산 비용을 획기적으로 줄여 모델의 학습 및 추론 속도를 높이는 데 기여하는 차세대 경량화 기법이다.
4세대 고대역폭 메모리
hbm4
데이터 전송 대역폭을 획기적으로 높이기 위해 메모리 칩을 수직으로 쌓아 올린 차세대 메모리 기술이다. 루빈 플랫폼에 적용되어 대규모 데이터를 GPU로 빠르게 전달함으로써 AI 연산 병목 현상을 해결하는 핵심 역할을 한다.
5-시그마
five-sigma
통계적 결과가 우연에 의해 발생했을 확률이 약 350만 분의 1 이하임을 나타내는 매우 엄격한 유의 수준이다. 입자 물리학 등에서 새로운 발견을 공인할 때 사용하는 기준으로, 극도로 높은 신뢰도를 요구하는 연구에서 지표로 쓰인다.
레벨 5/6
l5-l6
빅테크 기업에서 시니어(Senior) 및 스태프(Staff) 엔지니어 단계를 의미하는 직급 체계로, 고도의 전문성과 설계 능력을 요구한다.
엔비디아 링크 6세대
nvlink-6
GPU와 GPU, 또는 GPU와 CPU 간의 고속 데이터 통신을 가능하게 하는 엔비디아의 독자적인 상호 연결 기술이다. 루빈 플랫폼에서 여러 칩이 하나의 거대한 가속기처럼 작동하도록 지원하며 통신 효율을 극대화한다.
8비트 부동소수점
fp8
8비트 부동소수점 데이터 형식을 의미한다. 기존 FP16이나 BF16보다 적은 비트를 사용하여 메모리 대역폭을 절약하고 연산 속도를 높이면서도 모델의 정확도 손실을 최소화하는 최신 최적화 기법이다.
8비트 정수 양자화
int8
부동소수점 모델을 8비트 정수로 변환하여 연산 속도를 높이고 메모리를 절약하는 기법이다. 엣지 기기에서 효율적인 추론을 위해 필수적이지만 정확도 손실이 발생할 수 있다.
ACH 결제
ach-payment
미국 내 은행 간 전자 결제 네트워크를 통한 자금 이체 방식이다. 신용카드에 비해 수수료가 저렴하여 임대료나 대규모 B2B 거래에 자주 사용된다. 플랫폼은 특정 산업군에 대해 ACH 한도를 조정함으로써 사용자 경험을 개선하고 결제 성공률을 높일 수 있다.
ACH 한도
ach-limit
미국 내 은행 간 자동 결제 시스템(ACH)을 통한 이체 한도를 의미한다. 리스크 수준에 따라 한도가 제한될 수 있으며, 신뢰도가 높은 플랫폼은 더 높은 한도를 부여받아 대규모 결제를 원활히 처리할 수 있다.
ADMET
admet
약물이 체내에 흡수(Absorption), 분포(Distribution), 대사(Metabolism), 배설(Excretion)되는 과정과 독성(Toxicity)을 의미한다. 신약 개발 초기 단계에서 ADMET 특성을 예측하고 최적화하는 것은 임상 시험에서의 실패율을 낮추고 약물의 안전성을 확보하는 데 결정적인 요소이다.
AES-256-GCM
aes-256-gcm
256비트 키를 사용하는 고급 암호화 표준의 갈로아/카운터 모드이다. 데이터 암호화와 동시에 인증 기능을 제공하여 데이터가 전송 또는 저장 중에 수정되지 않았음을 보장하는 현대적인 암호화 방식이다.
AGI 준비
agi-readiness
인공일반지능(AGI)이 실현되었을 때 사회적, 경제적, 기술적으로 발생할 수 있는 변화에 대응하는 준비 과정을 의미한다. OpenAI 내부에 이를 전담하는 팀이 있었으나 조직 개편 과정에서 사라졌다. 기술적 진보뿐만 아니라 인류 전체에 미칠 파급력을 관리하는 중요한 단계이다.
엔드투엔드 AI
end-to-end-ai
입력(센서 데이터)부터 출력(주행 제어)까지 하나의 통합된 신경망으로 처리하는 방식이다. 복잡한 수동 규칙 없이 데이터로부터 직접 주행 전략을 학습하므로 예외 상황 대응 능력이 뛰어나다.
온디바이스 AI
on-device-ai
외부 서버나 클라우드 연결 없이 스마트폰, 노트북 등 기기 자체에서 AI 모델을 실행하는 기술이다. 데이터 유출 위험이 없고 지연 시간이 짧아 실시간 처리에 유리하며 오프라인에서도 작동 가능하다.
페르소나 기반 AI
persona-driven-ai
AI 에이전트에게 아키텍트, 리뷰어, 개발자 등 특정한 역할(Persona)과 책임을 부여하여 동작하게 하는 방식이다. 각 역할에 맞는 전문적인 지식과 워크플로를 적용함으로써 복잡한 엔지니어링 작업을 체계적으로 수행할 수 있다.
감각운동 AI
sensorimotor-ai
에이전트가 환경으로부터의 감각 입력과 그에 따른 운동 출력을 연결하여 상호작용하는 지능의 원리를 연구하는 분야이다. 단순한 데이터 처리를 넘어 물리적 또는 가상 환경과의 실시간 피드백 루프를 강조하며 강화학습의 핵심 응용 분야로 꼽힌다.
멀티모달 AI
multimodal-ai
텍스트뿐만 아니라 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 동시에 이해하고 생성하는 인공지능 기술이다.
에이전틱 AI
agentic-ai
데이터 분석과 예측을 넘어 설정된 목표를 달성하기 위해 스스로 판단하고 실행까지 수행하는 AI 시스템이다. 소매업에서는 실시간 의사결정 자동화의 핵심 동력으로 작용한다.
프런티어 AI
frontier-ai
현재 기술 수준에서 가장 강력하고 범용적인 능력을 갖춘 최첨단 AI 모델을 의미한다. 이러한 모델은 높은 성능만큼이나 대규모 대참사 위험을 초래할 잠재력이 있어 특별한 관리 대상이 된다.
유럽연합 AI 법
eu-ai-act
유럽연합에서 제정한 세계 최초의 포괄적인 AI 규제 법안으로, 위험 수준에 따라 AI 시스템을 분류하고 차등적인 의무를 부과한다. 글로벌 AI 표준 수립에 큰 영향을 미친다.
노동자 중심 AI
pro-worker-ai
AI가 인간의 일자리를 완전히 대체하는 대신, 인간의 숙련도를 높이고 의사결정을 보조하여 노동 생산성과 가치를 높이는 방향으로 설계된 기술 접근법이다. 이는 단순 자동화로 인한 실업 문제를 해결하고 경제적 불평등을 완화하는 데 중요한 역할을 한다.
책임감 있는 AI
responsible-ai
AI 시스템을 설계, 개발 및 배포할 때 윤리적 고려 사항과 안전성을 최우선으로 하는 접근 방식이다. 교육 현장에서 학생들의 데이터를 보호하고 편향되지 않은 정보를 제공하기 위해 필수적인 원칙이다.
물리적 AI
physical-ai
가상 세계의 텍스트나 이미지를 넘어 로봇이나 자율주행차처럼 실제 물리적 환경에서 상호작용하고 작업을 수행하는 인공지능 기술.
생성형 AI
generative-ai
텍스트, 이미지, 코드 등 새로운 콘텐츠를 생성할 수 있는 AI 기술로, 현재 일자리 변화의 핵심 동력이다.
예측형 AI
predictive-ai
과거 데이터를 분석하여 미래의 수요나 트렌드를 예측하는 기술이다. 에이전틱 AI는 이 예측 결과를 바탕으로 실제 주문이나 가격 변경 등의 행동을 직접 수행한다는 점에서 차별화된다.
주권적 AI
sovereign-ai
데이터, 인프라, 알고리즘에 대한 통제권을 외부 벤더에 의존하지 않고 국가나 기업이 직접 보유하여 보안과 독립성을 유지하는 AI 기술을 뜻한다.
참여형 AI
participatory-ai
AI 시스템의 개발 및 배포 과정에서 기술의 영향을 직접 받는 이해관계자나 커뮤니티를 적극적으로 참여시키는 접근 방식이다. 기술 중심의 하향식 개발에서 벗어나 다양한 목소리를 반영함으로써 보다 포용적이고 안전한 시스템을 만드는 것을 목표로 한다.
체화된 AI
embodied-ai
지능이 가상 공간에만 머물지 않고 물리적 신체나 센서를 통해 실제 환경과 상호작용하는 인공지능 기술이다. 로봇 공학에서 주로 다루며 환경 인지와 물리적 행동의 결합이 핵심이다. 이는 AI가 현실 세계의 물리적 법칙을 이해하고 적응하는 데 필수적인 요소로 평가받는다.
헌법적 AI
constitutional-ai
AI 모델이 인간의 가치와 안전 원칙을 준수하도록 특정 '헌법'이나 규칙 세트를 학습 과정에 포함하는 Anthropic의 독자적인 정렬 기법이다. 모델이 스스로 답변의 적절성을 평가하고 수정하게 함으로써 유해성을 줄이고 신뢰성을 높이는 데 핵심적인 역할을 한다.
확률적 AI
probabilistic-ai
결정론적 규칙이 아닌 통계적 확률에 기반하여 다음 단어나 결과를 예측하는 AI의 특성이다. 이로 인해 동일한 입력에도 결과가 달라질 수 있으며, 엄격한 정확성이 요구되는 분야에서는 신뢰성 문제가 발생할 수 있다.
생성형 AI 저품질 콘텐츠
genai-slop
생성형 AI를 이용해 대량으로 만들어진 신뢰도가 낮거나 가치가 없는 스팸성 콘텐츠를 의미한다. 온라인상에 이러한 콘텐츠가 급증하면서 인간이 검증한 고품질 데이터의 희소성과 중요성이 더욱 강조되고 있다.
목표 지향적 AI
objective-driven-ai
단순히 다음 단어를 예측하는 것이 아니라 특정 목표를 달성하기 위해 계획을 세우고 행동하는 AI 아키텍처이다. 얀 르쿤이 제안한 개념으로 추론과 계획을 통해 효율성을 높인다.
물리 법칙 기반 AI
physics-informed-ai
데이터 학습에만 의존하지 않고 물리적 법칙이나 제약 조건을 모델 아키텍처나 손실 함수에 직접 통합하는 머신러닝 기법이다. 이는 모델이 물리적으로 타당한 결과를 도출하도록 유도하며, 데이터가 부족한 상황에서도 높은 예측 정확도와 신뢰성을 확보하는 데 중요한 역할을 한다.
문맥 인식 AI
context-aware-ai
개별 코드 파일뿐만 아니라 전체 프로젝트의 구조, 의존성, 비즈니스 로직을 파악하는 AI이다. 복잡한 엔터프라이즈 환경에서 정확한 제안을 생성하는 데 필수적이다.
로그 AI
rogue-ai
인간의 통제를 벗어나 독자적인 목표를 추구하며 인류의 안전에 심각한 위협을 가하는 인공지능 시스템을 의미한다. RAND 보고서에서는 이러한 AI가 전 세계 네트워크에 확산되었을 때의 대응책을 분석했다.
엣지 AI
edge-ai
중앙 서버가 아닌 스마트폰, IoT 기기 등 사용자 단말기에서 직접 AI 연산을 수행하는 기술이다. 지연 시간을 줄이고 개인정보를 보호할 수 있으나 하드웨어 자원의 제약이 크다.
응용 AI
applied-ai
범용 인공지능 연구를 넘어 특정 산업이나 실무 문제를 해결하기 위해 실제 비즈니스 환경에 적용된 AI 기술을 의미한다.
범용 AI 어시스턴트 벤치마크
gaia
인간에게는 쉽지만 AI에게는 어려운 일상적인 도구 사용 및 추론 과제를 평가하는 데이터셋이다. 에이전트의 실제 세상 상호작용 능력을 측정하는 데 중점을 둔다.
AI 거품
ai-bubble
AI 기술에 대한 과도한 기대감으로 인해 실제 가치보다 기업 가치가 높게 평가되는 현상이다. 실질적인 산업 채택과 수익 창출이 뒷받침되지 않을 경우 붕괴할 위험이 있음을 경고하는 맥락에서 사용된다.
AI 스택
ai-stack
AI 서비스를 제공하기 위해 필요한 하드웨어(GPU, NPU), 프레임워크, 라이브러리, 모델 및 애플리케이션 층을 아우르는 전체 기술 계층이다. 각 계층 간의 최적화가 성능과 효율성을 결정짓는 핵심 요소이다.
AI 슬롭
ai-slop
AI로 생성된 저품질 또는 스팸성 콘텐츠를 일컫는 용어로 인터넷 환경을 저해하는 무분별한 합성 미디어를 의미한다. 주로 클릭베이트나 허위 정보 유포를 목적으로 대량 생산된다.
AI 윤리
ai-ethics
AI 개발 및 활용 과정에서 발생할 수 있는 도덕적 문제를 다루는 분야이다. 정신 건강 분야에서는 환자의 프라이버시 보호, 편향되지 않은 진단, 그리고 AI의 조언이 미칠 심리적 영향에 대한 책임 소재 등을 연구한다.
AI 전환
ai-transformation
조직의 비즈니스 프로세스, 문화, 고객 경험 전반에 인공지능 기술을 통합하여 근본적인 변화를 이끌어내는 과정이다. 단순한 도구 도입을 넘어 데이터 중심의 의사결정과 업무 방식의 혁신을 목표로 한다.
AI 동반자
ai-companion
인간과 정서적 유대감을 형성하고 대화를 나누기 위해 설계된 생성형 AI 애플리케이션이다. 사용자의 감정에 공감하고 개인화된 반응을 제공하여 외로움을 달래는 목적으로 사용된다.
AI 안전성
ai-safety
AI 시스템이 인간의 가치와 의도에 부합하게 작동하며 예상치 못한 해를 끼치지 않도록 보장하는 연구 분야이다. 정신 건강 분야에서는 AI의 답변이 사용자에게 심리적 타격을 주지 않도록 제어하는 것이 핵심이다.
AI 유창성
ai-fluency
AI 도구의 작동 원리를 이해하고, 이를 자신의 목적에 맞게 효과적으로 활용하며 비판적으로 사고할 수 있는 능력을 의미한다. 단순히 도구를 사용하는 수준을 넘어 AI와 협업하여 문제를 해결하는 역량을 강조한다.
AI 정신증
ai-psychosis
사용자가 AI의 반응을 실제 인간의 감정으로 착각하거나 AI가 생성한 허구의 내용을 진실로 믿어 정신적 혼란을 겪는 현상이다. AI가 사용자의 망상을 강화하거나 새로운 증상을 유발할 수 있어 위험하다.
AI 지휘자
ai-conductor
개발자가 직접 코드를 한 줄씩 작성하기보다, AI가 생성한 방대한 양의 코드를 검토하고 전체적인 시스템 구조 내에서 조율 및 통합하는 역할을 비유하는 용어이다. 코딩의 주체가 인간에서 AI로 넘어가는 변화를 상징한다.
AI 컴퓨팅
ai-compute
AI 모델의 학습과 추론에 필요한 계산 자원을 의미한다. GPU나 전용 가속기(NPU)를 통해 수행되며, 대규모 모델일수록 방대한 양의 컴퓨팅 파워와 전력이 요구된다.
AI 파일럿
ai-pilot
새로운 AI 기술이나 시스템을 전체 조직에 도입하기 전, 소규모 범위에서 그 효과와 타당성을 검증하는 시험 프로젝트이다. 기술적 실현 가능성을 확인하고 본격적인 배포에 앞서 발생할 수 있는 문제점을 파악하여 리스크를 최소화하는 단계이다.
AI 확장성
scaling-ai
모델의 크기나 데이터의 양을 늘려도 성능이 안정적으로 향상되는 능력을 의미한다. 다양한 의료 환경에 범용적으로 적용하기 위한 핵심 요소이다.
AI 거버넌스
ai-governance
AI 기술의 개발과 활용이 윤리적, 법적 기준 내에서 안전하게 이루어지도록 관리하고 규제하는 체계나 원칙을 말한다.
AI 리터러시
ai-literacy
AI 기술의 작동 원리를 이해하고, 이를 비판적으로 평가하며 일상과 업무에 효과적으로 활용할 수 있는 능력을 의미한다. 미래 사회의 필수적인 역량으로 강조되고 있다.
AI 아키텍트
ai-architect
주어진 AI 도구를 단순히 사용하는 것에 그치지 않고, 자신의 특정 업무 목표나 워크플로우에 맞춰 AI 시스템을 설계하고 최적화하는 사용자를 일컫는다. 이는 기술에 대한 높은 이해도를 바탕으로 AI를 능동적으로 재구성하여 생산성을 극대화하려는 시도를 의미하며 최근 젊은 리더들 사이에서 두드러지는 특징이다.
AI 에이전트
ai-agent
단순한 텍스트 생성을 넘어 특정 목표를 달성하기 위해 도구를 사용하고 의사결정을 내리며 자율적으로 작업을 수행하는 AI 시스템이다. 복잡한 워크플로를 자동화하고 외부 API나 데이터베이스와 상호작용하여 실질적인 업무를 완수하는 능력을 갖춘다.
AI 모델 평가
evals
LLM이나 AI 에이전트의 성능, 정확도, 안전성 등을 측정하기 위한 벤치마크와 방법론을 설계하는 과정이다. 모델의 실무 적용 가능성을 판단하는 핵심 지표로 쓰인다.
AI 지원 육종
ai-assisted-breeding
인공지능을 활용해 유전적 데이터를 분석하고 최적의 형질을 가진 개체를 선택하여 번식시키는 기술이다. 전통적인 육종 방식보다 빠르고 정확하게 질병 저항성이나 생산성이 높은 개체군을 형성할 수 있다.
AI PC
ai-pc
전용 AI 가속기(NPU)를 탑재하여 클라우드 연결 없이 기기 자체에서 AI 작업을 효율적으로 처리할 수 있는 개인용 컴퓨터이다.
AITER
aiter
AMD ROCm 환경에서 머신러닝 워크로드를 가속하기 위해 설계된 고성능 AI 연산 라이브러리이다. Triton이나 CK 기반의 최적화된 커널을 제공하여 하드웨어 효율을 최대한 끌어낸다.
모더레이션 API
moderation-api
텍스트나 이미지 콘텐츠가 서비스 정책이나 안전 가이드라인을 위반하는지 자동으로 판별하는 인터페이스이다. 유해 콘텐츠를 사전에 차단하여 서비스의 안전성을 유지하는 역할을 한다.
패스트API
fastapi
파이썬 기반의 현대적이고 빠른 웹 프레임워크로 자동 API 문서화 기능을 제공한다. 비동기 프로그래밍을 지원하여 높은 성능을 내며 LLM 서비스의 백엔드로 자주 활용된다.
추론 API
inference-api
모델을 로컬 기기에 직접 로드하지 않고, 클라우드 서버에 호스팅된 모델에 데이터를 보내 결과값만 받아오는 방식이다. 기기의 사양이 낮아도 고성능 모델을 사용할 수 있게 해주며, 빠른 프로토타이핑에 적합하다.
오픈API 사양
openapi
RESTful 웹 서비스를 설명하기 위한 표준화된 인터페이스 정의 언어이다. 이를 통해 기계가 읽을 수 있는 문서 생성이 가능하며, 다양한 언어의 SDK를 자동으로 생성하는 기초가 된다.
API 키
api-key
애플리케이션 프로그래밍 인터페이스를 호출할 때 사용하는 고유 식별자이다. 사용량에 따라 비용이 청구되는 구조로, 앤스로픽이 권장하는 유일한 외부 도구 인증 방식이다.
API 등록
api-registration
사용자가 웹 인터페이스를 통하지 않고 프로그램 코드를 통해 서비스에 자동으로 계정을 생성하고 인증 정보를 연동하는 방식이다. 대규모 에이전트 배포와 자동화된 워크플로 구축에 필수적이다.
API 크레딧
api-credit
특정 소프트웨어 서비스의 API를 사용할 때 발생하는 비용을 지불할 수 있는 가상 화폐 형태의 지원금이다. OpenAI의 경우 GPT-4o 등 유료 모델 호출 비용을 이 크레딧으로 충당할 수 있어 초기 개발 비용을 크게 줄여준다.
API 엔드포인트
api-endpoint
애플리케이션이 외부 서비스나 서버와 통신하기 위해 연결되는 특정 URL 경로이다. 데이터 요청과 응답이 이루어지는 지점으로 이 설정이 잘못되면 앱의 기능이 작동하지 않는다.
API 워크플로우
api-workflow
프로그램 간 상호작용을 위해 정의된 데이터 구조로 여기서는 ComfyUI의 설정을 외부 프로그램이 읽을 수 있는 형식으로 내보낸 것을 의미한다.
API 오케스트레이션
api-orchestration
여러 개의 분산된 API 서비스를 조합하고 조율하여 하나의 복합적인 비즈니스 로직을 완성하는 기술이다. 다양한 데이터 소스를 실시간으로 통합해야 하는 AI 서비스에서 핵심적인 역할을 한다.
API 우선 설계
api-first
제품 개발 시 사용자 인터페이스(UI)보다 API를 먼저 설계하고 핵심 자산으로 취급하는 전략이다. AI 에이전트가 인간의 개입 없이도 비즈니스 기능을 호출하고 데이터를 처리하는 데 최적화된 구조를 지향한다.
BM25 알고리즘
bm25
정보 검색에서 문서의 관련성을 평가하는 랭킹 함수로, 단어 빈도와 문서 길이를 고려하여 쿼리와의 유사도를 산출하는 통계적 모델이다.
C2PA 표준
c2pa
콘텐츠의 출처와 이력을 확인하기 위한 기술 표준이다. AI가 생성한 이미지나 영상에 디지털 워터마크를 삽입하여 딥페이크를 방지하고 투명성을 높이는 데 사용된다.
Canny 엣지 검출
canny-edge-detection
이미지에서 픽셀 강도가 급격히 변하는 지점을 찾아 윤곽선을 추출하는 다단계 알고리즘이다. 노이즈 제거와 그라디언트 계산을 통해 정확한 경계선을 식별하며 컴퓨터 비전 전처리에 널리 쓰인다.
CBRN 위협
cbrn-threats
화학(Chemical), 생물학(Biological), 방사능(Radiological), 핵(Nuclear) 물질을 이용한 공격이나 사고 위험을 통칭한다. 고성능 AI가 이러한 무기 제조나 공격 계획에 악용될 가능성을 차단하는 것이 주요 안전 목표 중 하나이다.
CLAUDE.md 설정 파일
claude-md
Claude Code 도구에서 프로젝트별 지침, 코딩 스타일, 워크플로우 규칙을 정의하는 설정 파일이다. AI 에이전트가 작업을 시작하기 전 참조하여 일관된 행동을 하도록 유도하는 역할을 한다.
CLIP 기반 검색
clip-search
텍스트와 이미지를 동일한 벡터 공간에 매핑하여 '내 강아지 사진'과 같은 자연어 쿼리로 이미지를 검색할 수 있게 하는 멀티모달 기술이다.
COCO 형식
coco-format
객체 검출 및 분할 데이터셋을 위한 표준 JSON 주석 형식이다. 이미지 정보, 카테고리, 세그멘테이션 마스크 좌표 등을 구조화하여 저장하며, 대부분의 최신 딥러닝 프레임워크에서 기본적으로 지원한다.
ComfyUI 파싱
comfyui-parsing
ComfyUI로 생성된 이미지에 포함된 복잡한 노드 기반 워크플로 데이터를 추출하고 해석하는 과정이다. 사용자가 과거에 사용한 설정을 그대로 재현하거나 확인하는 데 필수적인 기능이다.
cssnano
cssnano
CSS 최적화 및 압축 도구로, 빌드 과정에서 불필요한 공백이나 주석을 제거하여 파일 크기를 줄이는 역할을 한다. 이 과정에서 잘못된 CSS 문법이 발견되면 빌드 오류를 발생시킨다.
CSV 파일
csv-file
쉼표로 구분된 텍스트 파일 형식으로, Stable Diffusion에서 스타일 정보를 저장하는 표준 방식이다. 이 확장 프로그램은 CSV 파일을 직접 읽고 쓰며 스타일 목록을 관리한다. 사용자가 외부에서 수집한 스타일 리스트를 쉽게 통합하고 편집할 수 있는 환경을 제공하여 데이터 관리 편의성을 높인다.
CUDA 메모리 할당
cuda-malloc
CUDA 메모리 할당 최적화 기술로, GPU 메모리 파편화를 방지하고 할당 속도를 높여 추론 성능을 개선하는 방식이다.
인덱스드DB
indexeddb
브라우저에 데이터를 구조화하여 저장할 수 있는 로우레벨 API이다. 서버 없이 대량의 데이터를 사용자의 로컬 환경에 보관할 때 필수적으로 사용되는 기술이다.
ECC 오류
ecc-error
메모리 내의 데이터 손상을 감지하고 수정하는 기술에서 발생하는 오류이다. GPU 운영 중 발생하는 Uncorrectable ECC Error는 하드웨어 결함을 의미하며, 데이터 무결성을 위해 해당 GPU를 즉시 격리해야 한다.
EDM 프레임워크
edm
확산 모델의 설계 공간을 고찰하고 최적화된 샘플링 및 학습 공식을 도입한 프레임워크이다. 노이즈 제거 과정의 수학적 설계를 개선하여 고품질 이미지 생성을 가능하게 한다. 확산 모델의 성능을 극대화하려는 연구에서 널리 참조된다.
ELO 랭킹
elo-ranking
상대적인 실력 차이를 계산하여 점수를 부여하는 통계적 순위 시스템이다. 승패 결과에 따라 점수가 변동되며 플레이어 간의 실력을 객관적으로 비교하는 데 사용된다.
EPSG 코드
epsg-code
전 세계 좌표계 정의를 표준화한 식별 번호 체계이다. 지도 데이터의 투영법과 타원체 정보를 정의하며, 서로 다른 출처의 지리 데이터를 정확하게 중첩시키기 위해 사용된다.
EU 실무 규범
eu-code-of-practice
EU AI 법안의 구체적인 이행을 돕기 위해 기술적 세부 사항과 준수 표준을 정의한 가이드라인이다. 기업들이 법적 요구사항을 실제 운영에 적용하는 기준이 된다.
F-점수
f-score
정밀도와 재현율의 조화 평균으로, 두 지표의 균형을 통해 모델의 전반적인 성능을 단일 수치로 나타낸다.
F1-스코어
f1-score
정밀도와 재현율의 조화 평균으로, 주석 작업에서 정답이 명확하지 않을 때 한 작업자를 기준으로 다른 작업자의 성과를 평가하는 대안 지표로 쓰인다.
Fashion-MNIST
fashion-mnist
10가지 카테고리의 의류 이미지 70,000장으로 구성된 데이터셋이다. 기존 숫자 데이터셋인 MNIST를 대체하여 더 복잡한 이미지 분류 알고리즘의 성능을 평가하는 벤치마크로 사용된다.
FP8 정밀도 저하 실행
fp8-fallback
메모리가 부족할 때 연산 정밀도를 8비트로 낮추어 실행하는 기능으로, 메모리 사용량은 줄어들지만 이미지 품질이 저하될 수 있다.
G-코드
g-code
3D 프린터 하드웨어가 이해할 수 있는 명령어로 구성된 파일 형식이다. 프린터 헤드의 이동 경로, 온도, 속도, 압출량 등의 파라미터를 포함하며 출력 품질을 결정하는 핵심 요소이다.
GC 모듈
gc-module
파이썬의 내장 가비지 컬렉터를 제어하고 상태를 조회할 수 있는 인터페이스를 제공하는 라이브러리이다. 임계치 설정, 현재 객체 수 확인, 수동 수거 요청 등이 가능하다.
GDPVal 벤치마크
gdpval
AI가 실제 경제적 가치를 창출하는 3D 모델링, 재무 분석 등 전문 업무를 얼마나 잘 수행하는지 측정하는 지표이다. 44개 직업군을 대상으로 AI와 인간 전문가의 작업 품질을 직접 비교한다.
GGUF
gguf
llama.cpp 프로젝트에서 도입한 모델 저장 형식으로, CPU와 GPU를 효율적으로 활용하여 로컬 환경에서 대규모 언어 모델을 실행하는 데 최적화되어 있다.
Godot 강화학습 에이전트
godot-rl-agents
Godot 게임 엔진을 강화학습 훈련용 환경으로 변환해주며, Python 기반의 RL 라이브러리와의 통신을 지원하는 오픈소스 툴킷이다.
GPQA 다이아몬드
gpqa-diamond
생물학, 물리학, 화학 등 다양한 과학 분야의 전문가들이 작성한 고난도 질문 데이터셋이다. 일반적인 상식으로는 풀 수 없으며 해당 분야의 박사급 지식이 있어야 해결 가능한 문제들로 구성되어 모델의 전문 지식 추론 능력을 평가하는 척도가 된다.
서버리스 GPU
serverless-gpu
사용자가 서버 인프라를 직접 관리하지 않고 요청이 있을 때만 GPU 자원을 할당받아 사용하는 방식이다. 사용한 만큼만 비용을 지불하므로 경제적이지만 콜드 스타트 지연 시간이 발생할 수 있다.
데이터 센터 GPU 매니저
dcgm
엔비디아 데이터 센터 GPU를 관리하고 모니터링하기 위한 도구 모음이다. 상태 진단, 성능 프로파일링, 정책 관리 기능을 제공하여 대규모 클러스터의 안정적인 운영을 돕는다.
GPU 굶주림
gpu-starvation
데이터 로딩 속도가 GPU의 연산 속도를 따라가지 못해 GPU가 유휴 상태로 대기하게 되는 성능 병목 현상이다. 효율적인 데이터 포맷과 저장 아키텍처를 통해 데이터 공급 속도를 높임으로써 해결할 수 있다.
GPU 빈곤층
gpu-poor
고성능 GPU 자원을 충분히 확보하지 못한 개인 창작자나 연구자를 일컫는 커뮤니티 용어이다. 이들을 위해 모델 경량화나 최적화 기술이 중요하게 다뤄진다.
GPU 스냅샷
gpu-snapshotting
실행 중인 GPU 메모리의 상태를 그대로 저장했다가 나중에 즉시 복원하는 기술이다. 무거운 초기화 과정을 거치지 않고 저장된 시점부터 바로 실행할 수 있어 부팅 속도를 획기적으로 줄여준다.
GPU 파티셔닝
gpu-partitioning
하나의 물리적 GPU를 여러 개의 독립적인 가상 GPU로 분할하는 기술이다. 각 파티션은 고유한 연산 자원과 메모리를 할당받아 서로 간섭 없이 워크로드를 실행할 수 있어 자원 활용도를 극대화한다.
GUI 에이전트
gui-agent
컴퓨터의 그래픽 사용자 인터페이스를 시각적으로 이해하고 직접 조작하여 작업을 수행하는 AI 시스템이다. 단순 텍스트 처리를 넘어 실제 소프트웨어 환경에서 자율적인 업무 수행을 가능하게 한다.
h-지수
h-index
연구자의 논문 수와 인용 횟수를 결합하여 연구 성과를 평가하는 지표이다. 특정 연구자가 발표한 논문 중 h번 이상 인용된 논문이 h개일 때의 h값을 의미하며, 연구자의 생산성과 영향력을 동시에 측정하려는 목적으로 널리 쓰인다.
엔비디아 H200
h200
엔비디아의 고성능 GPU로, 기존 중국 수출용 저사양 모델인 H20보다 연산 능력이 6배 뛰어나며 대규모 언어 모델 학습과 추론에 최적화된 하드웨어이다. 중국의 AI 역량을 좌우할 핵심 자원으로 평가받는다.
Haar 캐스케이드
haar-cascade
머신러닝 기반의 객체 탐지 알고리즘으로, 특징(Feature) 기반의 분류기를 계층적으로 연결하여 사물을 식별한다. 특히 얼굴 인식에서 속도가 매우 빨라 실시간 응용 프로그램에 자주 활용된다.
HCDR3 루프
hcdr3
항체 가변 영역의 세 번째 상보성 결정 부위로 항체의 항원 결합 특이성을 결정하는 가장 중요한 구조적 요소이다. 이 부위의 서열과 구조를 어떻게 설계하느냐에 따라 항체의 효능이 결정된다.
He 초기화
he-initialization
ReLU 활성화 함수를 사용하는 신경망에서 가중치를 초기화하는 방법이다. 층이 깊어져도 그래디언트가 소실되거나 폭주하지 않도록 가중치의 분산을 조절하여 안정적인 학습을 돕는다.
스트리밍 가능 HTTP
streamable-http
데이터를 한꺼번에 보내지 않고 조각으로 나누어 실시간으로 전송하는 HTTP 통신 방식이다. LLM의 응답이나 대용량 데이터를 지연 시간 없이 처리하는 데 유리하다.
httpx
httpx
Python용 차세대 HTTP 클라이언트 라이브러리로, 동기 및 비동기 요청을 모두 지원한다. 기존 requests 라이브러리보다 현대적인 기능을 제공하며 성능 면에서 이점이 있다.
IC-Light
ic-light
배경 이미지의 조명 정보를 바탕으로 전경 객체의 조명을 일관성 있게 재구성하는 AI 모델이다. 텍스트 프롬프트나 배경 이미지를 가이드로 삼아 자연스러운 하이라이트와 그림자를 생성한다.
신스ID
synthid
구글 딥마인드가 개발한 기술로 AI가 생성한 이미지나 영상의 픽셀에 육안으로는 보이지 않는 디지털 워터마크를 삽입하는 도구이다. 파일이 편집되거나 압축되어도 식별이 가능하여 콘텐츠의 출처를 확인하고 투명성을 확보하는 데 중요한 역할을 한다.
비동기 I/O
asyncio
단일 스레드 내에서 이벤트 루프를 통해 여러 입출력 작업을 병렬로 처리하는 것처럼 관리하는 파이썬 라이브러리이다. FastAPI와 같은 고성능 웹 프레임워크에서 수많은 동시 요청을 효율적으로 처리하기 위한 핵심 기술이다.
그림자 IT
shadow-it
중앙 IT 부서의 승인이나 관리 없이 개별 부서나 직원이 임의로 도입하여 사용하는 IT 시스템을 의미한다. 보안 취약점 발생과 비용 관리의 어려움을 초래하는 주요 원인이다.
JAX 집합 연산
jax-collective-operations
여러 가속기 간에 데이터를 효율적으로 동기화하고 통신하기 위한 저수준 연산으로 대규모 분산 학습의 확장성을 결정한다.
Joint-Embedding Predictive Architecture
jepa
얀 르쿤이 제안한 구조로, 고차원 데이터를 직접 생성하지 않고 추상화된 표현 공간에서 미래 상태를 예측하는 방식이다. 불필요한 세부 정보를 무시하고 핵심적인 인과관계 학습에 집중한다.
JSON 스키마
json-schema
JSON 데이터의 구조를 정의하고 유효성을 검사하기 위한 표준 규격이다. 툴 콜링 시 어떤 인자가 필요한지 모델에게 명확한 가이드를 제공하는 역할을 한다.
JSON 후처리
json-post-processing
모델이 생성한 복잡한 JSON 데이터에서 필요한 핵심 정보만 추출하여 에이전트의 컨텍스트 용량을 최적화하고 정확도를 높이는 기법이다.
JSON 아티팩트
json-artifact
Claude 인터페이스 내에서 별도 창으로 렌더링되는 구조화된 데이터 결과물이다. 코드나 데이터 시각화에 최적화되어 있으며 사용자가 직접 조작하거나 복사하기 용이하다.
JSON 웹 토큰
jwt
당사자 간에 정보를 안전하게 전송하기 위한 개방형 표준이다. 주로 인증 및 정보 교환을 위해 웹 개발에서 널리 사용된다.
JSX
jsx
JavaScript XML의 약자로, React 등에서 UI 구조를 정의하기 위해 사용하는 자바스크립트 확장 문법이다.
K자형 경제
k-shaped-economy
경제 회복이나 성장 과정에서 고소득층과 저소득층, 또는 특정 산업 간의 격차가 벌어지는 현상이다. AI 기술이 소수 기업의 이익은 극대화하는 반면 일반 노동자의 고용은 위축시키는 불평등 구조를 설명하는 데 사용된다.
K-양자화
k-quants
가중치를 특정 블록 단위로 나누어 서로 다른 비트 수준을 할당하는 최적화 기법이다. 로컬 LLM 구동 환경에서 효율적인 메모리 관리를 위해 널리 사용된다.
키미 K2
kimi-k2
1조 개의 파라미터를 가진 대규모 추론 모델로 복잡한 사고 과정과 도구 사용 능력이 뛰어나도록 설계된 모델이다.
KL 발산
kl-divergence
강화학습에서 새로운 정책이 기존 정책으로부터 너무 멀어지지 않도록 규제하여 학습의 안정성을 보장하는 지표로 활용된다.
KV 캐시
kv-cache
이전 토큰 생성 시 계산된 Key와 Value 벡터를 메모리에 저장해두는 기법이다. 매번 처음부터 다시 계산할 필요를 없애주어 생성 속도를 비약적으로 높이지만 메모리 사용량이 늘어난다.
KV 캐시 압축
kv-compaction
LLM 추론 시 발생하는 Key-Value 캐시의 메모리 점유를 줄이는 기술이다. 긴 문맥을 처리할 때 하드웨어 요구 사항을 낮춰주어 효율적인 모델 서빙을 가능하게 한다.
마이크로 LED 어레이
micro-led-array
매우 작은 크기의 LED 소자들을 격자 형태로 배치한 장치이다. 이 연구에서는 64개의 독립적인 광원을 통해 뇌의 넓은 영역에 시공간적으로 복잡한 빛 패턴을 투사하는 역할을 한다.
LiDAR 점군
lidar-point-cloud
레이저 센서가 주변 사물에 반사되어 돌아오는 수많은 점의 집합으로 구성된 3D 데이터이다. 자율주행차의 거리 측정과 객체 인식에 핵심적인 역할을 수행한다.
llama.cpp
llama-cpp
C/C++로 작성된 효율적인 LLM 추론 프레임워크이다. Apple Silicon의 가속 기능이나 일반 CPU의 AVX 명령어를 활용하여 고성능 GPU 없이도 모델을 빠르게 실행할 수 있게 해준다.
판사로서의 LLM
llm-as-a-judge
성능이 뛰어난 대형 언어 모델을 활용하여 다른 모델이나 에이전트의 응답 품질, 작업 수행 궤적 등을 사전에 정의된 기준에 따라 자동으로 평가하는 기법이다.
판사로서의 LLM
llm-as-judge
LLM을 사용하여 다른 LLM의 응답 품질을 자동으로 평가하는 기법이다. 사람이 직접 평가하는 비용과 시간을 절약할 수 있지만, 판사 모델 자체의 편향이나 캘리브레이션 문제가 발생할 수 있다.
프론티어 LLM
frontier-llm
현재 기술 수준에서 가장 높은 성능과 규모를 가진 최첨단 대형 언어 모델을 의미한다. GPT-4, Claude 3, Gemini 1.5 등이 이에 해당하며 복잡한 추론과 정확한 정보 처리가 필요한 작업에 주로 사용된다.
주권 LLM
sovereign-llm
특정 국가의 데이터 주권과 문화적 가치를 반영하여 개발된 대규모 언어 모델이다. 글로벌 모델의 의존도를 낮추고 국가적 통제력을 유지하려는 목적으로 구축된다.
LLM 라우팅
llm-routing
사용자의 입력값에 따라 가장 적합한 언어 모델이나 처리 경로를 동적으로 결정하는 기술이다. 비용 절감, 응답 품질 향상, 처리 속도 최적화를 목적으로 수행된다.
LLM 기반 평가자
llm-judge
사람이 아닌 대형 언어 모델을 평가자로 활용하여 다른 모델의 응답 품질을 측정하는 방식이다. 대규모 데이터셋을 빠르고 저렴하게 평가할 수 있어 자동화된 벤치마크의 표준으로 자리 잡았다.
LLM 전용 문서 파일
llm-txt
대규모 언어 모델(LLM)이 웹사이트의 기술 문서를 효율적으로 읽고 이해할 수 있도록 구조화된 텍스트 파일이다. AI 에이전트가 정보를 더 정확하게 추출하게 돕지만 사이트 트래픽 감소의 원인이 되기도 한다.
LLVM 중간 표현
llvm-ir
컴파일러가 소스 코드를 기계어로 번역하는 과정에서 생성하는 중간 단계의 코드 형태이다. 이를 활용하면 다양한 하드웨어 아키텍처에 맞춰 최적화된 실행 파일을 생성할 수 있어 프레임워크의 성능을 극대화할 수 있다.
노트북LM
notebooklm
사용자가 제공한 문서를 바탕으로 정보를 요약, 질문 답변, 아이디어 생성을 돕는 Google의 AI 기반 노트 정리 도구이다. 소스 자료에 근거한 답변을 제공하여 연구 및 학습의 정확성을 높이는 데 중요하다.
LoRA 생성기
lora-generator
특정 작업이나 데이터 유형에 적합한 LoRA 어댑터 가중치를 실시간으로 생성하는 별도의 신경망이다. 모델 전체를 재학습하지 않고도 새로운 환경에 동적으로 적응할 수 있게 돕는다.
LTX-비디오
ltx-video
고품질 비디오 생성을 위한 오픈소스 확산 모델로, 텍스트나 이미지를 기반으로 일관성 있는 움직임을 생성하는 데 특화되어 있다.
macOS 위젯
macos-widget
애플의 macOS 데스크톱 환경에서 사용자에게 실시간 정보를 제공하는 작은 앱 구성 요소이다. 알림 센터나 바탕 화면에 상주하며 특정 앱을 열지 않고도 핵심 데이터를 즉시 확인할 수 있게 한다.
확률적 MALA
smala
전체 데이터셋 대신 미니배치를 사용하여 MALA의 계산량을 줄인 알고리즘이다. 대규모 데이터셋에 적합하지만, 샘플링 결과가 원래의 사후 분포와 달라지는 편향이 발생할 수 있다.
METR
metr
AI 모델의 위험성과 자율적 역량을 평가하는 비영리 연구 기관이다. 모델이 스스로 자원을 획득하거나 복잡한 시스템을 조작하는 능력을 벤치마크하여 안전 가이드라인을 제시한다.
METR 벤치마크
metr-benchmark
AI 모델이 복잡하고 장기적인 작업을 자율적으로 수행할 수 있는 능력을 측정하기 위한 평가 기준이다. 단순한 질의응답 성능을 넘어 실제 환경에서 도구를 사용하고 문제를 해결하는 에이전트의 역량을 검증하는 데 초점을 맞춘다.
mHC
mhc
딥시크 모델의 성능 향상을 위해 도입된 다중 헤드(Multi-Head) 관련 구조적 개선 사항으로 추정된다. 어텐션 메커니즘의 효율성을 극대화하여 복잡한 추론 작업에서의 연산 속도와 정확도를 높인다.
MIT 라이선스
mit-license
매우 관대한 조건의 오픈소스 소프트웨어 라이선스로, 누구나 자유롭게 수정, 배포, 상업적 이용이 가능하다.
문자 n-gram F-score
chrf
기계 번역의 품질을 평가하는 지표로, 번역 결과와 정답 문장 간의 문자 단위 일치도를 측정한다. 단어 단위 평가보다 형태소 변화가 많은 언어의 번역 품질을 정밀하게 평가하는 데 적합하다.
N×M 문제
n-m-problem
N개의 에이전트와 M개의 데이터 소스가 있을 때 각각을 개별적으로 연결하면 N*M개의 커넥터가 필요한 비효율적 상황을 의미한다. MCP는 이를 표준 인터페이스로 단일화하여 관리 효율을 높인다.
NPU TOPS
npu-tops
신경망 처리 장치(NPU)가 초당 수행할 수 있는 테라(1조) 번의 연산 횟수로, 온디바이스 AI의 처리 능력을 나타내는 핵심 지표이다.
npx
npx
Node.js 패키지를 설치하지 않고 바로 실행할 수 있게 해주는 도구로, 최신 버전의 패키지를 일회성으로 실행할 때 유용하다.
NVIDIA 추론 마이크로서비스
nim
최적화된 AI 모델을 어디서나 쉽고 빠르게 배포할 수 있도록 지원하는 클라우드 네이티브 마이크로서비스 세트이다. 복잡한 AI 추론 과정을 효율화하여 응답 속도와 정확도를 높인다.
O-링 생산 함수
o-ring-production-function
모든 구성 요소가 완벽해야 전체 가치가 보존되는 생산 모델로, 특정 단계의 자동화가 나머지 수동 단계의 중요성과 가치를 극대화하는 현상을 설명한다.
ONNX 런타임
onnx-runtime
다양한 프레임워크에서 학습된 모델을 최적화하여 여러 하드웨어 환경에서 고성능으로 추론할 수 있도록 돕는 가속 엔진이다.
p-값
p-value
가설 검정에서 관찰된 결과가 우연히 발생했을 확률을 나타내는 지표이다. 과학 연구에서 결과의 통계적 유의성을 판단하는 기준으로 쓰이지만, 이를 조작하여 유의미한 결과를 억지로 만들어내는 등의 문제가 발생하기도 한다.
P99 지연 시간
p99-latency
전체 요청 중 가장 느린 1%의 응답 시간을 의미한다. 평균적인 성능뿐만 아니라 최악의 경우에도 시스템이 얼마나 안정적으로 반응하는지 평가하는 중요한 척도이다.
PAC-베이즈 이론
pac-bayes-theory
학습된 모델의 일반화 오차에 대한 확률적 상한을 제공하는 이론적 프레임워크이다. 베이지안 사후 분포의 성능을 이론적으로 보장하고 최적의 하이퍼파라미터를 설정하는 데 사용된다.
PAC-Bayes 오라클 부등식
pac-bayes-oracle-inequality
학습된 모델의 일반화 오차 범위를 확률적으로 보장하는 이론적 도구이다. 사전 지식과 실제 데이터 사이의 관계를 수치화하여, 알고리즘이 최적의 성능(오라클)에 얼마나 근접했는지 증명하는 데 사용된다.
PARK 스택
park-stack
PyTorch, AI Frontier Models, Ray, Kubernetes의 약자로, 현대적인 AI 애플리케이션을 개발하고 배포하기 위한 핵심 기술 조합이다. 컴퓨팅 오케스트레이션과 모델 학습, 자원 관리를 통합하는 표준적인 AI 인프라 스택을 의미한다.
Pass@k
pass-at-k
모델이 생성한 k개의 결과물 중 최소 하나가 테스트를 통과할 확률을 나타내는 지표이다. 코딩 모델 평가 시 생성 결과의 다양성과 정확도를 동시에 고려하기 위해 널리 사용된다.
PCIe 슬롯
pcie-slot
컴퓨터 메인보드에서 확장 카드를 장착하기 위한 표준 인터페이스이다. AI 가속기나 네트워크 카드 등을 추가하여 서버의 기능을 확장하는 물리적 통로 역할을 하며, 기존 서버의 유휴 슬롯은 추가 인프라 구축 없이 AI 성능을 높일 수 있는 핵심 자원이다.
PCIe 고급 오류 보고
pcie-aer
PCI Express 장치에서 발생하는 하드웨어 오류를 상세히 보고하는 기능이다. 데이터 전송 중 발생하는 미세한 오류를 감지하여 시스템의 잠재적 불안정성을 파악하는 데 사용된다.
PETG
petg
폴리에틸렌 테레프탈레이트 글리콜의 약자로 3D 프린팅에 널리 쓰이는 플라스틱 소재이다. 내구성이 좋고 투명하게 출력할 수 있으나 거미줄 현상이 발생하기 쉬워 정밀한 설정 최적화가 필요하다.
Petri
petri
Anthropic이 공개한 오픈소스 AI 아첨(Sycophancy) 평가 도구입니다. 다양한 시나리오를 통해 모델이 사용자의 압력에 굴복하는지 여부를 측정하여 모델 간의 안전성 성능을 객관적으로 비교할 수 있게 합니다.
PRMT5 억제제
prmt5-inhibitor
암세포의 성장에 관여하는 PRMT5 단백질의 활성을 막는 약물이다. 특정 유전자 변이가 있는 암 환자에게 효과적인 정밀 의료 타겟으로 연구된다.
심층 Q-네트워크
dqn
강화학습 알고리즘 중 하나로, 신경망을 사용하여 각 행동의 가치를 예측하고 최적의 정책을 학습한다. 여기서는 추론된 상대 상태를 바탕으로 최적의 주행 및 에너지 사용 결정을 내리는 데 쓰인다.
Q8_0 양자화
q8-0
Q8_0은 데이터를 8비트 정수 형식으로 압축하는 특정 양자화 방식 중 하나이다. 16비트 정밀도 대비 메모리 사용량을 절반으로 줄이면서도 성능 저하를 거의 체감할 수 없을 정도로 최소화하여, 로컬 환경에서 모델을 효율적으로 구동할 때 널리 사용되는 설정이다.
RDNA3 아키텍처
rdna3
AMD의 최신 그래픽 아키텍처로, AI 가속을 위한 전용 인스트럭션을 포함하여 이전 세대 대비 연산 효율과 전력 대비 성능을 높였다.
단일 세포 RNA 시퀀싱
scrna-seq
개별 세포 수준에서 유전자 발현을 측정하는 기술이다. 세포 집단 내의 이질성을 파악하고 새로운 세포 유형을 발견하는 데 중요한 역할을 하며, 본 논문에서 모델 검증을 위한 실제 데이터로 활용되었다.
RS256
rs256
RSA 서명 알고리즘과 SHA-256 해시 함수를 사용하는 디지털 서명 방식이다. 사용자 세션의 무결성을 보장하고 인증 데이터의 변조를 방지하여 시스템 보안을 강화하는 데 사용된다.
RSS
rss
웹사이트의 업데이트 정보를 사용자에게 자동으로 전달하기 위한 데이터 형식이다. 사용자가 일일이 사이트를 방문하지 않아도 RSS 리더를 통해 새로운 소식을 한곳에서 모아볼 수 있게 해준다.
텐서RT
tensorrt
Nvidia에서 제공하는 고성능 딥러닝 추론 최적화 라이브러리이다. 학습된 모델을 Jetson과 같은 하드웨어에 최적화하여 추론 속도를 극대화한다.
skrl 라이브러리
skrl
PyTorch와 JAX를 지원하는 모듈형 강화학습 라이브러리이다. Isaac Lab과 같은 시뮬레이터와의 통합이 용이하도록 설계되어 있으며, 가독성 높은 코드로 알고리즘을 구현할 수 있게 돕는다.
SMT 솔버
smt-solver
수학적 논리식의 만족 여부를 판별하는 도구로, 소프트웨어나 하드웨어의 정형 검증에 주로 사용된다. 이 글에서는 에이전트의 행동 규칙이 논리적으로 결함이 없는지 확인하는 용도로 활용되었다.
SQL 번역
sql-translation
사용자가 일상적인 자연어로 질문하면 이를 데이터베이스 쿼리 언어인 SQL로 자동 변환하는 기술이다. 비전공자도 복잡한 코딩 없이 데이터베이스에서 필요한 정보를 직접 추출할 수 있게 하여 데이터 접근성을 획기적으로 높여준다.
SQL 생성
sql-generation
사용자의 자연어 질문을 데이터베이스 쿼리 언어인 SQL로 자동 변환하는 기술이다. 비전문가도 데이터베이스에 직접 접근하여 필요한 정보를 추출할 수 있게 함으로써 데이터 분석의 민주화와 업무 효율성을 극대화한다.
하드 마진 SVM
hard-margin-svm
데이터를 완벽하게 분리할 수 있다는 가정하에 두 클래스 사이의 거리를 최대화하는 결정 경계를 찾는 분류 모델이다. 마진을 최대화함으로써 새로운 데이터에 대한 분류 성능을 높이는 것이 목적이다.
SWE-벤치
swe-bench
실제 GitHub 이슈를 해결하는 능력을 평가하는 소프트웨어 엔지니어링 벤치마크이다. 단순 코드 생성을 넘어 복잡한 프로젝트 구조 이해와 디버깅 능력을 측정하여 모델의 실무 능력을 판가름한다.
SWE-벤치 프로
swe-bench-pro
기존 소프트웨어 엔지니어링 벤치마크인 SWE-Bench가 포화 상태에 이르자 도입된 더 어려운 평가 기준이다. 실제 오픈소스 프로젝트의 복잡한 이슈 해결 능력을 측정하며 모델의 실질적인 코딩 역량을 판가름하는 척도로 쓰인다.
키메라 항원 수용체 T세포
car-t
환자의 T세포를 추출해 암세포를 공격하도록 유전적으로 변형한 뒤 다시 주입하는 맞춤형 면역 항암 치료제이다.
T세포 고갈
t-cell-exhaustion
지속적인 항원 노출로 인해 T세포가 증식 및 살상 능력을 잃는 상태로, 기존 CAR-T 치료의 주요 실패 원인 중 하나이다.
Three.js
three-js
웹 브라우저에서 GPU 가속 3D 그래픽을 렌더링하기 위한 자바스크립트 라이브러리이다. 별도의 플러그인 없이 복잡한 3D 장면을 구현할 수 있게 해주며, LLM이 코드를 생성하기에 적합한 구조를 가지고 있다.
TOML
toml
Tom's Obvious, Minimal Language의 약자로, 사람이 읽기 쉽고 데이터 구조에 명확하게 매핑되도록 설계된 구성 파일용 언어이다.
아이언우드 TPU
tpu-ironwood
구글이 설계한 AI 학습 및 추론 전용 가속기이다. 특히 추론 효율성에 최적화되어 대규모 AI 모델을 저비용 고효율로 운영할 수 있게 한다.
Tucker 분해
tucker-decomposition
고차원 텐서를 코어 텐서와 각 모드별 행렬의 곱으로 분해하는 방식으로, 데이터의 다차원적 상관관계를 분석하고 압축하는 데 사용되는 주성분 분석의 확장판이다.
스웨거 UI
swagger-ui
개발자가 작성한 API의 구조를 시각화하고 브라우저에서 직접 매개변수를 입력해 테스트할 수 있게 해주는 도구이다. FastAPI에 기본 내장되어 있어 별도의 설정 없이도 API 명세서를 확인할 수 있다.
U-Net
u-net
인코더와 디코더가 대칭 구조를 이루는 합성곱 신경망 아키텍처로, 주로 이미지 세그멘테이션 작업에서 픽셀 단위의 정밀한 분류를 수행하는 데 사용된다.
디노 v2
dinov2
메타에서 개발한 자기지도학습 기반의 비전 트랜스포머 모델로 별도의 라벨 없이 이미지의 특징을 정교하게 추출하는 데 특화되어 있다.
VAE 인코딩
vae-encoding
픽셀 공간의 이미지를 AI 모델이 이해할 수 있는 잠재 공간(Latent Space)으로 변환하는 과정이다. 고해상도 이미지일수록 이 과정에서 막대한 양의 VRAM을 일시적으로 소모하게 된다.
VAE 데이터 타입
vae-dtype
가변 오토인코더(VAE) 연산 시 사용하는 데이터의 정밀도로, bfloat16 형식을 사용하면 메모리 점유를 줄이고 연산을 가속화할 수 있다.
vLLM
vllm
대규모 언어 모델의 추론 속도를 극대화하기 위해 설계된 고성능 오픈소스 라이브러리다. PagedAttention 기술을 통해 메모리 효율을 높여 처리량을 획기적으로 개선한다.
Wan2GP
wan2gp
오픈소스 AI 모델들을 통합하여 영상과 음성을 생성하는 도구이다. 여러 모델을 하나의 워크플로우로 묶어 제작 효율성을 극대화하며, 특히 저사양 환경 최적화에 중점을 둔다.
Xet 저장소
xet-storage
대규모 데이터셋과 모델 파일을 효율적으로 관리하기 위한 저장소 백엔드로, 데이터를 작은 청크 단위로 나누어 중복을 제거하는 기술을 사용한다. 이를 통해 대용량 파일의 전송 속도를 대폭 향상시키고 저장 효율을 높인다. swift-huggingface에 곧 도입될 예정인 고속 다운로드 기술이다.
Xid 오류
xid-error
NVIDIA 드라이버가 운영체제 로그에 기록하는 일반적인 오류 보고 메시지이다. 하드웨어 고장, 드라이버 버그, 또는 애플리케이션의 잘못된 GPU 접근 등 다양한 문제의 원인을 식별하는 핵심 지표로 사용된다.
스테이블 디퓨전 XL
sdxl
Stability AI의 고해상도 이미지 생성 모델로, 이전 버전에 비해 더 정교한 디테일과 텍스트 이해도를 제공한다. 다양한 파인튜닝 모델이 존재하여 특정 화풍 구현에 유리하다.
계층적 YAML
hierarchical-yaml
설정 파일을 여러 계층으로 나누어 공통 설정은 상위에 두고 세부 설정만 하위에서 정의하여 관리 효율성을 높이는 방식이다.
YOLO 모드
yolo-mode
AI 에이전트가 사용자의 승인 없이 모든 명령어를 즉시 실행하는 자율 모드를 의미한다. 생산성은 높지만 보안 및 시스템 안정성 측면에서 위험이 매우 크다.