Weaviate v1.35 출시: 객체 TTL, Java v6 클라이언트 및 멀티모달 임베딩 지원

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

Weaviate v1.35는 데이터 관리 효율성과 운영 유연성을 극대화하는 대규모 업데이트를 포함한다. 이번 릴리스의 핵심은 객체 자동 삭제 기능인 Object TTL의 도입과 Java v6 클라이언트의 정식 출시(GA)이다. 또한, zstd 압축을 통한 백업 성능 향상과 Weaviate Embeddings를 통한 멀티모달 문서 검색 지원으로 개발자 경험과 시스템 성능을 동시에 개선했다. 이를 통해 대규모 벡터 데이터베이스 운영 시 비용 절감과 보안성 강화를 기대할 수 있다.

배경

Weaviate 기본 아키텍처 이해, 벡터 임베딩 및 양자화 개념, OIDC 인증 및 백업 운영 지식

대상 독자

Weaviate를 사용하는 AI 엔지니어 및 벡터 데이터베이스 운영자

의미 / 영향

이번 업데이트는 벡터 데이터베이스의 운영 효율성과 개발자 편의성을 동시에 강화했다. 특히 Object TTL과 향상된 압축 기술은 대규모 프로덕션 환경에서의 유지보수 비용을 크게 낮출 것으로 예상된다.

섹션별 상세

Object TTL(Time-to-Live) 기술 프리뷰 도입으로 데이터 객체의 생성 시간, 수정 시간 또는 특정 날짜 속성을 기준으로 자동 삭제하는 기능이 추가됐다. 이를 통해 세션 관리, 캐시 무효화, 데이터 보존 정책 준수 등을 자동화하여 저장 비용을 절감하고 데이터베이스를 청결하게 유지할 수 있다.

python

import datetime
from weaviate.classes.config import Configure, Property, DataType

client.collections.create(
    name="SessionLogs",
    properties=[
        Property(name="data", data_type=DataType.TEXT),
    ],
    object_ttl_config=Configure.ObjectTTL.delete_by_creation_time(
        time_to_live=datetime.timedelta(hours=24),
        filter_expired_objects=True,
    ),
)

생성 시간을 기준으로 24시간 후 객체를 자동 삭제하도록 Object TTL을 설정하는 예시

Java v6 클라이언트가 정식 출시(GA)되어 기존 클라이언트를 완전히 재작성한 현대적이고 직관적인 Fluent API를 제공한다. gRPC를 전면 지원하여 데이터 작업 성능을 높였으며, 컴파일 타임 타입 체크와 개선된 쿼리 빌더를 통해 개발 생산성을 향상했다.

java

WeaviateClient client = WeaviateClient.connectToWeaviateCloud(weaviateUrl, weaviateApiKey);

client.collections.create(
    "Movie", col -> col
        .vectorConfig(VectorConfig.text2VecWeaviate())
        .properties(
            Property.text("title"),
            Property.text("description"),
            Property.text("genre")
        )
);

CollectionHandle<Map<String, Object>> movies = client.collections.use("Movie");
var response = movies.query.nearText("sci-fi", q -> q.limit(2));

Java v6 클라이언트를 사용하여 컬렉션을 생성하고 벡터 검색을 수행하는 예시

Flat Index RQ 양자화가 정식 출시되어 8비트 또는 1비트 양자화를 통해 메모리 사용량을 4배에서 최대 32배까지 줄이면서도 높은 검색 정확도를 유지한다. 특히 소규모 테넌트가 많은 멀티테넌시 환경에 최적화되어 있으며, 데이터 성장에 따라 HNSW로 자동 업그레이드되는 동적 인덱싱과 호환된다.

python

from weaviate.classes.config import Configure

client.collections.create(
    name="ProductCatalog",
    vector_config=Configure.Vectors.text2vec_openai(),
    vector_index_config=Configure.VectorIndex.flat(),
    quantizer=Configure.VectorIndex.Quantizer.rq(
        compression_level=8
    )
)

Flat Index에 8비트 RQ 양자화를 적용하여 메모리 효율을 높이는 설정 예시

zstd 백업 압축 지원을 통해 기존 gzip 대비 압축률과 속도가 뛰어난 알고리즘을 도입했다. 백업 파일 크기를 줄이고 압축 및 복구 시간을 단축할 수 있으며, 사용자의 필요에 따라 압축 수준을 세밀하게 조정할 수 있는 옵션을 제공한다.

Weaviate Embeddings의 멀티모달 지원으로 문서 이미지를 벡터로 변환하여 텍스트 쿼리로 검색할 수 있는 기능이 Weaviate Cloud에 추가됐다. ModernVBERT 모델을 활용해 문서 페이지 이미지를 직접 임베딩하고 검색할 수 있어 RAG 시스템 구축이 더욱 간편해졌다.

런타임 설정 가능한 OIDC 및 운영 모드 기능으로 인스턴스 재시작 없이 OIDC 인증 인증서나 설정을 업데이트할 수 있다. 또한 ReadOnly, WriteOnly 등 노드별 운영 모드를 설정하여 부하 분산 및 유지보수 효율을 개선했다.

용어 해설

TTL: — 데이터가 시스템에 머무르는 유효 기간을 설정하는 메커니즘이다. 지정된 시간이 지나면 데이터가 자동으로 삭제되어 저장 공간을 확보하고 데이터의 신선도를 유지하는 데 기여한다.
Quantization: — 고차원 벡터 데이터를 더 적은 비트 수로 표현하여 메모리 사용량을 줄이는 기술이다. Weaviate의 RQ(Rescoral Quantization)는 검색 정확도를 유지하면서 메모리 효율을 극대화한다.
OIDC: — OAuth 2.0 프로토콜을 기반으로 하는 인증 레이어이다. 사용자 신원을 확인하고 보안 토큰을 통해 애플리케이션에 안전하게 접근할 수 있도록 보장한다.
Zstandard: — 페이스북에서 개발한 실시간 압축 알고리즘이다. 기존 gzip 대비 높은 압축률과 빠른 속도를 제공하여 대규모 데이터 백업 및 복구 성능을 획기적으로 개선한다.
Multimodal: — 텍스트, 이미지, 오디오 등 서로 다른 형태의 데이터를 동시에 처리하고 이해하는 AI 모델의 특성이다. 이를 통해 이미지 내용을 텍스트로 검색하는 등의 복합적인 작업이 가능하다.

기술

Weaviate
Java v6 Client
zstd
ModernVBERT
gRPC
OIDC

활용 사례

세션 데이터 자동 삭제
멀티모달 문서 검색 시스템
대규모 멀티테넌트 벡터 검색
고성능 데이터 백업 및 복구

언급된 리소스

문서Java v6 Client Documentation

GitHubWeaviate 1.35 GitHub Release Notes

import datetime from weaviate.classes.config import Configure, Property, DataType client.collections.create( name="SessionLogs", properties=[ Property(name="data", data_type=DataType.TEXT), ], object_ttl_config=Configure.ObjectTTL.delete_by_creation_time( time_to_live=datetime.timedelta(hours=24), filter_expired_objects=True, ), )

WeaviateClient client = WeaviateClient.connectToWeaviateCloud(weaviateUrl, weaviateApiKey); client.collections.create( "Movie", col -> col .vectorConfig(VectorConfig.text2VecWeaviate()) .properties( Property.text("title"), Property.text("description"), Property.text("genre") ) ); CollectionHandle<Map<String, Object>> movies = client.collections.use("Movie"); var response = movies.query.nearText("sci-fi", q -> q.limit(2));

from weaviate.classes.config import Configure client.collections.create( name="ProductCatalog", vector_config=Configure.Vectors.text2vec_openai(), vector_index_config=Configure.VectorIndex.flat(), quantizer=Configure.VectorIndex.Quantizer.rq( compression_level=8 ) )

Weaviate v1.35 출시: 객체 TTL, Java v6 클라이언트 및 멀티모달 임베딩 지원

TL;DR

배경

대상 독자

의미 / 영향

섹션별 상세

용어 해설

기술

활용 사례

언급된 리소스

Weaviate v1.35 출시: 객체 TTL, Java v6 클라이언트 및 멀티모달 임베딩 지원

TL;DR

배경

대상 독자

의미 / 영향

섹션별 상세

용어 해설

기술

활용 사례

언급된 리소스

관련 토론

댓글

관련 기사

Qdrant 벡터 데이터베이스 시작하기: 로컬 및 클라우드 배포 가이드

TurboQuant: AI 에이전트 메모리 및 RAG를 위한 훈련 불필요 압축 기법

관련 토론

댓글

관련 기사

Qdrant 벡터 데이터베이스 시작하기: 로컬 및 클라우드 배포 가이드

TurboQuant: AI 에이전트 메모리 및 RAG를 위한 훈련 불필요 압축 기법