기술 인사이트 🧠

RAG 아키텍처에서 Vector DB 선택 기준과 성능 비교

D
Data Engineer
·2024-02-12

Vector DB, 무엇을 선택할 것인가?

수백만 건의 문서 임베딩을 빠르고 정확하게 검색하는 것은 RAG(Retrieval-Augmented Generation) 봇의 핵심 성능을 좌우합니다.

성능 벤치마크 요약

  • Pinecone: SaaS 기반으로 가장 빠른 도입이 가능하나 대규모 데이터에서 비용 부담 증가.
  • Milvus: 오픈소스 중 스케일아웃에 최적화되었으나 초기 설정 복잡도가 높음.
  • pgvector (Supabase): 기존 관계형 DB와 통합 관리가 가능해 아키텍처 단순화에 큰 이점을 제공.

RIVA는 유지보수의 용이성과 데이터의 결합 쿼리 확장을 고려하여 Supabase의 pgvector를 최종 선택했습니다.