몽고DB 아틀라스 벡터 서치, 컨텍스트 데이터 쿼리 위한 기능 확장 및 성능 개선으로 생성형 AI 애플리케이션 구축 가속화와 컨플루언트 클라우드와의 새로운 통합으로 다양한 소스의 실시간 데이터 스트림 액세스 통해 생성형 AI 애플리케이션 활용 지원

오늘날 많은 기업이 엔드 유저의 기대에 부응하기 위해 생성 AI를 활용한 새로운 유형의 애플리케이션을 개발하고 있다. 생성형 AI 애플리케이션 구동을 위한 대규모 언어 모델(LLM)에는 텍스트, 이미지, 오디오, 비디오 등 데이터를 수치로 표현한 벡터 형태의 최신 전용 데이터가 필요하다.

벡터 데이터 작업에 익숙지 않은 대부분의 기업들은 LLM용 데이터 저장 및 처리를 위한 단기 솔루션으로 단일 목적형 벡터 데이터베이스를 활용하고 있다. 그러나 이를 기존 기술 스택에 추가하기 위해서는 각 포인트별 솔루션을 개발 및 유지하는 데 상당한 시간과 노력을 투자해야 하며, 주요 클라우드에서 관리형 서비스로 실행 가능한 유연성이 부족해 장기적인 측면에서 고성능 및 회복탄력성 확보를 위한 인프라 옵션을 상당 부분 제한받게 된다.

이에 따라 스타트업부터 대기업까지 모든 기업이 애플리케이션을 신속하게 배포하고 운영 효율성을 개선하기 위해 각종 데이터와 벡터를 유연하고 통합된 멀티클라우드 개발자 데이터 플랫폼에 저장할 수 있는 기능을 필요로 한다.

여기에, 개발자 데이터 플랫폼 선도 기업 몽고DB(MongoDB)가 개발자의 더욱 빠르고 쉬운 생성 AI 애플리케이션 구축을 지원하기 위한 몽고DB 아틀라스 벡터 서치(MongoDB Atlas Vector Search)의 새로운 기능과 성능 개선 및 데이터 스트리밍 통합을 발표했다.

올해 6월 프리뷰 버전이 발표된 이래 몽고DB 아틀라스 벡터 서치는 개발자의 데이터 수집 및 분류를 간소화하고, 시맨틱(semantic) 정보 검색을 개선하며, 인공지능 기반 애플리케이션의 잘못된 답변(hallucination)을 줄일 수 있도록 지원해 왔다.

이번 성능 개선을 통해 아틀라스 벡터 서치는 인덱스 구축 시간을 최대 85% 단축해 애플리케이션 개발 속도를 높이고, 컨플루언트 클라우드(Confluent Cloud)가 제공하는 완전관리형 데이터 스트림과의 통합으로 AI 애플리케이션 구동 시 다양한 소스의 실시간 데이터를 쉽게 사용할 수 있도록 한다.

사히르 아잠(Sahir Azam) 몽고DB 최고제품책임자(CPO)는 “기존 기술 스택에 타 소프트웨어 제품을 추가하며 발생하는 복잡성과 운영 부담이 증가하면서 생성형 AI 기술을 애플리케이션에 통합하고 비즈니스를 혁신하려는 고객들의 움직임이 활발해지고 있다"며, "이는 곧 몽고DB 아틀라스 벡터 서치 프리뷰 버전에 대한 고객들의 뜨거운 호응으로 확인할 수 있었다"라고 말했다.

이어 "특히 고객들은 운영 데이터 저장소에 벡터 데이터베이스 기능 직접 통합됐다는 점을 획기적이라고 여긴다”며 “몽고DB는 고객 성원에 힘입어 아틀라스 벡터 서치의 신규 기능과 업데이트에 박차를 가하고 있다”고 덧붙였다.

아틀라스 벡터 서치 기능 업데이트

몽고DB 아틀라스 벡터 서치는 주요 클라우드 서비스에서 고가용성 및 회복탄력성 확보를 위한 생성형 AI 애플리케이션을 더욱 빠르고 쉽게 구축할 수 있는 기능을 제공한다. 통합 개발자 데이터 플랫폼의 일부로 제공되는 벡터 데이터베이스 기능을 통해 개발 팀이 다양한 유형의 데이터와 벡터 임베딩을 저장 및 처리하고, 생성형 AI 애플리케이션을 보다 빠르고 쉽게 구축할 수 있도록 지원한다.

실제 NWO.ai, 데이터웍스(Dataworkz), 드라이블리(Drivly), 비소 트러스트(VISO Trust), 엑스트랙(ExTrac), 원 AI(One AI), 이노바레(Inovaare Corporation) 및 기타 다수 기업이 아틀라스 벡터 서치 프리뷰 버전을 선제적으로 도입해 공공 안전 위험 완화와 의료 규정 컴플라이언스 개선, 방대한 다국어 콘텐츠의 인텔리전스 표면화, 고객 서비스 효율화 및 기업 위험 평가 개선을 위한 AI 기반 애플리케이션을 구축하고 있다.

생성형AI 애플리케이션 개발을 가속화하는 몽고DB 아틀라스 벡터 서치의 주요 업데이트된 기능은 먼저, ▷생성형 AI 애플리케이션 위한 정보 검색 정확도 향상으로 오늘날 애플리케이션의 엔드 유저는 시간과 노력을 절약할 수 있는 정확하고 참여도가 높은 최신 경험을 기대한다.

그러나 생성형 AI 애플리케이션 구동을 위한 LLM은 정보 제공에 필요한 컨텍스트 부족으로 부정확한 정보를 생성하는 등 오류를 일으킬 수 있다. 몽고DB 아틀라스(MongoDB Atlas)의 통합 쿼리 인터페이스 확장을 통해 개발자는 아틀라스 벡터 서치로 전용 데이터 집계 단계를 생성해, 독점 데이터에서 결과를 필터링하고 정보 검색 정확성을 크게 개선해 애플리케이션에서 LLM의 잘못된 답변을 줄일 수 있다.

또한 ▷생성형 AI 애플리케이션을 위한 데이터 인덱싱 가속화로 LLM에 사용할 데이터를 준비하는 첫 단계인 벡터 생성 후에는 정보 검색을 위해 데이터를 효율적으로 쿼리할 수 있는 인덱스 구축과 데이터 변경 및 신규 데이터 활용을 위한 인덱스 업데이트가 필요하다.

몽고DB 아틀라스 벡터 서치가 지원하는 유연한 통합 문서 데이터 모델은 운영 데이터, 메타데이터 및 벡터 데이터를 완전관리형 환경에서 색인화해 복잡성을 감소시킨다. 이번 기능 업데이트로 아틀라스 벡터 서치는 인덱스 구축 시간을 최대 85%까지 단축하며 AI 기반 애플리케이션 개발을 가속화한다.

마지막으로 ▷AI 애플리케이션을 위한 다양한 소스의 실시간 데이터 스트리밍으로 커넥트 위드 컨플루언트(Connect with Confluent) 파트너 프로그램의 일환으로 아틀라스 벡터 서치에서 컨플루언트 클라우드 데이터 스트림을 사용할 수 있다.

해당 지원은 다양한 소스에서 생성형 AI 애플리케이션에 실시간 실측 데이터를 제공하기 위한 추가 옵션으로 이용할 수 있다. 이를 통해 개발자는 몽고DB 아틀라스용 완전관리형 커넥터를 구성해 애플리케이션이 변수에 효과적으로 대응하고, 엔드 유저에게 한층 정확한 결과를 제공할 수 있다.

한편, 몽고DB 아틀라스는 데이터 구축을 가속화 및 간소화하는 선도적인 멀티클라우드 개발자 데이터 플랫폼이다. 몽고DB 아틀라스는 단일 환경에서 통합된 데이터 및 애플리케이션 서비스 세트를 제공해 개발 팀이 최신 애플리케이션에 필요한 기능, 성능 및 확장성을 갖추고 신속하게 애플리케이션을 구축할 수 있도록 지원한다.

현재, 전 세계적으로 수만 명의 고객과 수백만 명의 개발자가 비즈니스 크리티컬 애플리케이션 구동을 위해 몽고DB 아틀라스를 사용하고 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지