데이터브릭스, ‘유니티 카탈로그’ 오픈소스로 제공…“데이터 및 AI를 위한 업계 최초의 범용 카탈로그”

by newsit posted Jun 19, 2024
Extra Form
참조#1 https://www.databricks.com/kr
참조#2 https://www.databricks.com/product/unity-catalog
?

단축키

Prev이전 문서

Next다음 문서

ESC닫기

크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄

데이터브릭스, ‘유니티 카탈로그’ 오픈소스로 제공…“데이터 및 AI를 위한 업계 최초의 범용 카탈로그”.png

 

데이터브릭스(Databricks)가 클라우드, 데이터 형식 및 데이터 플랫폼 전반의 데이터 및 AI 거버넌스를 위한 업계 유일의 통합 솔루션인 유니티 카탈로그(Unity Catalog)를 오픈소스로 제공한다고 발표했다.

 

이번 이니셔티브는 개방형 생태계를 통해 고객이 특정 벤더에 종속되지 않도록 유연성과 통제력을 제공하려는 데이터브릭스의 노력을 뒷받침한다. 데이터브릭스는 아마존웹서비스(AWS), 구글 클라우드(Google Cloud), 마이크로소프트(Microsoft), 엔비디아(NVIDIA), 세일즈포스(Salesforce) 등 글로벌 지원을 받아 데이터 및 AI를 위한 개방형 카탈로그 표준의 새로운 시대를 열어가고 있다.

 

데이터브릭스 유니티 카탈로그 OSS는 모든 데이터 형식과 컴퓨팅 엔진을 지원하는 범용 인터페이스를 제공한다. 여기에는 델타 레이크(Delta Lake), 아파치 아이스버그(Apache Iceberg) 및 아파치 후디(Apache Hudi) 클라이언트를 통해 델타 레이크 유니폼(UniForm)으로 테이블을 읽을 수 있는 기능이 포함된다. 아이스버그 REST 카탈로그 및 하이브 메타스토어(HMS) 인터페이스 표준도 지원된다. 또한 유니티 카탈로그 OSS는 테이블 데이터, 비 테이블 데이터, 그리고 머신러닝(ML) 모델 및 생성형 AI 도구와 같은 AI 자산에 대한 통합 거버넌스를 제공해 조직이 대규모로 관리를 간소화할 수 있도록 한다.

 

유니티 카탈로그: 선도적인 데이터 및 AI 카탈로그

조직은 데이터 및 AI 워크로드 처리를 위해 상호 운용 가능한 카탈로그를 필요로 한다. 데이터브릭스는 이러한 고객 수요를 충족하기 위해 2021년 유니티 카탈로그를 출시했다. 기존 조직은 단일 목적을 가진 여러 개의 솔루션에 의존했다. 이에 따라 플랫폼 간, 그리고 데이터 및 AI 자산 간 사일로가 발생했으며, 다중 테이블 형식의 테이블 데이터, 비정형 데이터, ML 모델, 벡터 인덱스 및 AI 도구를 결합하는 현대적인 데이터 및 AI 애플리케이션을 구축하는 데 한계가 있었다.

 

고객은 메타데이터 사일로를 관리하기 위해 복잡한 웹을 만들고, 다양한 엔진에 접근하기 위해 데이터를 여러 장소나 형식으로 복사하거나, 카탈로그 간의 메타데이터를 동기화하기 위해 자체 솔루션을 유지해야 했다. 결과적으로 비용과 복잡성이 증가하고, 거버넌스가 약화됐으며, 접근 제어가 파편화됐다. 유니티 카탈로그는 오늘날 10,000개 이상의 조직을 위해 이러한 사일로를 허물고 있다.

 

데이터브릭스 알리 고드시(Ali Ghodsi) CEO전 세계 데이터브릭스 고객이 유니티 카탈로그를 애용하고 있다. 유니티 카탈로그를 사용하면 여러 개의 단일 목적 솔루션을 조합할 필요 없이, 데이터브릭스 데이터 인텔리전스 플랫폼 내에서 테이블형 데이터, 비정형 데이터, AI ML 자산 등 모든 데이터 개체를 신뢰할 수 있는 단일 솔루션으로 관리할 수 있다고 설명하고, “데이터브릭스의 플랫폼은 모든 데이터가 기본적으로 개방형 형식으로 제공되는 업계 유일의 데이터 플랫폼이다. 메타데이터와 거버넌스를 오픈소스로 공개함에 따라, 오늘날의 데이터 및 AI 환경에서 기업이 필요로 하는 거버넌스 솔루션을 제공할 수 있게 됐다. 유니티 카탈로그를 오픈소스로 제공하고 코드를 공개하게 되어 기쁘게 생각하며, 파트너와의 긴밀한 협업을 통해 개방형 표준을 지속적으로 발전시켜 나갈 예정이라고 밝혔다.

 

AT&T 데이터 플랫폼 부사장 매트 두건(Matt Dugan)“AT&T는 자사 데이터를 자사 플랫폼과 상호 운용할 수 있도록 하기 위해 노력해 왔다. 유니티 카탈로그의 오픈소싱 발표와 함께, 개방형 표준을 통해 레이크하우스 거버넌스와 메타데이터 관리를 지원하기 위한 데이터브릭스의 행보는 고무적이다. 데이터 및 AI 자산과 상호 운용 가능한 도구를 활용할 수 있는 유연성은 일관된 거버넌스와 더불어 AT&T 데이터 플랫폼 전략의 핵심이라고 설명했다.

 

나스닥(Nasdaq) 자본 액세스 플랫폼 담당 레니 로젠펠드(Lenny Rosenfeld) 부사장은 "나스닥의 종합적인 데이터 관리 전략의 일환으로 데이터브릭스의 유니티 카탈로그를 활용하게 되어 기쁘다고 밝히고, "데이터브릭스가 유니티 카탈로그를 오픈소스로 제공하기로 한 결정은 데이터 사일로 제거를 위한 솔루션을 제시한다. 앞으로 고객에게 지속적으로 서비스를 제공하며 플랫폼을 더욱 확장하고 거버넌스를 강화해 데이터 애플리케이션을 현대화할 수 있기를 기대한다"고 덧붙였다.

 

#데이터브릭스#유니티#카탈로그#오픈소스#