25961.jpg

 

데이터브릭스(Databricks)가 데이터 관리 기업인 타뷸러(Tabular) 인수에 합의했다고 발표했다. 타뷸러는 아파치 아이스버그(Apache Iceberg)의 창시자인 라이언 블루(Ryan Blue), 다니엘 윅스(Daniel Weeks), 그리고 제이슨 리드(Jason Reid)가 설립했다.

 

이번 인수로 데이터브릭스는 두 가지 대표적인 오픈소스 레이크하우스 형식인 아파치 아이스버그와 리눅스 파운데이션 델타 레이크(Linux Foundation Delta Lake) 창시자 간의 시너지를 발휘하고, 데이터 호환성을 선도해 조직이 더 이상 데이터의 형식에 제약을 받지 않도록 지원한다는 방침이다.

 

데이터브릭스는 레이크하우스에 형식 호환성을 제공하기 위해 델타 레이크 및 아이스버그 커뮤니티와 긴밀히 협력할 계획이다. 이러한 협력은 단기적으로는 델타 레이크 유니폼 내에서 이루어지며, 장기적으로는 개방적이고 공통적인 단일 상호운용성 표준으로 발전하게 된다.

 

레이크하우스 아키텍처의 부상과 형식 비호환성

데이터브릭스는 2020년 레이크하우스 아키텍처를 개척하고, 기존의 데이터 웨어하우징 워크로드와 AI 워크로드를 관리가 가능한 단일 데이터 사본에 통합할 수 있게 했다. 이를 위해서는 다양한 워크로드, 애플리케이션, 엔진이 동일한 데이터에 액세스할 수 있도록 모든 데이터가 개방형 형식이어야 한다. 레이크하우스 아키텍처는 데이터에 대한 접근을 보편화함으로써 기업의 생산성을 극대화하는데, 이는 독점 데이터 웨어하우스와는 대조적이다. 독점 데이터 웨어하우스에서는 독점 SQL 엔진만이 데이터를 읽거나 쓰거나 공유할 수 있으며, 다른 애플리케이션에서 데이터를 사용하기 위해서는 데이터를 복사하고 내보내야 해 특정 공급업체에 종속될 가능성이 높기 때문이다. 4년이 지난 현재, 전 세계 기업의 약 74%가 레이크하우스 아키텍처를 구축했다.

 

레이크하우스의 기반은 오브젝트 스토리지에 저장된 데이터의 ACID 트랜잭션을 지원하는 오픈소스 데이터 형식이다. 이러한 형식은 아파치 스파크(Apache Spark), 트리노(Trino) 및 프레스토(Presto)와 같은 오픈소스 엔진을 위해 특별히 설계됐으며, 데이터 레이크에서 데이터 작업의 안정성 및 성능을 획기적으로 개선한다.

 

데이터브릭스는 이를 지원하기 위해 리눅스 재단(Linux Foundation)과 협력해 델타 레이크 프로젝트를 출범했다. 지금까지 다양한 조직의 500명 이상의 코드 기여자가 이 프로젝트에 참여했으며, 전 세계 10,000개 이상의 기업이 델타 레이크를 사용해 매일 평균 4엑사바이트 이상의 데이터를 처리하고 있다.

 

델타 레이크가 만들어질 무렵, 라이언 블루와 다니엘 윅스는 넷플릭스(Netflix)에서 아이스버그 프로젝트를 개발해 아파치 소프트웨어 재단에 기부했다. 이후 델타 레이크와 아이스버그는 레이크하우스 형식의 두 가지 주요 오픈소스 표준으로 부상했다.

 

이 두 포맷은 모두 아파치 파케(Apache Parquet)를 기반으로 하며 비슷한 목표와 설계를 갖추고 있지만, 독립적으로 개발되어 호환되지는 않게 되었다. 시간이 지나면서 다른 여러 오픈소스 및 독점 엔진이 이들 형식을 채택했으나 두 표준 중 하나만, 그것도 일부만 채택하는 경우가 많았다. 이로써 기업 데이터가 파편화되고 사일로화되어 레이크하우스 아키텍처의 가치가 훼손되는 문제가 발생했다.

 

상호 운용성을 향한 여정

기업들은 레이크하우스의 이점을 실현하기 위해 데이터 상호운용성이 필요로 하며, 데이터브릭스는 델타 레이크 및 아이스버그 커뮤니티와 긴밀히 협력하여 시간이 지남에 따라 형식에 상호운용성을 제공할 계획이다. 이는 결코 짧지 않은 여정으로, 해당 커뮤니티에서 달성하는 데 몇 년이 걸릴 수도 있다. 이것이 바로 작년에 데이터브릭스가 델타 레이크 유니폼(UniForm)을 발표한 이유이다. 유니폼 테이블은 델타 레이크, 아이스버그, 후디(Hudi) 간에 상호 운용성을 제공하며, 기업이 모든 데이터에서 이미 익숙한 분석 엔진과 도구를 사용할 수 있도록 아이스버그의 안정적인 카탈로그 인터페이스를 지원한다. 기업은 현재 즉시 사용 가능한 유니폼을 통해 호환성을 확보할 수 있다. 아이스버그 팀의 합류로 데이터브릭스는 델타 레이크 유니폼을 한층 더 확장할 수 있게 되었다.

 

데이터브릭스 알리 고드시(Ali Ghodsi) CEO"데이터브릭스는 레이크하우스 부문의 선구자로, 지난 4년 동안 전 세계는 데이터 웨어하우스와 데이터 레이크의 장점을 결합한 레이크하우스 아키텍처를 도입하여 고객이 TCO를 절감하고, 개방성을 수용하며, AI 프로젝트를 더 빠르게 수행할 수 있도록 지원해 왔다고 설명하고, “안타깝게도 오늘날 레이크하우스 패러다임은 가장 널리 사용되는 두 가지 형식인 델타 레이크와 아이스버그로 나뉘어져 있다. 데이터브릭스와 타뷸러는 오픈소스 커뮤니티와 협력하여 시간이 지남에 따라 두 형식을 더 가깝게 만들어 개방성을 높이며 고객의 사일로와 마찰을 줄여나갈 계획이라고 밝혔다.

 

또한, “작년에 우리는 이 두 형식 간의 상호 운용성을 제공하기 위해 델타 레이크 유니폼을 발표했다. 유니폼을 통해 모든 워크로드에 대한 데이터를 통합하는 최고의 방법을 제공하기 위해 오픈 데이터 레이크하우스 형식의 선두 주자들을 한자리에 모으게 되어 매우 기쁘다고 덧붙였다.

 

개방성을 향한 공동의 약속

그동안 데이터브릭스와 타뷸러는 오픈소스 형식을 옹호한다는 공통점을 공유해왔다. 두 기업 모두 창립자가 개발한 오픈소스 기술을 상용화하기 위해 설립되었으며, 현재 데이터브릭스는 매출 기준으로 가장 규모가 크고 성공적인 독립 오픈소스 회사로서 오픈소스 프로젝트에 1,200만 줄의 코드를 기부하기도 했다. 이번 인수는 클라우드에서 개방형 포맷과 오픈소스 데이터에 대한 데이터브릭스의 지속적인 노력을 보여주며, 기업이 데이터를 제어하고 독점 공급업체 소유의 형식으로 인한 종속성에서 벗어날 수 있도록 지원한다.

 

라이언 블루 타뷸러 CEO"우리는 정확성, 성능 및 확장성과 관련된 중요한 데이터 문제를 해결하기 위해 아파치 아이스버그를 개발했다고 밝히고, “개방형 레이크하우스가 업계 표준으로 자리 잡으면서 아이스버그와 델타 레이크의 인기는 크게 상승했다. 타뷸러는 데이터브릭스에 합류해 개방형 레이크하우스 형식을 기반으로 최고의 데이터 관리 플랫폼을 구축할 계획으로, 이를 통해 '올바른' 형식을 선택하기 위한, 그리고 독점 데이터 포맷에 종속되지 않기 위한 기업의 우려를 해결하는 데 힘쓰고자 한다고 강조했다.

 

#데이터브릭스#타뷸러#AI#

 

 
?

  1. [GTC 2024]엔비디아, 뉴욕 멜론은행에 'DGX 슈퍼팟' 기반 AI 슈퍼컴퓨터 구축

    - 은행 최초로 DGX H100 탑재한 엔비디아 DGX 슈퍼팟 채택 - 기회에 대응하기 위해 슈퍼POD 시스템을 빠르게 배포한 금융 대기업의 선택 엔비디아가 뉴욕멜론은행(BNY Mellon)이 글로벌 은행 최초로 엔비디아(NVIDIA) DGX H100 시스템을 갖춘 엔비디아 DGX 슈...
    Date2024.03.21 Bynewsit Views442
    Read More
  2. 로터스, 선호 클라우드 제공업체로 AWS 선정…“커넥티드카·자율주행차 기술 혁신 가속화”

    - 지능형 럭셔리 모빌리티 선도기업 로터스, AWS 활용해 ▲지능형 주행 플랫폼 강화 ▲새로운 커넥티드 차량 서비스 혁신 ▲글로벌 사업 확장 도모 아마존웹서비스(AWS)는 로터스(Lotus) 테크놀로지터스가 지능형 럭셔리 자동차 경험 개발을 지원할 선호 클라우드...
    Date2024.12.12 Bynewsit Views441
    Read More
  3. 바스트데이터, 1,550억원 규모 시리즈E 투자 유치…“기업 가치는 91억 달러로 상향 평가”

    - 딥러닝과 AI 분야에서 확고한 선두 확보 AI 데이터 플랫폼 전문 기업 바스트데이터(VAST Data)가 1억 1,800만 달러(한화 1,550억원 상당) 규모의 시리즈E 투자를 유치했다고 7일 밝혔다. 이번 투자는 피델리티 매니지먼트 앤 리서치 컴퍼니 주도로 진행되었...
    Date2023.12.07 Bynewsit Views441
    Read More
  4. 데이터브릭스, 구글 클라우드와 전략적 AI 파트너십 체결…“구글 제미나이 데이터 인텔리전스 플랫폼에 통합”

    데이터브릭스(Databricks)는 오늘 구글 클라우드(Google Cloud)와 새로운 전략적 제품 파트너십을 발표하고, 최신 제미나이(Gemini) 모델이 데이터브릭스의 데이터 인텔리전스 플랫폼 내에서 네이티브 제품으로 제공된다고 밝혔다. 해당 파트너십을 통해 기업...
    Date2025.06.18 Bynewsit Views440
    Read More
  5. 윈드리버, 이탈리아 레오나르도 항공우주에 ‘VxWorks’ 공급…“국방 안전 시스템의 소프트웨어 정의 혁신”

    윈드리버는 오늘 세계적인 방산 기업 이탈리아의 레오나르도(Leonardo)가 멀티코어 프로세서 아키텍처 기반의 최첨단 세이프티 관련 무선 주파수(RF) 시스템을 소프트웨어 정의 방식으로 고도화하기 위해 ‘VxWorks’ 실시간 운영 체제(RTOS)를 도입했다고 밝혔...
    Date2025.04.08 Bynewsit Views440
    Read More
  6. 데이터브릭스, 금융보안원 CSP 안전성 평가 완료

    - 데이터 및 AI 경쟁력으로 한국 금융 시장의 데이터브릭스 데이터 인텔리전스 플랫폼 도입 가속화 - S&P 글로벌, HSBC, 마스터카드 등 글로벌 금융기관 선택 데이터브릭스(Databricks)가 금융보안원의 클라우드 서비스 제공업체(CSP) 안전성 평가를 성공적으...
    Date2024.11.20 Bynewsit Views440
    Read More
  7. 레노버-크라우드웍스, AI 혁신 MOU 체결…“하드웨어 인프라와 AI솔루션 결합”

    레노버는 크라우드웍스와 오늘 양사 협업 및 양해각서(MOU)를 체결하고, 상호 장점을 극대화하여 AI 솔루션 개발과 혁신적인 기술 도입을 가속화한다고 밝혔다. 레노버의 강력한 하드웨어 인프라와 크라우드웍스의 AI 솔루션을 결합하여, 더 빠르고 신뢰할 수 ...
    Date2024.06.25 Bynewsit Views440
    Read More
  8. 효성인포메이션시스템, 엑세스랩과 ‘그린 데이터센터’ 총판 계약 체결 및 파트너십 강화

    - 효성인포메이션시스템, 저전력 ARM 서버 및 소프트웨어 개발 전문기업 엑세스랩과 총판 계약 - 저전력∙저발열∙ESG 니즈 큰 대규모 데이터센터 및 클라우드 중심으로 시장 확대 효성인포메이션시스템이 국내 유일 ARM 서버 개발 기업 엑세스랩과 총판 계약을 ...
    Date2024.06.20 Bynewsit Views440
    Read More
  9. 데이터브릭스, 신규 ‘모자이크 AI’ 기능 출시…“프로덕션 품질의 AI 시스템 및 애플리케이션 구축 지원”

    - 비즈니스 전반에서 생성형 AI의 적용, 품질 이터레이션 및 생산화 과정 가속화 지원 데이터브릭스(Databricks)가 프로덕션 품질의 생성형 AI 구축을 지원하기 위해 모자이크(Mosaic AI)에 새로운 기능을 출시한다고 발표했다. 데이터브릭스는 모자이크 AI에...
    Date2024.06.13 Bynewsit Views440
    Read More
  10. 레드햇, 2024 IDC 마켓스케이프 ‘자동화 기반 멀티·하이브리드 클라우드 관리’ 부문 리더 선정

    레드햇은 IDC가 2024년 5월 발행한 <IDC 마켓스케이프: 전 세계 멀티·하이브리드 클라우드 자동화 기반 관리 2024 벤더 평가(IDC MarketScape: Worldwide Multicloud and Hybrid Cloud Management with Automation 2024 Vendor Assessment)> 보고서에서 레드햇...
    Date2024.06.03 Bynewsit Views440
    Read More
목록
Board Pagination Prev 1 ... 141 142 143 144 145 146 147 148 149 150 ... 235 Next
/ 235
CLOSE