엔비디아 AI 파운드리, 메타 라마 3.1 활용해 전 세계 기업 맞춤형 AI 강화.jpg

엔비디아는 메타(Meta)의 오픈소스 AI 모델 컬렉션인 라마 3.1(Llama 3.1)을 통해 전 세계 기업의 생성형 AI를 강화하는 엔비디아 AI 파운드리(NVIDIA AI Foundry) 서비스와 엔비디아 NIM 추론 마이크로서비스를 발표했다.

 

이제 기업과 국가는 엔비디아 AI 파운드리를 통해 라마 3.1과 엔비디아 소프트웨어와 컴퓨팅, 전문성을 활용해 도메인별 산업 사용 사례에 맞는 맞춤형 ‘슈퍼모델’을 만들 수 있다. 기업은 자체 데이터는 물론, 라마 3.1 405B엔비디아 네모트론(Nemotron) 리워드 모델에서 생성된 합성 데이터로 이러한 슈퍼모델을 훈련할 수 있다.

 

엔비디아 AI 파운드리는 세계 최고의 퍼블릭 클라우드와 공동 설계된 엔비디아 DGX 클라우드(DGX Cloud) AI 플랫폼으로 구동된다. 이를 통해 AI 수요 변화에 따라 쉽게 확장할 수 있는 방대한 컴퓨팅 리소스를 기업에게 제공한다.

 

새로운 서비스는 기업뿐만 아니라 독자적인 AI 전략을 개발 중인 국가들의 맞춤형 거대 언어 모델(LLM) 구축을 지원하며, 이들은 고유한 비즈니스나 문화를 반영하는 생성형 AI 애플리케이션을 위해 도메인별 지식을 갖춘 맞춤형 LLM을 구축하고자 한다.

 

엔비디아 젠슨 황 CEO는 “메타의 오픈소스 모델인 라마 3.1은 전 세계 기업에서 생성형 AI 채택하는 데 있어 중요한 순간이다. 라마 3.1은 모든 기업과 업계가 최첨단 생성형 AI 애플리케이션을 구축할 수 있는 문을 열었다. 엔비디아 AI 파운드리는 라마 3.1을 전체적으로 통합했으며, 기업이 맞춤형 라마 슈퍼모델을 구축하고 배포할 수 있도록 지원할 준비가 돼있다”고 밝혔다. 

 

메타의 창립자 겸 CEO인 마크 저커버그(Mark Zuckerberg)는 “새로운 라마 3.1 모델은 오픈 소스 AI에 있어 매우 중요한 단계이다. 기업들은 엔비디아 AI 파운드리를 통해 사람들이 원하는 최첨단 AI 서비스를 쉽게 만들고 맞춤화하며, 엔비디아 NIM을 통해 배포할 수 있다. 이러한 서비스를 사람들에게 제공할 수 있게 돼 기쁘다”고 덧붙였다. 

 

현재 프로덕션 AI용 라마 3.1 모델의 엔터프라이즈 배포를 강화하기 위해, ai.nvidia.com에서 라마 3.1 모델용 엔비디아 NIM 추론 마이크로서비스를 다운로드할 수 있다. NIM 마이크로서비스는 프로덕션 환경에서 라마 3.1 모델을 배포하는 가장 빠른 방법이며, NIM 없이 추론을 실행하는 것보다 최대 2.5배 더 높은 처리량을 제공한다.

 

기업은 라마 3.1 NIM 마이크로서비스를 새로운 엔비디아 네모 리트리버(NeMo Retriever) NIM 마이크로서비스와 결합해 AI 코파일럿, 어시스턴트, 디지털 휴먼 아바타를 위한 최첨단 검색 파이프라인을 구축할 수 있다.

 

액센츄어, AI 파운드리로 기업용 맞춤형 라마 슈퍼모델 개척

글로벌 전문 서비스 기업인 액센츄어(Accenture)는 자체 사용은 물론, 문화, 언어, 산업을 반영하는 생성형 AI 애플리케이션을 배포하고자 하는 고객을 위해 엔비디아 AI 파운드리를 최초로 채택했다. 또한, 액센츄어 AI 리파이너리(Refinery) 프레임워크를 사용해 맞춤형 라마 3.1 모델을 구축했다.

 

액센츄어의 회장 겸 CEO인 줄리 스위트(Julie Sweet)는 “세계 유수의 기업들은 생성형 AI가 각 산업을 어떻게 변화시키고 있는지를 확인하고 있으며, 맞춤형 모델 기반의 애플리케이션을 배포하고자 한다. 액센츄어는 내부 AI 애플리케이션을 위해 엔비디아 NIM 추론 마이크로서비스와 협력해 왔다. 그리고 이제 엔비디아 AI 파운드리를 통해 고객이 맞춤형 라마 3.1 모델을 신속하게 생성, 배포해 각자의 비즈니스 우선순위에 맞는 혁신적인 AI 애플리케이션을 구동하도록 지원할 수 있게 됐다"고 설명했다. 

 

엔비디아 AI 파운드리는 맞춤형 슈퍼모델을 빠르게 구축할 수 있는 엔드투엔드 서비스를 제공한다. 이는 엔비디아 소프트웨어, 인프라, 전문성 등을 개방형 커뮤니티 모델, 기술, 엔비디아 AI 에코시스템의 지원에 결합한다.

 

기업들은 엔비디아 AI 파운드리를 통해 라마 3.1 모델과 엔비디아 네모(NeMo) 플랫폼을 사용해 맞춤형 모델을 만들 수 있다. 여기에는 허깅 페이스 리워드 벤치(Hugging Face RewardBench)에서 1위를 차지한 엔비디아 네모트론-4 340B 리워드 모델이 포함된다.

 

맞춤형 모델이 생성되면, 기업은 선호하는 클라우드 플랫폼과 글로벌 서버 제조업체의 엔비디아 인증 시스템(Certified Systems)에서 원하는 MLOps AIOps 플랫폼을 사용할 수 있다. 이를 통해 프로덕션 환경에서 실행할 수 있는 엔비디아 NIM 추론 마이크로서비스를 생성한다.

 

엔비디아 AI 엔터프라이즈(AI Enterprise) 전문가와 글로벌 시스템 통합 파트너는 AI 파운드리 고객과 협력해 개발부터 배포에 이르는 전체 프로세스를 가속화한다.

 

고급 모델 맞춤화를 지원하는 엔비디아 네모트론

도메인별 모델을 만들기 위해 추가 훈련 데이터가 필요한 기업은 맞춤형 라마 슈퍼모델을 만들 때 라마 3.1 405B와 네모트론-4 340B를 함께 사용해 합성 데이터를 생성하면 모델 정확도를 높일 수 있다.

 

자체 훈련 데이터를 보유한 고객은 도메인 적응형 사전 훈련(DAPT)을 위해 엔비디아 네모로 라마 3.1 모델을 맞춤화해 모델 정확도를 더욱 높일 수 있다아울러 엔비디아와 메타는 개발자가 생성형 AI 애플리케이션을 위한 소규모 맞춤형 라마 3.1 모델을 구축하는 데 사용할 수 있는 라마 3.1의 증류 레시피를 제공하기 위해 협력하고 있다. 이를 통해 기업은 AI 워크스테이션과 노트북 같은 광범위한 가속 인프라에서 라마 기반 AI 애플리케이션을 실행할 수 있다.

 

엔비디아와 라마를 통해 AI를 강화하는 업계 선도 기업들

의료, 에너지, 금융 서비스, 소매, 운송, 통신 분야의 기업들은 이미 라마를 위한 엔비디아 NIM 마이크로서비스를 사용하고 있다. 새로운 라마 3.1 NIM 마이크로서비스를 가장 먼저 도입한 기업 중에는 아람코(Aramco), AT&T, 우버(Uber)가 있다.

 

라마 3.1 다국어 LLM 컬렉션은 8B, 70B, 405B 파라미터 크기의 생성 AI 모델 모음이다. 이는 16,000개 이상의 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPU)에서 훈련되고, 데이터센터와 클라우드, 엔비디아 RTX GPU가 탑재된 워크스테이션이나 지포스 RTX GPU가 탑재된 PC에서 엔비디아 가속 컴퓨팅과 소프트웨어에 최적화됐다.

 

정확도와 성능을 향상시키는 새로운 네모 리트리버 RAG 마이크로서비스

기업은 검색 증강 생성(RAG)을 위한 새로운 엔비디아 네모 리트리버 NIM 추론 마이크로서비스를 사용한다. 이를 통해 맞춤형 라마 슈퍼모델과 라마 NIM 마이크로서비스를 프로덕션에 배포할 때 응답 정확도를 향상시킬 수 있다.

 

라마 3.1 405B용 엔비디아 NIM 추론 마이크로서비스와 결합된 네모 리트리버 NIM 마이크로서비스는 RAG 파이프라인을 위한 최고의 오픈, 상용 텍스트 Q&A 검색 정확도를 제공한다.

 

라마 3.1과 네모 리트리버 NIM 배포를 위한 엔터프라이즈 에코시스템 준비 완료

기업, 데이터, 인프라 플랫폼을 제공하는 수백 개의 엔비디아 NIM 파트너는 이제 자사의 AI 솔루션에 새로운 마이크로서비스를 통합한다. 이로써 5백만 명 이상의 개발자와 19,000개 이상의 스타트업으로 구성된 엔비디아 커뮤니티를 위해 생성형 AI를 강화할 수 있다.

 

라마 3.1 NIM과 네모 리트리버 NIM 마이크로서비스에 대한 프로덕션 지원은 엔비디아 AI 엔터프라이즈를 통해 제공된다. 엔비디아 개발자 프로그램(Developer Program) 회원은 자신이 선호하는 인프라에서 연구, 개발, 테스트를 위해 NIM 마이크로서비스에 무료로 액세스할 수 있다.

 

 

#엔비디아#파운드리#AI#라마#메타#RAG

?

  1. 엘앤에프, 자체 개발 생성형 AI '루시드' 도입…"디지털 혁신 가속화"

    - 사내 지식 기반 AI 챗봇 ‘루시드’ 도입… 스마트한 업무 환경 구축 - 4단계 AI 혁신 전략 추진… 데이터 기반 의사결정·업무 품질 향상 - 자동화 통합 AX 플랫폼 구축 목표, 사무에서 스마트팩토리까지 AI 기술 확대 적용 계획 엘앤에프가 자체 개발한 생성형 ...
    Date2025.06.25 Bynewsit Views484
    Read More
  2. 아비바, ‘2024 지속가능성 보고서’ 주요 지표 공개

    - 5년째 발간하고 있는 연례 지속가능성 보고서 통해 산업 인텔리전스가 전 세계 기후 문제 해결에 중추적인 역할을 하는 방법론 소개 - 아비바 전 제품에 대한 친환경 제품 설계 성숙도 평가 완료하며 솔루션의 85%에 대한 탄소 배출 측정 - 직접 배출 및 간...
    Date2025.06.25 Bynewsit Views427
    Read More
  3. 유니버설 로봇, ‘유니버설 로봇 스튜디오(UR Studio)’ 출시…“최적의 로봇 셀 맞춤형 설계 가능”

    글로벌 1위 협동로봇 전문 기업 ‘유니버설 로봇(Universal Robots)’이 온라인 협동로봇 시뮬레이션 도구 ‘유니버설 로봇 스튜디오(UR Studio)’를 공개했다. 유니버설 로봇 스튜디오는 현존하는 가장 진보된 개방형 AI 기반 소프트웨어 플랫폼인 폴리스코프 X(P...
    Date2025.06.25 Bynewsit Views669
    Read More
  4. 딥엘, 번역기 및 API 지원 언어 확대…“글로벌 비즈니스 커뮤니케이션·문서 번역 역량 강화”

    - 번역기·API에 베트남어·히브리어·태국어 추가…문서 번역 기능엔 중국어 번체·아랍어 지원 딥엘(DeepL)이 자사 플랫폼에 베트남어, 히브리어, 태국어(현재는 DeepL API에서만 이용 가능한 초기 제공 버전) 등 3개 언어를 새롭게 추가했다. 이번 업데이트로 딥...
    Date2025.06.25 Bynewsit Views710
    Read More
  5. 엠클라우드브리지, 폐쇄형 기업 업무 플랫폼 ‘Ai 365 Mesh’ 특허 등록…“한국형 조직도 권한 기반 Data & AI 통합”

    - 오픈AI, 코파일럿, MS패브릭 통합 폐쇄형 환경에서 한국형 조직도에 따라 지식 정보 및 분석 확인 - AD 조직도 기반 기업 중요 정보 접근 권한 관리 및 정보 유출 차단으로 AI 도입 시 보안 우려 해소 엠클라우드브리지가 한국형 조직도 권한 기반 Data & AI...
    Date2025.06.24 Bynewsit Views613
    Read More
  6. 알리바바 클라우드-유니플러스, 국내 스타트업 지원 파트너십 발표

    - 인천의 테크 스타트업 유니플러스와 협력해 지역 스타트업 대상 첨단 클라우드 및 블록체인 서비스 제공 - 알리바바 클라우드의 글로벌 인프라를 활용해 유니플러스 블록체인 솔루션의 해외 시장 확장 공동 지원 알리바바 클라우드가 인천에 본사를 둔 첨단 ...
    Date2025.06.24 Bynewsit Views464
    Read More
  7. 사이냅소프트, ‘문서 AI 기술세미나’ 개최…“문서 기반 RAG 기술 통찰 공유”

    - 고객사 보유 문서를 활용한 RAG 기반 AI 어시스턴트 구현 전략 소개 - AI 콘텐츠 크리에이터 테디노트, 협업툴 1등 잔디와 함께한 실전 세미나 사이냅소프트는 지난 6월 20일, 서울 마곡 R&D센터에서 ‘같은 LLM, 다른 결과: 데이터 품질이 만드는 압도적 차...
    Date2025.06.24 Bynewsit Views426
    Read More
  8. 한국퀀텀컴퓨팅-부산교통공사, 양자컴퓨팅을 활용한 ‘부산 도시철도 배차 최적화 연구’ 착수

    - 양자컴퓨터 활용해 대중교통 운영의 효율성을 연구하는 국내 최초 사례 - 혼잡 시간대 수요 분산, 에너지 절감, 인력 운영의 효율화 등 복잡한 변수간 상호작용을 고도화된 양자 알고리즘으로 분석 - 양자컴퓨팅 기반으로 도시철도 배차 최적화부터 재난 대...
    Date2025.06.24 Bynewsit Views454
    Read More
  9. 티맥스소프트, 신한DS와 동남아 사업 확대 파트너십 체결

    - 신한금융그룹 베트남 호치민 사옥에서 동남아 사업 확대 파트너십 체결 - 양사 대표 및 관계자 배석해 포괄적 협력 모델 구체적 논의 - 신한DS 주최 고객 초청 행사에서 티맥스소프트 경쟁력, 성공사례 세션 발표 티맥스소프트가 최근 베트남 호치민에서 신...
    Date2025.06.23 Bynewsit Views486
    Read More
  10. 슈나이더 일렉트릭 코리아, ‘PLM/DX 컨퍼런스 2025’서 소프트웨어 정의 자동화 전략 소개

    - 자동화의 모듈화 및 유연성을 높이는 핵심 기술로 IEC 61499 국제 표준 소개 - 슈나이더 일렉트릭의 EAE 플랫폼으로 실현하는 유연하고 지속 가능한 자동화 인사이트 공유 슈나이더 일렉트릭 코리아는 6월 20일(금) 서울 코엑스에서 개최되는 ‘PLM/DX 베스트...
    Date2025.06.20 Bynewsit Views388
    Read More
목록
Board Pagination Prev 1 ... 48 49 50 51 52 53 54 55 56 57 ... 228 Next
/ 228
CLOSE