엔비디아 AI 파운드리, 메타 라마 3.1 활용해 전 세계 기업 맞춤형 AI 강화.jpg

엔비디아는 메타(Meta)의 오픈소스 AI 모델 컬렉션인 라마 3.1(Llama 3.1)을 통해 전 세계 기업의 생성형 AI를 강화하는 엔비디아 AI 파운드리(NVIDIA AI Foundry) 서비스와 엔비디아 NIM 추론 마이크로서비스를 발표했다.

 

이제 기업과 국가는 엔비디아 AI 파운드리를 통해 라마 3.1과 엔비디아 소프트웨어와 컴퓨팅, 전문성을 활용해 도메인별 산업 사용 사례에 맞는 맞춤형 ‘슈퍼모델’을 만들 수 있다. 기업은 자체 데이터는 물론, 라마 3.1 405B엔비디아 네모트론(Nemotron) 리워드 모델에서 생성된 합성 데이터로 이러한 슈퍼모델을 훈련할 수 있다.

 

엔비디아 AI 파운드리는 세계 최고의 퍼블릭 클라우드와 공동 설계된 엔비디아 DGX 클라우드(DGX Cloud) AI 플랫폼으로 구동된다. 이를 통해 AI 수요 변화에 따라 쉽게 확장할 수 있는 방대한 컴퓨팅 리소스를 기업에게 제공한다.

 

새로운 서비스는 기업뿐만 아니라 독자적인 AI 전략을 개발 중인 국가들의 맞춤형 거대 언어 모델(LLM) 구축을 지원하며, 이들은 고유한 비즈니스나 문화를 반영하는 생성형 AI 애플리케이션을 위해 도메인별 지식을 갖춘 맞춤형 LLM을 구축하고자 한다.

 

엔비디아 젠슨 황 CEO는 “메타의 오픈소스 모델인 라마 3.1은 전 세계 기업에서 생성형 AI 채택하는 데 있어 중요한 순간이다. 라마 3.1은 모든 기업과 업계가 최첨단 생성형 AI 애플리케이션을 구축할 수 있는 문을 열었다. 엔비디아 AI 파운드리는 라마 3.1을 전체적으로 통합했으며, 기업이 맞춤형 라마 슈퍼모델을 구축하고 배포할 수 있도록 지원할 준비가 돼있다”고 밝혔다. 

 

메타의 창립자 겸 CEO인 마크 저커버그(Mark Zuckerberg)는 “새로운 라마 3.1 모델은 오픈 소스 AI에 있어 매우 중요한 단계이다. 기업들은 엔비디아 AI 파운드리를 통해 사람들이 원하는 최첨단 AI 서비스를 쉽게 만들고 맞춤화하며, 엔비디아 NIM을 통해 배포할 수 있다. 이러한 서비스를 사람들에게 제공할 수 있게 돼 기쁘다”고 덧붙였다. 

 

현재 프로덕션 AI용 라마 3.1 모델의 엔터프라이즈 배포를 강화하기 위해, ai.nvidia.com에서 라마 3.1 모델용 엔비디아 NIM 추론 마이크로서비스를 다운로드할 수 있다. NIM 마이크로서비스는 프로덕션 환경에서 라마 3.1 모델을 배포하는 가장 빠른 방법이며, NIM 없이 추론을 실행하는 것보다 최대 2.5배 더 높은 처리량을 제공한다.

 

기업은 라마 3.1 NIM 마이크로서비스를 새로운 엔비디아 네모 리트리버(NeMo Retriever) NIM 마이크로서비스와 결합해 AI 코파일럿, 어시스턴트, 디지털 휴먼 아바타를 위한 최첨단 검색 파이프라인을 구축할 수 있다.

 

액센츄어, AI 파운드리로 기업용 맞춤형 라마 슈퍼모델 개척

글로벌 전문 서비스 기업인 액센츄어(Accenture)는 자체 사용은 물론, 문화, 언어, 산업을 반영하는 생성형 AI 애플리케이션을 배포하고자 하는 고객을 위해 엔비디아 AI 파운드리를 최초로 채택했다. 또한, 액센츄어 AI 리파이너리(Refinery) 프레임워크를 사용해 맞춤형 라마 3.1 모델을 구축했다.

 

액센츄어의 회장 겸 CEO인 줄리 스위트(Julie Sweet)는 “세계 유수의 기업들은 생성형 AI가 각 산업을 어떻게 변화시키고 있는지를 확인하고 있으며, 맞춤형 모델 기반의 애플리케이션을 배포하고자 한다. 액센츄어는 내부 AI 애플리케이션을 위해 엔비디아 NIM 추론 마이크로서비스와 협력해 왔다. 그리고 이제 엔비디아 AI 파운드리를 통해 고객이 맞춤형 라마 3.1 모델을 신속하게 생성, 배포해 각자의 비즈니스 우선순위에 맞는 혁신적인 AI 애플리케이션을 구동하도록 지원할 수 있게 됐다"고 설명했다. 

 

엔비디아 AI 파운드리는 맞춤형 슈퍼모델을 빠르게 구축할 수 있는 엔드투엔드 서비스를 제공한다. 이는 엔비디아 소프트웨어, 인프라, 전문성 등을 개방형 커뮤니티 모델, 기술, 엔비디아 AI 에코시스템의 지원에 결합한다.

 

기업들은 엔비디아 AI 파운드리를 통해 라마 3.1 모델과 엔비디아 네모(NeMo) 플랫폼을 사용해 맞춤형 모델을 만들 수 있다. 여기에는 허깅 페이스 리워드 벤치(Hugging Face RewardBench)에서 1위를 차지한 엔비디아 네모트론-4 340B 리워드 모델이 포함된다.

 

맞춤형 모델이 생성되면, 기업은 선호하는 클라우드 플랫폼과 글로벌 서버 제조업체의 엔비디아 인증 시스템(Certified Systems)에서 원하는 MLOps AIOps 플랫폼을 사용할 수 있다. 이를 통해 프로덕션 환경에서 실행할 수 있는 엔비디아 NIM 추론 마이크로서비스를 생성한다.

 

엔비디아 AI 엔터프라이즈(AI Enterprise) 전문가와 글로벌 시스템 통합 파트너는 AI 파운드리 고객과 협력해 개발부터 배포에 이르는 전체 프로세스를 가속화한다.

 

고급 모델 맞춤화를 지원하는 엔비디아 네모트론

도메인별 모델을 만들기 위해 추가 훈련 데이터가 필요한 기업은 맞춤형 라마 슈퍼모델을 만들 때 라마 3.1 405B와 네모트론-4 340B를 함께 사용해 합성 데이터를 생성하면 모델 정확도를 높일 수 있다.

 

자체 훈련 데이터를 보유한 고객은 도메인 적응형 사전 훈련(DAPT)을 위해 엔비디아 네모로 라마 3.1 모델을 맞춤화해 모델 정확도를 더욱 높일 수 있다아울러 엔비디아와 메타는 개발자가 생성형 AI 애플리케이션을 위한 소규모 맞춤형 라마 3.1 모델을 구축하는 데 사용할 수 있는 라마 3.1의 증류 레시피를 제공하기 위해 협력하고 있다. 이를 통해 기업은 AI 워크스테이션과 노트북 같은 광범위한 가속 인프라에서 라마 기반 AI 애플리케이션을 실행할 수 있다.

 

엔비디아와 라마를 통해 AI를 강화하는 업계 선도 기업들

의료, 에너지, 금융 서비스, 소매, 운송, 통신 분야의 기업들은 이미 라마를 위한 엔비디아 NIM 마이크로서비스를 사용하고 있다. 새로운 라마 3.1 NIM 마이크로서비스를 가장 먼저 도입한 기업 중에는 아람코(Aramco), AT&T, 우버(Uber)가 있다.

 

라마 3.1 다국어 LLM 컬렉션은 8B, 70B, 405B 파라미터 크기의 생성 AI 모델 모음이다. 이는 16,000개 이상의 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPU)에서 훈련되고, 데이터센터와 클라우드, 엔비디아 RTX GPU가 탑재된 워크스테이션이나 지포스 RTX GPU가 탑재된 PC에서 엔비디아 가속 컴퓨팅과 소프트웨어에 최적화됐다.

 

정확도와 성능을 향상시키는 새로운 네모 리트리버 RAG 마이크로서비스

기업은 검색 증강 생성(RAG)을 위한 새로운 엔비디아 네모 리트리버 NIM 추론 마이크로서비스를 사용한다. 이를 통해 맞춤형 라마 슈퍼모델과 라마 NIM 마이크로서비스를 프로덕션에 배포할 때 응답 정확도를 향상시킬 수 있다.

 

라마 3.1 405B용 엔비디아 NIM 추론 마이크로서비스와 결합된 네모 리트리버 NIM 마이크로서비스는 RAG 파이프라인을 위한 최고의 오픈, 상용 텍스트 Q&A 검색 정확도를 제공한다.

 

라마 3.1과 네모 리트리버 NIM 배포를 위한 엔터프라이즈 에코시스템 준비 완료

기업, 데이터, 인프라 플랫폼을 제공하는 수백 개의 엔비디아 NIM 파트너는 이제 자사의 AI 솔루션에 새로운 마이크로서비스를 통합한다. 이로써 5백만 명 이상의 개발자와 19,000개 이상의 스타트업으로 구성된 엔비디아 커뮤니티를 위해 생성형 AI를 강화할 수 있다.

 

라마 3.1 NIM과 네모 리트리버 NIM 마이크로서비스에 대한 프로덕션 지원은 엔비디아 AI 엔터프라이즈를 통해 제공된다. 엔비디아 개발자 프로그램(Developer Program) 회원은 자신이 선호하는 인프라에서 연구, 개발, 테스트를 위해 NIM 마이크로서비스에 무료로 액세스할 수 있다.

 

 

#엔비디아#파운드리#AI#라마#메타#RAG

?

  1. 안랩 V3, 최신 ‘AV-TEST’ 테스트에서 종합점수 만점 획득!

    - 5~6월 AV-TEST의 PC용 백신 평가 ‘홈 유저’ 및 ‘비즈니스 유저’ 부문 참가해 진단율, 성능, 사용성 세 가지 평가 항목 모두 만점 기록 - 상위권 성적을 기록한 제품을 의미하는 ‘우수 제품(Top Product)’에 두 부문(‘홈 유저’ 및 ‘비즈니스 유저’ 부문) 모두...
    Date2024.08.21 Bynewsit Views135
    Read More
  2. ams OSRAM, 자동차용 조명 신규 플랫폼 「SYNIOS P 2222 LED」 출시

    ams OSRAM은 자동자의 신호 전달 조명 표준 플랫폼 SYNIOS P 2222 LED를 새롭게 출시한다고 밝혔다. 이를 통해 높은 신뢰성과 낮은 열 저항, 뛰어난 밝기를 자랑하는 SYNIOS 제품군을 확장하고 혁신적인 차량용 조명 솔루션에 훨씬 더 광범위한 옵션을 제공할 ...
    Date2024.08.20 Bynewsit Views320
    Read More
  3. 삼성전자, AI TV 앞세워 상반기 글로벌 TV 시장 1위 달성

    삼성전자가 올해 출시한 AI TV를 앞세워 상반기 글로벌 TV 시장에서 1위를 차지했다. 19일 글로벌 시장조사기관 옴디아에 따르면 삼성전자는 올해 상반기 금액 기준 28.8%를 기록하며 전 세계 TV 시장 1위 지켰다. 이로써 삼성전자는 글로벌 TV 시장 19년 연속...
    Date2024.08.20 Bynewsit Views106
    Read More
  4. 매스웍스코리아, 오는 9월 30일까지 ‘매트랩 AI 모델 챌린지’ 지원서 접수중

    - 오는 9월 30일(월)까지 참가 신청… 모델 제출일은 11월 15일까지 - 대회 수상자에게 매트랩 활용 사례 연구 및 AI 기술 적용 위한 상금 최대 100만원 수여 매스웍스(MathWorks)는 실생활이나 산업 프로세스를 혁신적으로 개선할 아이디어를 모델로 구현하는 ...
    Date2024.08.20 Bynewsit Views204
    Read More
  5. 사이냅소프트, KISA 클라우드 서비스 보안인증 획득

    - 사이냅 문서뷰어 서비스, 클라우드 서비스 보안 인증 획득 - 클라우드 서비스 보안 인증(CSAP) 획득으로 안전성과 신뢰성을 입증 - 구축형과 함께 클라우드 서비스로의 도입을 희망하는 공공기관 시장 확대 사이냅소프트는 한국인터넷진흥원(KISA)으로부터 ...
    Date2024.08.20 Bynewsit Views352
    Read More
  6. MSI, 노트북 SNS·크리에이터 서포터즈 14기 모집 (~9/4)

    - 2024년 9월 4일(수)까지 MSI 노트북 서포터즈 14기 - 오프라인 발대식 참여 및 온라인 홍보대사로 활동 - 매월 활동비 및 수료증 등 다양한 혜택 제공 엠에스아이코리아는 노트북 콘텐츠 제작 및 온라인 마케팅 활동을 수행하는 IT 업계 대표 대외 활동인 MS...
    Date2024.08.19 Bynewsit Views169
    Read More
  7. 메이머스트, 주요 제조 대기업들의 AI 인프라 구축 지원…“고객의 상황에 맞게 풀스택 솔루션 제공”

    - 국내 대표 제조사에 AI 모델 구축 프로젝트 성공적으로 수행 - 고객의 상황에 맞는 최적의 AI HW 및 SW 인프라와 관련 사용 사례 등을 함께 풀스택 솔루션으로 제공 AI 및 클라우드 보안 전문기업 메이머스트는 오늘 국내 대표 그룹의 AI 오토노머스(Autonom...
    Date2024.08.19 Bynewsit Views292
    Read More
  8. 샤오미, '포코 X6 프로' 네이버 브랜드 스토어 입점

    - 포코 X6 프로, 쿠팡에 이어 네이버 브랜드 스토어에 입점 - 탁월한 성능으로 플래그쉽 사용자 경험 제공 샤오미가 ‘포코 X6 프로(POCO X6 Pro)’ 2종을 네이버 브랜드 스토어에 출시한다. 포코 X6 프로는 지난 6월 27일 쿠팡에서 단독으로 출시된 바 있으며, ...
    Date2024.08.19 Bynewsit Views166
    Read More
  9. ​​​​​​​캐논코리아, 부산의 새로운 랜드마크 ‘캐논스토어 부산점’ 그랜드 오픈

    - 부산·경남 지역의 두 번째 오프라인 플래그십 매장 '캐논스토어 부산점' 오픈 - 100여평의 넓은 공간에 ▲쇼룸 ▲서비스센터 ▲교육 아카데미 ▲셀프 스튜디오 등 다양한 시설 갖춰 - 지역 고객 타깃 맞춤화된 제품 라인업 전시 및 오픈 기념 프로모션 진행 캐논...
    Date2024.08.19 Bynewsit Views146
    Read More
  10. MSI, 일렉트로마트·코스트코에서 '한우 증정 MSI 클로 체험기’ 이벤트

    - MSI 클로 오프라인 매장 체험기 및 인증샷 이벤트 - 체험기 작성 베스트 2인에게 15만 원 상당 한우 세트 증정 - 인증샷 선착순 200명에게 커피 기프티콘을 증정 - 2024년 8월 16일부터 9월 22일까지 이벤트 진행 엠에스아이코리아는 '클로 A1M-U7' 오프라인...
    Date2024.08.16 Bynewsit Views163
    Read More
  11. 티피링크, 매터 호환 스마트 와이파이 전구 ‘Tapo L535E’ 출시

    티피링크가 새로운 스마트 와이파이 전구 'Tapo L535E'를 출시했다고 밝혔다. 이번에 선보인 Tapo L535E는 1600만 가지 색상을 표현할 수 있어 사용자가 특정 활동이나 분위기에 맞는 조명을 손쉽게 선택할 수 있으며, 스케줄 및 타이머 설정으로 일상생활을 ...
    Date2024.08.16 Bynewsit Views144
    Read More
  12. 어플라이드 머티어리얼즈, 2024년 3분기 글로벌 매출 67억8000만 달러 기록… “전년 동기 대비 5% 증가”

    어플라이드 머티어리얼즈가 7월 28일 마감한 회계연도 2024년 3분기 실적을 발표했다. 어플라이드 머티어리얼즈 회계연도 2024년 3분기 글로벌 매출은 미국 회계기준으로 67억8000만 달러로, 매출총이익률 47.3%를 기록했다. 영업이익과 영업이익률은 각각 19...
    Date2024.08.16 Bynewsit Views320
    Read More
  13. 삼성, 프리미엄 빌트인 가전 '데이코' 삼성스토어 롯데 잠실에 입점

    - 냉장·냉동고, 와인셀러, 식기세척기 등 데이코 전 제품 라인업 설치 - 체계적인 교육 과정을 거친 데이코 전문가의 깊이 있는 상담 제공 삼성전자는 럭셔리 빌트인 가전 브랜드 ‘데이코(Dacor)’가 삼성스토어 롯데 잠실에 8월 15일 공식 입점했다고 밝혔다. ...
    Date2024.08.16 Bynewsit Views145
    Read More
  14. 마우저-온세미, <지속 가능한 미래를 지원하는 SiC 전력 전자장치> 전자책 발간

    - SiC 전력 전자장치의 이점 조명 마우저 일렉트로닉스는 온세미(onsemi)와 협력해 전력 시스템 설계를 위한 실리콘 카바이드(SiC) 반도체의 이점을 조명한 새로운 전자책을 발간했다고 밝혔다. SiC 디바이스는 뛰어난 소재 특성으로 보다 효율적이고 콤팩트하...
    Date2024.08.16 Bynewsit Views215
    Read More
  15. 라바웨이브, ‘몸캠피싱 악성앱 분석 리포트’ 발간…“피해 최소화 주력”

    - 몸캠피싱 악성앱 분석 리포트의 주기적 발간을 통해 피해 예방 및 대응 강화 - 라바웨이브, “몸캠피싱 악성앱은 변화무쌍… 주기적인 점검과 각별한 주의 필요” 디지털 범죄 대응 전문기업 라바웨이브는 몸캠피싱에 악용되는 악성앱을 분석한 리포트를 주기적...
    Date2024.08.14 Bynewsit Views171
    Read More
  16. 마우저, TI 「DLP2021-Q1」 DLP 디지털 마이크로미러 공급…“차량 및 전기차 애플리케이션용”

    마우저 일렉트로닉스는 TI의 새로운 DLP2021-Q1 차량용 0.2인치 DLP 디지털 마이크로미러 디바이스(DMD)를 공급한다고 밝혔다. DLP2021-Q1은 차량 및 전기자동차(EV) 애플리케이션의 애니메이션 및 동적 콘텐츠와 풀컬러 노면 조사 기능을 비롯해 자동차의 외...
    Date2024.08.14 Bynewsit Views241
    Read More
  17. 한국오키시스템즈, 'K-PRINT 2024’ 참가…“최신 라벨 프린터부터 A3 컬러프린터 전시”

    한국오키시스템즈는 오는 8월 21일(수)부터 8월 24일(토)까지 킨텍스에서 열리는 ‘K-PRINT 2024’에 참가한다고 밝혔다. K-PRINT는 인쇄와 레이블, 패키지, 텍스타일, 사인 및 광고 산업을 통합하는 전시회로 인쇄산업의 미래비전과 전망을 한 눈에 살펴볼 수 ...
    Date2024.08.14 Bynewsit Views168
    Read More
  18. 티머니, ‘<디즈니> 버스여행 티머니 카드’ 2종 출시 

    - 서울 버스 탄 ‘미키 앤 프렌즈’ 테마의 티머니 카드 티머니는 월트디즈니 컴퍼니 코리아와의 협업을 통해 ‘<디즈니> 버스여행 티머니카드 2종(빨강 가로형, 초록 세로형)’을 공개한다고 14일 밝혔다. 빨강 가로형, 초록 세로형 2종 각 1만 매씩 총 2만 매 한...
    Date2024.08.14 Bynewsit Views116
    Read More
  19. 안랩, ‘2024년 2분기 피싱 이메일 통계 보고서’ 발표

    - 2024년 2분기에 수집한 피싱 이메일 ‘키워드 유형’, ‘악성 첨부파일 유형’, ‘첨부파일 확장자 유형’ 등 분석 - 키워드 유형: 사용자 호기심 자극하면서 업무 관련성 높은 ‘결제∙구매’, ‘주문∙배송’, ‘공지∙알림’ 순 - 악성 첨부파일 위협 유형: 계정 정보 입...
    Date2024.08.14 Bynewsit Views149
    Read More
  20. 로지텍, 슬림한 디자인의 무소음 마우스 ‘Pebble M340’ 쿠팡 단독 출시

    - 가볍고 콤팩트한 무소음 마우스 ‘Pebble M340’, 쿠팡에서 단독 공개 - 클릭 소음 90% 제거해 조용한 사용감 및 작업 환경 제공 - 나노 USB 수신기 포함 간편하고 안정적인 무선 연결 지원 로지텍이 슬림한 디자인의 무소음 마우스 ‘페블 M340(Pebble M340)’...
    Date2024.08.14 Bynewsit Views144
    Read More
Board Pagination Prev 1 ... 108 109 110 111 112 113 114 115 116 117 ... 271 Next
/ 271
CLOSE