엔비디아 AI 파운드리, 메타 라마 3.1 활용해 전 세계 기업 맞춤형 AI 강화.jpg

엔비디아는 메타(Meta)의 오픈소스 AI 모델 컬렉션인 라마 3.1(Llama 3.1)을 통해 전 세계 기업의 생성형 AI를 강화하는 엔비디아 AI 파운드리(NVIDIA AI Foundry) 서비스와 엔비디아 NIM 추론 마이크로서비스를 발표했다.

 

이제 기업과 국가는 엔비디아 AI 파운드리를 통해 라마 3.1과 엔비디아 소프트웨어와 컴퓨팅, 전문성을 활용해 도메인별 산업 사용 사례에 맞는 맞춤형 ‘슈퍼모델’을 만들 수 있다. 기업은 자체 데이터는 물론, 라마 3.1 405B엔비디아 네모트론(Nemotron) 리워드 모델에서 생성된 합성 데이터로 이러한 슈퍼모델을 훈련할 수 있다.

 

엔비디아 AI 파운드리는 세계 최고의 퍼블릭 클라우드와 공동 설계된 엔비디아 DGX 클라우드(DGX Cloud) AI 플랫폼으로 구동된다. 이를 통해 AI 수요 변화에 따라 쉽게 확장할 수 있는 방대한 컴퓨팅 리소스를 기업에게 제공한다.

 

새로운 서비스는 기업뿐만 아니라 독자적인 AI 전략을 개발 중인 국가들의 맞춤형 거대 언어 모델(LLM) 구축을 지원하며, 이들은 고유한 비즈니스나 문화를 반영하는 생성형 AI 애플리케이션을 위해 도메인별 지식을 갖춘 맞춤형 LLM을 구축하고자 한다.

 

엔비디아 젠슨 황 CEO는 “메타의 오픈소스 모델인 라마 3.1은 전 세계 기업에서 생성형 AI 채택하는 데 있어 중요한 순간이다. 라마 3.1은 모든 기업과 업계가 최첨단 생성형 AI 애플리케이션을 구축할 수 있는 문을 열었다. 엔비디아 AI 파운드리는 라마 3.1을 전체적으로 통합했으며, 기업이 맞춤형 라마 슈퍼모델을 구축하고 배포할 수 있도록 지원할 준비가 돼있다”고 밝혔다. 

 

메타의 창립자 겸 CEO인 마크 저커버그(Mark Zuckerberg)는 “새로운 라마 3.1 모델은 오픈 소스 AI에 있어 매우 중요한 단계이다. 기업들은 엔비디아 AI 파운드리를 통해 사람들이 원하는 최첨단 AI 서비스를 쉽게 만들고 맞춤화하며, 엔비디아 NIM을 통해 배포할 수 있다. 이러한 서비스를 사람들에게 제공할 수 있게 돼 기쁘다”고 덧붙였다. 

 

현재 프로덕션 AI용 라마 3.1 모델의 엔터프라이즈 배포를 강화하기 위해, ai.nvidia.com에서 라마 3.1 모델용 엔비디아 NIM 추론 마이크로서비스를 다운로드할 수 있다. NIM 마이크로서비스는 프로덕션 환경에서 라마 3.1 모델을 배포하는 가장 빠른 방법이며, NIM 없이 추론을 실행하는 것보다 최대 2.5배 더 높은 처리량을 제공한다.

 

기업은 라마 3.1 NIM 마이크로서비스를 새로운 엔비디아 네모 리트리버(NeMo Retriever) NIM 마이크로서비스와 결합해 AI 코파일럿, 어시스턴트, 디지털 휴먼 아바타를 위한 최첨단 검색 파이프라인을 구축할 수 있다.

 

액센츄어, AI 파운드리로 기업용 맞춤형 라마 슈퍼모델 개척

글로벌 전문 서비스 기업인 액센츄어(Accenture)는 자체 사용은 물론, 문화, 언어, 산업을 반영하는 생성형 AI 애플리케이션을 배포하고자 하는 고객을 위해 엔비디아 AI 파운드리를 최초로 채택했다. 또한, 액센츄어 AI 리파이너리(Refinery) 프레임워크를 사용해 맞춤형 라마 3.1 모델을 구축했다.

 

액센츄어의 회장 겸 CEO인 줄리 스위트(Julie Sweet)는 “세계 유수의 기업들은 생성형 AI가 각 산업을 어떻게 변화시키고 있는지를 확인하고 있으며, 맞춤형 모델 기반의 애플리케이션을 배포하고자 한다. 액센츄어는 내부 AI 애플리케이션을 위해 엔비디아 NIM 추론 마이크로서비스와 협력해 왔다. 그리고 이제 엔비디아 AI 파운드리를 통해 고객이 맞춤형 라마 3.1 모델을 신속하게 생성, 배포해 각자의 비즈니스 우선순위에 맞는 혁신적인 AI 애플리케이션을 구동하도록 지원할 수 있게 됐다"고 설명했다. 

 

엔비디아 AI 파운드리는 맞춤형 슈퍼모델을 빠르게 구축할 수 있는 엔드투엔드 서비스를 제공한다. 이는 엔비디아 소프트웨어, 인프라, 전문성 등을 개방형 커뮤니티 모델, 기술, 엔비디아 AI 에코시스템의 지원에 결합한다.

 

기업들은 엔비디아 AI 파운드리를 통해 라마 3.1 모델과 엔비디아 네모(NeMo) 플랫폼을 사용해 맞춤형 모델을 만들 수 있다. 여기에는 허깅 페이스 리워드 벤치(Hugging Face RewardBench)에서 1위를 차지한 엔비디아 네모트론-4 340B 리워드 모델이 포함된다.

 

맞춤형 모델이 생성되면, 기업은 선호하는 클라우드 플랫폼과 글로벌 서버 제조업체의 엔비디아 인증 시스템(Certified Systems)에서 원하는 MLOps AIOps 플랫폼을 사용할 수 있다. 이를 통해 프로덕션 환경에서 실행할 수 있는 엔비디아 NIM 추론 마이크로서비스를 생성한다.

 

엔비디아 AI 엔터프라이즈(AI Enterprise) 전문가와 글로벌 시스템 통합 파트너는 AI 파운드리 고객과 협력해 개발부터 배포에 이르는 전체 프로세스를 가속화한다.

 

고급 모델 맞춤화를 지원하는 엔비디아 네모트론

도메인별 모델을 만들기 위해 추가 훈련 데이터가 필요한 기업은 맞춤형 라마 슈퍼모델을 만들 때 라마 3.1 405B와 네모트론-4 340B를 함께 사용해 합성 데이터를 생성하면 모델 정확도를 높일 수 있다.

 

자체 훈련 데이터를 보유한 고객은 도메인 적응형 사전 훈련(DAPT)을 위해 엔비디아 네모로 라마 3.1 모델을 맞춤화해 모델 정확도를 더욱 높일 수 있다아울러 엔비디아와 메타는 개발자가 생성형 AI 애플리케이션을 위한 소규모 맞춤형 라마 3.1 모델을 구축하는 데 사용할 수 있는 라마 3.1의 증류 레시피를 제공하기 위해 협력하고 있다. 이를 통해 기업은 AI 워크스테이션과 노트북 같은 광범위한 가속 인프라에서 라마 기반 AI 애플리케이션을 실행할 수 있다.

 

엔비디아와 라마를 통해 AI를 강화하는 업계 선도 기업들

의료, 에너지, 금융 서비스, 소매, 운송, 통신 분야의 기업들은 이미 라마를 위한 엔비디아 NIM 마이크로서비스를 사용하고 있다. 새로운 라마 3.1 NIM 마이크로서비스를 가장 먼저 도입한 기업 중에는 아람코(Aramco), AT&T, 우버(Uber)가 있다.

 

라마 3.1 다국어 LLM 컬렉션은 8B, 70B, 405B 파라미터 크기의 생성 AI 모델 모음이다. 이는 16,000개 이상의 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPU)에서 훈련되고, 데이터센터와 클라우드, 엔비디아 RTX GPU가 탑재된 워크스테이션이나 지포스 RTX GPU가 탑재된 PC에서 엔비디아 가속 컴퓨팅과 소프트웨어에 최적화됐다.

 

정확도와 성능을 향상시키는 새로운 네모 리트리버 RAG 마이크로서비스

기업은 검색 증강 생성(RAG)을 위한 새로운 엔비디아 네모 리트리버 NIM 추론 마이크로서비스를 사용한다. 이를 통해 맞춤형 라마 슈퍼모델과 라마 NIM 마이크로서비스를 프로덕션에 배포할 때 응답 정확도를 향상시킬 수 있다.

 

라마 3.1 405B용 엔비디아 NIM 추론 마이크로서비스와 결합된 네모 리트리버 NIM 마이크로서비스는 RAG 파이프라인을 위한 최고의 오픈, 상용 텍스트 Q&A 검색 정확도를 제공한다.

 

라마 3.1과 네모 리트리버 NIM 배포를 위한 엔터프라이즈 에코시스템 준비 완료

기업, 데이터, 인프라 플랫폼을 제공하는 수백 개의 엔비디아 NIM 파트너는 이제 자사의 AI 솔루션에 새로운 마이크로서비스를 통합한다. 이로써 5백만 명 이상의 개발자와 19,000개 이상의 스타트업으로 구성된 엔비디아 커뮤니티를 위해 생성형 AI를 강화할 수 있다.

 

라마 3.1 NIM과 네모 리트리버 NIM 마이크로서비스에 대한 프로덕션 지원은 엔비디아 AI 엔터프라이즈를 통해 제공된다. 엔비디아 개발자 프로그램(Developer Program) 회원은 자신이 선호하는 인프라에서 연구, 개발, 테스트를 위해 NIM 마이크로서비스에 무료로 액세스할 수 있다.

 

 

#엔비디아#파운드리#AI#라마#메타#RAG

?

  1. 로지텍, 울트라 슬림 휴대용 키보드 ‘Keys-To-Go 2’ 출시

    - 222g의 가벼운 무게로 높은 휴대성 자랑하는 휴대용 블루투스 키보드 ‘Keys-To-Go 2’ - 아이패드용과 범용 2가지 레이아웃, 고급 팬터그래프 키로 편안한 타이핑 경험 선사해 - 일체형 커버로 키보드 보호 및 멀티 디바이스와의 뛰어난 연결성 제공 로지텍은...
    Date2024.08.05 Bynewsit Views110
    Read More
  2. 팀뷰어, 소니 브라비아 프로페셔널 디스플레이에 원격 액세스 기술 적용

    - 소니 브라비아 프로페셔널 디스플레이에 팀뷰어 원격 액세스 기술 탑재 팀뷰어(TeamViewer)가 소니 브라비아 프로페셔널 디스플레이(Sony BRAVIA Professional Displays)에 자사의 원격 액세스 기술을 통합했다고 밝혔다. 이번 전략적 기술 적용은 레스토랑...
    Date2024.08.05 Bynewsit Views218
    Read More
  3. 한국레노버, ‘AMD X Lenovo 대학생 마케터’ 모집

    - 내달 18일까지 모집…레노버·AMD에 관심 있는 대학생 누구나 지원 가능 - AMD AI 프로세서 및 레노버 AI PC 제품 마케팅 활동 기획 미션 수행 - 커피차 이벤트 기획, 현직자 멘토링 등 실무 경험 통한 역량 강화 기회 제공 한국레노버가 AMD와 함께 ‘제1기 AM...
    Date2024.08.01 Bynewsit Views143
    Read More
  4. 가민, 아시아 최초의 골프 특화 매장 ‘가민 브랜드샵 강남점’ 오픈

    - 가민, 8월 2일 ‘가민 브랜드샵 강남점’ 오픈 - 아시아 및 국내 최초의 골프 특화 매장으로 특별함 더해 - 8월 2~4일까지 시타석에서 오프라인 골프 챌린지 진행, 추첨 통해 다양한 선물 증정 - 인기 스마트워치 제품 대상으로 온·오프라인 할인 프로모션도 ...
    Date2024.08.01 Bynewsit Views147
    Read More
  5. 티피링크, 완전 무선 보안 솔루션 「Tapo C425 KIT」 출시…“태양광 충전 지원”

    티피링크(TP-Link)는 고해상도의 2K QHD 화질을 자랑하는 배터리 카메라와 태양광 충전 패널이 결합된 'Tapo C425 KIT'을 출시했다고 밝혔다. Tapo C425 카메라는 400만 화소의 고해상도 센서를 탑재해 선명한 2K QHD 영상을 제공한다. 특히, 기존의 120도 시...
    Date2024.08.01 Bynewsit Views121
    Read More
  6. 사이냅소프트, ChatGPT기반 부동산 감정평가 분석 서비스 'Estate AI' 출시

    - AI로 부동산 가치 평가의 혁신을 이끄는 사이냅소프트의 부동산 감정평가 분석 서비스 - 부동산 투자자와 금융기관의 시간과 비용을 획기적으로 절감 사이냅소프트는 ChatGPT를 기반으로 한 인공지능 부동산 감정평가서 분석 서비스인 인공지능 '부동산 감정...
    Date2024.07.31 Bynewsit Views374
    Read More
  7. 캐논코리아, A4 컬러 레이저 프린터 「LBP730」 시리즈 및 복합기 신제품 「MF842Cx」 출시

    - LBP730 시리즈, 고속·고화질 출력을 지원하는 A4 컬러 레이저 프린터 - MF842Cx, 스캔 속도 약 30% 향상된 A4 컬러 레이저 복합기 캐논코리아가 A4 컬러 레이저 프린터 LBP730 시리즈 2종 및 A4 컬러 레이저 복합기 MF842Cx 등 신제품 3종을 출시한다고 밝혔...
    Date2024.07.31 Bynewsit Views112
    Read More
  8. 알리바바 클라우드, 올림픽 방송 서비스와 함께 AI 기반 ‘OBS 클라우드 3.0’ 발표

    - OBS 라이브 클라우드, 올림픽 방송의 새로운 이정표 세워…원격 대회 영상 배포의 주요 방식으로 라이브 신호 전송 도입 - 콘텐츠플러스 포털로 끊김 없는 콘텐츠 전송 보장 및 멀티 카메라 리플레이 시스템 구축으로 프레임 프리즈 슬로 모션 재생 지원 알리...
    Date2024.07.31 Bynewsit Views202
    Read More
  9. AI 전문기업 6개사의 ‘AX 얼라이언스’ 출범, 고객 맞춤형 AI 플랫폼 공동 수행

    - 클루커스, 누리어시스템, 링네트, 투라인코드, 와이즈넛, 위즈 등의 6개사가 엔터프라이즈를 위한 AI 플랫폼 구축 역량 통합 제공 - AI 인프라 구축, 데이터 전처리, LLM(RAG 구축), 프롬프트 엔지니어링, 파인튜닝, LLMOps, AI 포탈 개발 등 각 사의 전문성...
    Date2024.07.31 Bynewsit Views422
    Read More
  10. 페이오니아, ‘2024 인터참코리아’ 참가… 간편한 해외 대금 관리 서비스 소개

    - 반등하는 K-뷰티 제품 인기… 뷰티 업계, 빠른 대금 관리 서비스에 높은 관심 - 페이오니아 빌링 서비스, 국내 B2B 뷰티 기업의 원활한 해외 진출 지원 페이오니아(Payoneer)는 24일부터 3일간 서울 코엑스에서 진행된 ‘2024 인터참코리아(InterCHARM Korea)’...
    Date2024.07.30 Bynewsit Views278
    Read More
  11. ST, 초소형 750W 모터 드라이브 레퍼런스 보드 출시…“가정용 및 산업용 장비 지원”

    - STDRIVE101 3상 게이트 드라이버 IC로 높은 전력밀도와 절전 모드에서 매우 낮은 전력소모 제공 ST마이크로일렉트로닉스는 직경이 50mm에 불과한 원형 PCB에 3상 게이트 드라이버와 STM32G0 마이크로컨트롤러, 750W의 전력단을 갖춘 EVLDRIVE101-HPD 모터 드...
    Date2024.07.30 Bynewsit Views171
    Read More
  12. 엔비디아 NIM 마이크로서비스, 디지털 환경에 새로운 물리 생성형 AI 구현

    - 엔비디아, 메트로폴리스 파트너 K2K와 협력해 이탈리아 팔레르모의 도시 교통 관리 돕는 시각 AI 에이전트 배포 지원 - 엔비디아, 개발자에 생성형 AI 훈련 위한 강력하고 다양한 합성 데이터 세트의 생성을 가속화할 도구 제공 엔비디아가 물리 생성형 AI N...
    Date2024.07.30 Bynewsit Views212
    Read More
  13. 안랩, 2024년 2분기 피싱 문자 트렌드 보고서 발표

    - 올 2분기 탐지한 피싱 문자의 ▲공격 키워드 ▲사칭 산업군 ▲피싱 유도 방식 분석 결과를 담은 ‘2024년 2분기 스미싱(피싱 문자) 위협 통계 및 분석 보고서’ 발표 - 공격 키워드 1위: 공모주 사칭 / 사칭 산업군 1위: 정부기관 / 피싱 유도 방식 1위: 모바일 ...
    Date2024.07.30 Bynewsit Views108
    Read More
  14. 캐논코리아, 망막 검사 광간섭단층촬영 장비 「OCT-R1」 출시…“OCT와 안저카메라 결합”

    - OCT-R1, 광간섭단층촬영기와 안저카메라 결합된 2 in 1 망막 검사 장비 - 최대 폭 14.7x13.4mm·심도 3.3mm의 초광각 OCT 스캔으로 세밀한 망막 촬영 가능 - 터치 패널을 통한 측정·한국어 음성 안내· 자동 NG 판독 등 사용자 친화 기능 지원 캐논코리아 주식...
    Date2024.07.29 Bynewsit Views107
    Read More
  15. ASUS, 차세대 AI 울트라 슬림 노트북 「Zenbook S16 OLED」 출시

    - 최신 AMD 라이젠 AI 및 AMD 라데온 프로세서 탑재 통해 최대 AI 성능 강화 - 1.1cm 및 1.5kg의 초슬림·초경량 디자인…’세랄루미늄(Ceraluminum)’ 적용한 16인치의 울트라포터블 노트북 - 기하학적 그릴 디자인의 ‘앰비언트 쿨링(Ambient Cooling)’ 기술로 조...
    Date2024.07.29 Bynewsit Views171
    Read More
  16. 다우데이타, 뉴타닉스와 국내 총판 계약 체결…"국내 HCI 및 하이브리드 클라우드 시장 선도"

    뉴타닉스는 다우데이타와 총판 계약을 체결하고, 다우데이타는 뉴타닉스의 다양한 솔루션을 통해 기업의 데이터센터 현대화와 스마트 클라우드 솔루션 구축을 지원한다고 밝혔다. 뉴타닉스는 클라우드 전반에서 애플리케이션과 데이터를 실행할 수 있는 단일 ...
    Date2024.07.29 Bynewsit Views324
    Read More
  17. 마우저, ESD 보호 제품 포트폴리오 확대…“소비가전 및 산업, 통신, 차량 설계 지원”

    마우저 일렉트로닉스는 정전기 방전(ESD) 보호 부품의 포트폴리오를 지속적으로 확장하고 있다고 밝혔다. 전자 장치의 지속적인 발전과 소형화로 인해 효과적인 ESD 보호 솔루션이 그 어느 때보다 중요해지고 있다. ESD 보호 조치를 취하면, ESD 발생으로 인한...
    Date2024.07.26 Bynewsit Views277
    Read More
  18. 인텔, 파운드리 제조 및 공급망 책임자로 ‘나가 찬드라세카란’ 선임

    - 케이반 에스파르자니 글로벌 운영 총책임자 은퇴 후 후임으로 나가 찬드라세카란 박사 선임 인텔은 나가 찬드라세카란(Naga Chandrasekaran) 박사를 인텔 파운드리 제조 및 공급망 부문 최고 글로벌 운영 책임자(COO), 수석 부사장으로 선임한다고 발표했다....
    Date2024.07.26 Bynewsit Views195
    Read More
  19. 엔카닷컴, 2024년 상반기 내 차 팔기 최고가 거래 모델 1위는 '람보르기니 우루스' 

    - 올해 상반기 내 차 팔기 서비스 ‘엔카 비교견적’ 거래 빅데이터 분석 - 고가차 내 차 팔기 서비스로 판매 꾸준, 최고가 거래 모델은 2억대 ‘람보르기니 우루스’ - 상반기 판매 모델 1위는 ‘현대 그랜저 HG’… ‘E-클래스’·‘5시리즈’ 수입 세단 판매도 활발 - ...
    Date2024.07.26 Bynewsit Views107
    Read More
  20. 헥사곤-경남대, 글로컬대학30 및 RISE 사업 추진 협력 MOU 체결

    - 국내 제조 산업의 공동 기술개발 및 경남 지역 디지털 경쟁력 강화 위해 협력 모색 헥사곤 매뉴팩처링 인텔리전스는 경남대학교와 함께 글로컬대학 30 및 RISE(지역혁신 중심 대학 지원체계) 사업 수행을 위한 MOU를 지난 25일 경남대에서 체결했다고 오늘 ...
    Date2024.07.26 Bynewsit Views334
    Read More
Board Pagination Prev 1 ... 107 108 109 110 111 112 113 114 115 116 ... 268 Next
/ 268
CLOSE