- 대규모 언어 모델(LLM) 훈련 속도 최대 30% 향상

- 엔비디아 AI 플랫폼 네모 메가트론, A100 GPU 사용한 컨테이너형 프레임워크

- LLM, 실시간 콘텐츠 생성과 고객 서비스 챗봇 등 대화형 AI 인터페이스 발전 제공

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (1).jpg

 

 

엔비디아가 대규모 언어 모델(LLM)의 크기와 복잡성이 지속적으로 급증함에 따라 최대 30%의 훈련 속도 향상을 제공하는 네모 메가트론(NeMo Megatron) 프레임워크의 업데이트를 발표했다이번 업데이트는 두 가지 선구적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 하이퍼 파라미터(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.

 

1,760억 개의 파라미터(parameter)를 가진 세계 최대 오픈 사이언스, 오픈 액세스 다국어 언어 모델인 블룸(BLOOM)최근 엔비디아 AI 플랫폼에서 훈련돼 46개 언어와 13개 프로그래밍 언어로 텍스트 생성을 가능하게 했다. 또한 엔비디아 AI 플랫폼은 5,300억 개의 파라미터를 포함하는 가장 강력한 변환기 언어 모델인 메가트론-튜링 NLG 모델(MT-NLG)을 지원한다.

 

LLM의 최신 발전

LLM은 텍스트에서 학습하는 최대 수조 개의 파라미터를 포함하는 오늘날 가장 중요한 첨단 기술 중 하나다. 하지만 이를 개발하려면 심층적인 기술 전문 지식, 분산된 인프라, 전체 스택 접근 방식이 필요해 비용과 시간이 많이 든다그러나 실시간 콘텐츠 생성, 텍스트 요약, 고객 서비스 챗봇, 대화형 AI 인터페이스를 위한 질문과 답변을 발전시키는 데 있어 큰 이점을 갖는다.

 

AI 커뮤니티는 LLM을 발전시키기 위해 메가트론(Megatron)-LM, 에이펙스(Apex), 그리고 기타 GPU 가속 라이브러리를 포함하는 엔비디아 AI 플랫폼을 기반으로 하는 마이크로소프트 딥스피드(Microsoft DeepSpeed), Colossal-AI, 허깅 페이스 빅사이언스(Hugging Face BigScience), 페어스케일(Fairscale) 같은 도구의 혁신을 이어가고 있다.

 

엔비디아는 오늘날 엔비디아 AI 플랫폼에 대한 새로운 최적화를 통해 스택 전체에서 기존의 많은 문제점을 해결하며, AI 커뮤니티와 협력해 모든 사람이 LLM의 기능에 액세스할 수 있기를 기대하고 있다.

 

LLM 구축 시간 단축

네모 메가트론의 최신 업데이트는 220억에서 1조 파라미터에 이르는 크기의 GPT-3 모델 훈련 속도를 30% 향상시킨다. 이는 1,024개의 엔비디아 A100 GPU를 사용해 1,750억 개의 파라미터 모델에 대한 훈련을 24일 만에 수행하도록 한다. , 결과 도출 시간을 10일 또는 GPU 컴퓨팅 시간으로 약 250,000 시간 단축할 수 있다.

 

네모 메가트론은 빠르고 효율적이며 사용하기 쉬운 엔드 투 엔드 컨테이너형 프레임워크이다. 데이터 수집, 대규모 모델 훈련, 업계 표준 벤치마크에 대한 모델 평가, 지연 시간과 처리량 성능에 대한 최첨단 추론이 가능하다.

 

이를 통해 LLM 훈련과 추론을 다양한 GPU 클러스터 구성에서 쉽게 재현할 수 있다. 현재 얼리 액세스 고객에게 엔비디아 DGX 슈퍼POD(SuperPOD), 엔비디아 DGX 파운드리(Foundry), 마이크로소프트 애저(Microsoft Azure) 클라우드 플랫폼을 제공한다. 또한 다른 클라우드 플랫폼에 대한 지원도 제공될 예정이다.

 

더불어 사용자에게 엔비디아 가속 인프라의 실습 랩 카탈로그에 대한 단기 액세스를 제공하는 무료 프로그램인 엔비디아 런치패드(LaunchPad)에서 기능을 체험할 수 있다.

 

LLM 훈련 속도를 높이는 두 가지 새로운 기술

LLM 훈련을 최적화하고 확장하는 업데이트에 포함된 두 가지 새로운 기술은 시퀀스 병렬화(SP)와 선택적 활성화 재계산(SAR)이다.

 

시퀀스 병렬화(SP)는 이전에 병렬화 되지 않은 변환기 레이어의 영역이 시퀀스 차원을 따라 독립적이라는 점을 인식해 텐서 수준 모델 병렬화를 확장한다.

 

시퀀스 차원을 따라 이러한 레이어를 분할함으로써 텐서 병렬 장치 전반에 걸쳐 컴퓨팅 및 가장 중요한 활성화 메모리를 분산할 수 있다. 활성화가 분산되므로 재계산 대신 역방향 패스에 대해 더 많은 활성화를 저장할 수 있다.

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (2).png

 

 

[그림 1] 변환기 레이어 내의 병렬화 모드

[시퀀스 병렬화는 레이어놈(LayerNorm)과 드롭아웃(Dropout) 레이어에서 사용되는 반면 텐서 병렬화는 어텐션 및 FFN 레이어에서 사용된다]

 

선택적 활성화 재계산은 다른 활성화가 재계산하는 데 다른 수의 작업이 필요하다는 점을 인식한다. 이를 통해 메모리 제약으로 인해 활성화의 전부가 아닌 일부를 재계산해야 하는 경우를 개선한다.

 

전체 변환기 레이어를 검사하고 재계산하는 대신, 상당한 양의 메모리를 차지하지만 재계산하는 데 계산 비용이 많이 들지 않는 각 변환기 레이어의 부분만 검사하고 재계산할 수 있다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (3).png

 

 

 

[그림 2] 셀프 어텐션 블록. 빨간색 점선은 선택적 활성화 재계산이 적용되는 영역을 나타낸다.

[어텐션 레이어 내에서 QKT 행렬 곱셈, 소프트맥스(softmax), 소프트맥스 드롭아웃, V 연산에 대한 어텐션 활성화가 재계산된다]

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (4).png

 

[그림 3] SP SAR 덕분에 역방향 패스에 저장된 활성화 메모리의 양. 모델 크기가 증가함에 따라 SP SAR 모두 유사한 메모리 절약 효과를 나타내므로 필요한 메모리가 최대 5배 감소한다.

[시퀀스 병렬화 및 SAR은 메모리를 최대 5배 감소시킨다]

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (5).png

[그림 4] 전체 활성화 재계산 및 SP+SAR에 대한 계산 오버헤드 양.

막대는 순방향, 역방향 및 재계산 시간의 레이어별 분석을 나타낸다.

기준선은 재계산과 시퀀스 병렬화가 없는 경우이다. 이러한 기술은 모든 활성화가 저장되는 대신 재계산될 때 발생하는 오버헤드를 줄이는 데 효과적이다. 가장 큰 모델의 경우 오버헤드가 36%에서 2%로 떨어진다.  시퀀스 병렬화와 SAR은 함께 사용하면 오버헤드가 기준선의 2%로 감소한다.

 

LLM의 기능에 액세스하려면 고도로 최적화된 추론 전략도 필요하다. 사용자는 추론을 위해 훈련된 모델을 쉽게 사용하고 P-튜닝과 신속한 튜닝 기능을 사용하여 다양한 사용 사례에 최적화할 수 있다.

 

이러한 기능은 미세 조정에 대한 파라미터 효율적인 대안이며 LLM이 전체 사전 훈련된 모델을 미세 조정하는 강력한 접근 방식 없이 새로운 사용 사례에 적응할 수 있도록 한다. 이 기술에서는 원래 모델의 파라미터가 변경되지 않는다. 따라서 미세 조정 모델과 관련된 치명적인 '망각(forgetting)' 문제가 방지된다.

 

훈련과 추론을 위한 새로운 하이퍼 파라미터 도구

분산된 인프라에서 LLM 모델 구성을 찾는 과정에는 시간이 많이 소요된다. 네모 메가트론은 코드 변경 없이 최적의 훈련과 추론 구성을 자동으로 찾는 하이퍼 파라미터 도구를 도입한다. LLM은 처음부터 추론을 위해 수렴하도록 훈련되어 효율적인 모델 구성을 검색하는 데 시간을 낭비하지 않는다.

 

데이터 병렬화, 텐서 병렬화, 파이프라인 병렬화, 시퀀스 병렬화, 마이크로 배치 크기, 활성화 체크포인트 레이어 수(선택적 활성화 재계산 포함)와 같은 고유한 파라미터에 대한 경험적 그리드 검색을 사용하여 처리량이 가장 우수한 구성을 찾는다.

 

NGC의 컨테이너에 대한 엔비디아 테스트의 하이퍼 파라미터 도구를 사용하면 24시간 이내에 175B GPT-3 모델에 대한 최적의 훈련 구성에 도달한다(그림 5). 전체 활성화 재계산을 사용하는 일반적인 구성과 비교할 때 처리 속도가 20-30% 향상됐다. 더불어 최신 기술을 사용해 파라미터가 20B 이상인 모델의 처리 속도를 추가로 10-20% 향상시킨다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (6).png

[그림 5] 각 노드가 엔비디아 DGX A100인 경우 시퀀스 병렬화 및 선택적 활성화 재계산을 통해

속도 향상을 나타내는 여러 컨테이너에 대한 HP 도구의 결과.

[시퀀스 병렬화와 선택적 활성화 재계산 기능이 있는 22.06 컨테이너는 전체 재계산 또는 HP도구 기능이 있는 22.05 컨테이너에 비해 30% 더 빠른 속도를 제공한다.]

 

하이퍼 파라미터 도구를 사용하면 추론 중에 처리량이 가장 높거나 지연 시간이 가장 짧은 모델 구성을 찾을 수 있다. 또한 지연 시간과 처리량 제약 조건을 제공해 모델을 지원할 수 있으며, 도구는 적합한 구성을 권장한다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (1).png

 

[그림 6] 추론을 위한 HP 도구 결과는 GPU당 처리량과 다양한 구성의 지연 시간을 보여준다최적의 구성에는 높은 처리량과 짧은 지연 시간이 포함된다.

[HP 도구는 추론을 위한 높은 처리량과 짧은 대기 시간을 제공하는 최적의 모델 구성을 찾는다. GPT-3: 175B, 40B, 20B 파라미터 모델에 대한 다양한 처리량과 대기시간 트레이드오프가 있는 여러 여러 구성이 그래프에 표시된다.]

 

 

#엔비디아#네모#메가트론#프레임워크#LLM

?

  1. ​​​​​​​안랩, 2022년 상반기 연결기준 "매출 1033억, 영업이익 71억" 달성

    - 2분기: 연결기준 매출 542억원, 영업이익 37억원(별도기준 매출 520억원, 영업이익 55억원) 안랩은 2022년 상반기 연결기준 매출 1033억원, 영업이익 71억원(별도기준 상반기 매출 998억원, 영업이익 96억원)을 기록했다고 잠정 실적을 공시했다. 이는 전년 ...
    Date2022.07.29 Bynewsit Views287
    Read More
  2. 엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표

    - 대규모 언어 모델(LLM) 훈련 속도 최대 30% 향상 - 엔비디아 AI 플랫폼 네모 메가트론, A100 GPU 사용한 컨테이너형 프레임워크 - LLM, 실시간 콘텐츠 생성과 고객 서비스 챗봇 등 대화형 AI 인터페이스 발전 제공 엔비디아가 대규모 언어 모델(LLM)의 크기...
    Date2022.07.29 Bynewsit Views558
    Read More
  3. 포블게이트, 국내 앱 마켓 원스토어 입점 확정

    - 사용자 접근성과 편의성 높이기 위해 구글 ∙ 애플에 이어 까다로운 입점 절차 통과하며 원스토어에 입점 - 앱 다운로드 시 쟁글 공시, 가상자산 등락률, 비트코인 인덱스 등 다양한 정보 제공 가상자산 거래소 포블게이트는 사용자 접근성과 편의성 높이기 ...
    Date2022.07.29 Bynewsit Views552
    Read More
  4. 티맥스티베로, DBMS ‘티베로’ 조달청 2022년 혁신 제품 선정

    - 온라인 전환으로 폭증한 데이터를 성공적으로 관리한 점을 인정받아 패스트트랙lll 선정 - 공공기관, 티베로 구입시 수의계약∙구매면책∙간편구매 등의 혜택 받을 예정 티맥스티베로는 자사의 대표 DBMS '티베로(Tibero)'가 조달청의 2022년 혁신 제품(패스트...
    Date2022.07.29 Bynewsit Views574
    Read More
  5. 아쿠아 시큐리티, 100만 달러 규모의 ‘클라우드 네이티브 보호 보증’ 프로그램 실시  

    - 업계 유일하게 프로덕션 환경에서 클라우드 네이티브에 대한 공격을 차단하도록 보장 클라우드 네이티브 보안 기업 아쿠아 시큐리티은 오늘, 100만 달러 규모의 ‘클라우드 네이티브 보호 보증 프로그램(Cloud Native Protection Warranty)’을 실시한다고 밝...
    Date2022.07.29 Bynewsit Views228
    Read More
  6. 키오시아, NVMe ‘FL6’ 시리즈로 에어로스파이크 DB 애플리케이션 성능 향상

    키오시아는 에어로스파이크(Aerospike)와 손잡고 에어로스파이크 서버 커뮤니티 에디션 데이터베이스의 애플리케이션 성능을 오리지널 소프트웨어 대비 36% 끌어올렸다고 27일 발표했다. 키오시아는 자체 개발한 소프트웨어를 탑재한 NVMe SCM SSD ‘키오시아 F...
    Date2022.07.28 Bynewsit Views304
    Read More
  7. 슈나이더 일렉트릭, ‘마이슈나이더 IT파트너 프로그램’ 발표

    - IT 파트너사의 성장 가속화 및 장기적인 성공을 위해 차별화된 비즈니스 지원 - 고객의 요구사항을 효과적으로 파악해 비즈니스 역량 강화에 도움 슈나이더 일렉트릭이 IT 기업들의 부담을 덜기 위해 마이슈나이더(mySchneider) IT 파트너 프로그램을 발표했...
    Date2022.07.28 Bynewsit Views575
    Read More
  8. 소니, ‘소니 퓨처 필름메이커 어워드(Sony Future Filmmaker Awards)’ 개최  

    - 일반 필름메이커, 학생 필름메이커 모두 참여 가능한 단편 영화 제작자를 위한 어워드 개최 - 6개 카테고리 별 우승자에게 소니 디지털 이미징 기기 및 상금 등 다양한 수상 혜택 제공 - 소니 퓨처 필름메이커 어워드 공식 홈페이지를 통해 출품작 접수 소니...
    Date2022.07.28 Bynewsit Views362
    Read More
  9. 이글루코퍼레이션, AI 특허 취득

    - 머신러닝 활용의 필수 과정인 ‘피드백’ 작업 효율성 극대화 - 이글루코퍼레이션, 더 많은 조직들이 AI의 혜택을 누릴 수 있도록 지원할 것 이글루코퍼레이션은 데이터와 알고리즘을 통해 모델링한 머신러닝 예측 모델의 성능을 개선하는 특허 등록을 완료했...
    Date2022.07.28 Bynewsit Views215
    Read More
  10. 줌, ‘줌 룸’ 업무공간 예약 기능 상용화…“최적화된 하이브리드 근무 환경 조성”

    줌(Zoom)이 ‘Zoom Rooms Workspace Reservation’의 전 세계 상용화를 발표했다. 줌이 올해 설문조사 업체 모멘티브에 의뢰해 조사한 결과에 따르면, 원격근무자들의 절반 이상(55%)이 집 또는 사무실에서 근무할 수 있는 하이브리드 근무 환경을 선호하는 것으...
    Date2022.07.28 Bynewsit Views526
    Read More
  11. 티맥스소프트-한국항공대, 소프트웨어 산업 발전과 디지털 인재 양성을 위한 산학협력

    - 티맥스소프트, 한국항공대와 '소프트웨어 산업 발전 및 인력 양성'을 위한 업무 협약 체결 - 실무 특화형 현장실습 교과목 함께 운영해 학생들의 SW 분야 취업 지원 및 기회 확대에 주력 티맥스소프트가 디지털 대전환의 시대를 맞아 한국항공대와 산학협력...
    Date2022.07.28 Bynewsit Views536
    Read More
  12. 세일즈포스, 5년 연속 ‘가트너 멀티채널 마케팅 허브 부문’ 매직 쿼드런트 리더로 선정

    - 세일즈포스 마케팅 클라우드의 AI 기반 협업 기능, 데이터 통합 및 분석력, 개인화 모듈 통한 콘텐츠 가시성 개선 등 주목 세일즈포스가 ‘2022 가트너 멀티채널 마케팅 허브 부문 매직 쿼드런트’ 리더로 선정됐다고 발표했다. 가트너는 각 분야에 속한 업체...
    Date2022.07.28 Bynewsit Views446
    Read More
  13.   가트너, 2022년 전 세계 반도체 매출 성장률 7%대로 하향 전망

    - 전 세계 반도체 시장 다운사이클 진입 … 경제 악화와 소비자 시장 둔화로 2023년 반도체 매출 2.5% 감소 전망 - 2022년 데이터 센터 부문 반도체 매출 성장률 20% 기록할 것 … 지속적인 클라우드 인프라 투자에 주목 - 전기차와 자율주행차량이 차량용 반도...
    Date2022.07.28 Bynewsit Views346
    Read More
  14. 삼성전자, ‘갤럭시 S22’ 보라 퍼플 색상 출시

    삼성전자가 슬림한 디자인과 6.1형(153.9mm) 디스플레이를 탑재한 ‘갤럭시 S22’에 신규 색상 ‘보라 퍼플(Bora Purple)’을 새롭게 선보인다고 27일 밝혔다. 한국어 보라(Bora)는 영어의 퍼플(Purple) 색상으로 보라 퍼플(Bora Purple) 네이밍은 글로벌에서 동일...
    Date2022.07.27 Bynewsit Views404
    Read More
  15. 루닛, 코스닥 신규 상장…“AI 통해 흉부 엑스레이와 유방촬영술 분석”

    엔비디아의 인셉션 멤버 루닛(Lunit)이 국내 코스닥 주식시장에 성공적으로 상장했다고 밝혔다. 루닛은 2013년에 설립되어 수년 동안 최첨단 스타트업을 육성하는 엔비디아 인셉션(NVIDIA Inception) 프로그램에 참여해왔다. 루닛은 지난해 두 가지 AI 소프트...
    Date2022.07.27 Bynewsit Views567
    Read More
  16. 한국레노버, 프리미엄 노트북 7세대 ‘요가’ 출시

    - 국내 첫 선보이는 ‘요가 슬림 9i’ 및 ‘요가 슬림 7i 프로 X’ - 최신 12세대 인텔 코어 프로세서 와 인텔 이보(EVO) 플랫폼 탑재한 대표 4종 제품 한국 출시 - 뛰어난 디자인∙스마트 기능·고사양 디스플레이 모두 갖춘 최적의 ‘크리에이터’용 노트북 - 27일부...
    Date2022.07.27 Bynewsit Views296
    Read More
  17. 키오시아, PCIe 5.0 엔터프라이즈 NVMe SSD CM7 제품군 출시

    - 새로운 EDSFF E3.S 및 업계 표준 2.5인치 폼 팩터에서 사용 가능 키오시아가 데이터 센터에 차세대 수준의 성능을 제공하기 위해 일부 고객에게 키오시아 CM7 시리즈 엔터프라이즈 NVMe SSD를 출하한다고 밝혔다. 고성능, 고효율 서버 및 저장 장치 요건에 ...
    Date2022.07.27 Bynewsit Views280
    Read More
  18. 뉴렐릭, 신규 ‘파트너 프로그램 출시’로 채널 파트너 전략 강화

    - 뉴렐릭의 글로벌한 파트너 생태계 기반으로 광범위한 트레이닝 및 인증 프로그램, 공동 마케팅, 시장 진입, 영업 리소스에 이르기까지 다양한 서비스 지원 뉴렐릭(New Relic)은 클라우드 및 채널, 기술 파트너 및 매니지드 서비스 공급업체(MSP)들을 위해 더...
    Date2022.07.27 Bynewsit Views457
    Read More
  19. 팀뷰어, 지멘스와 손잡고 AR·MR 솔루션으로 PLM 분야 혁신 지원

    - 지멘스의 PLM 소프트웨어 ‘팀센터’에 팀뷰어의 산업용 AR 솔루션 ‘프론트라인’ 적용… 보다 직관적인 쌍방향의 제품 개발 프로세스로 전환 팀뷰어가 지멘스 디지털 인더스트리 소프트웨어와 PLM(제품수명주기관리) 분야에서 새로운 전략적 파트너십을 체결했...
    Date2022.07.27 Bynewsit Views534
    Read More
  20. 소니코리아, 국내 사진 및 영상 아티스트 대상 ‘Sony Artisans’ 공개 모집

    - 8월 24일(수)까지, 소니와 함께 자신만의 창의성과 개성을 표현할 8명의 사진 및 영상 아티스트 모집 - 2022년 10월부터 2023년 3월까지 ‘Sony Artisans’ 활동 기회 제공 - 활동 기간 동안 소니 촬영 장비 대여 및 ‘알파 프로페셔널’ 프로모션 영상 제작, 신...
    Date2022.07.27 Category디지털이미징 Bynewsit Views356
    Read More
Board Pagination Prev 1 ... 252 253 254 255 256 257 258 259 260 261 ... 265 Next
/ 265
CLOSE