- 대규모 언어 모델(LLM) 훈련 속도 최대 30% 향상

- 엔비디아 AI 플랫폼 네모 메가트론, A100 GPU 사용한 컨테이너형 프레임워크

- LLM, 실시간 콘텐츠 생성과 고객 서비스 챗봇 등 대화형 AI 인터페이스 발전 제공

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (1).jpg

 

 

엔비디아가 대규모 언어 모델(LLM)의 크기와 복잡성이 지속적으로 급증함에 따라 최대 30%의 훈련 속도 향상을 제공하는 네모 메가트론(NeMo Megatron) 프레임워크의 업데이트를 발표했다이번 업데이트는 두 가지 선구적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 하이퍼 파라미터(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.

 

1,760억 개의 파라미터(parameter)를 가진 세계 최대 오픈 사이언스, 오픈 액세스 다국어 언어 모델인 블룸(BLOOM)최근 엔비디아 AI 플랫폼에서 훈련돼 46개 언어와 13개 프로그래밍 언어로 텍스트 생성을 가능하게 했다. 또한 엔비디아 AI 플랫폼은 5,300억 개의 파라미터를 포함하는 가장 강력한 변환기 언어 모델인 메가트론-튜링 NLG 모델(MT-NLG)을 지원한다.

 

LLM의 최신 발전

LLM은 텍스트에서 학습하는 최대 수조 개의 파라미터를 포함하는 오늘날 가장 중요한 첨단 기술 중 하나다. 하지만 이를 개발하려면 심층적인 기술 전문 지식, 분산된 인프라, 전체 스택 접근 방식이 필요해 비용과 시간이 많이 든다그러나 실시간 콘텐츠 생성, 텍스트 요약, 고객 서비스 챗봇, 대화형 AI 인터페이스를 위한 질문과 답변을 발전시키는 데 있어 큰 이점을 갖는다.

 

AI 커뮤니티는 LLM을 발전시키기 위해 메가트론(Megatron)-LM, 에이펙스(Apex), 그리고 기타 GPU 가속 라이브러리를 포함하는 엔비디아 AI 플랫폼을 기반으로 하는 마이크로소프트 딥스피드(Microsoft DeepSpeed), Colossal-AI, 허깅 페이스 빅사이언스(Hugging Face BigScience), 페어스케일(Fairscale) 같은 도구의 혁신을 이어가고 있다.

 

엔비디아는 오늘날 엔비디아 AI 플랫폼에 대한 새로운 최적화를 통해 스택 전체에서 기존의 많은 문제점을 해결하며, AI 커뮤니티와 협력해 모든 사람이 LLM의 기능에 액세스할 수 있기를 기대하고 있다.

 

LLM 구축 시간 단축

네모 메가트론의 최신 업데이트는 220억에서 1조 파라미터에 이르는 크기의 GPT-3 모델 훈련 속도를 30% 향상시킨다. 이는 1,024개의 엔비디아 A100 GPU를 사용해 1,750억 개의 파라미터 모델에 대한 훈련을 24일 만에 수행하도록 한다. , 결과 도출 시간을 10일 또는 GPU 컴퓨팅 시간으로 약 250,000 시간 단축할 수 있다.

 

네모 메가트론은 빠르고 효율적이며 사용하기 쉬운 엔드 투 엔드 컨테이너형 프레임워크이다. 데이터 수집, 대규모 모델 훈련, 업계 표준 벤치마크에 대한 모델 평가, 지연 시간과 처리량 성능에 대한 최첨단 추론이 가능하다.

 

이를 통해 LLM 훈련과 추론을 다양한 GPU 클러스터 구성에서 쉽게 재현할 수 있다. 현재 얼리 액세스 고객에게 엔비디아 DGX 슈퍼POD(SuperPOD), 엔비디아 DGX 파운드리(Foundry), 마이크로소프트 애저(Microsoft Azure) 클라우드 플랫폼을 제공한다. 또한 다른 클라우드 플랫폼에 대한 지원도 제공될 예정이다.

 

더불어 사용자에게 엔비디아 가속 인프라의 실습 랩 카탈로그에 대한 단기 액세스를 제공하는 무료 프로그램인 엔비디아 런치패드(LaunchPad)에서 기능을 체험할 수 있다.

 

LLM 훈련 속도를 높이는 두 가지 새로운 기술

LLM 훈련을 최적화하고 확장하는 업데이트에 포함된 두 가지 새로운 기술은 시퀀스 병렬화(SP)와 선택적 활성화 재계산(SAR)이다.

 

시퀀스 병렬화(SP)는 이전에 병렬화 되지 않은 변환기 레이어의 영역이 시퀀스 차원을 따라 독립적이라는 점을 인식해 텐서 수준 모델 병렬화를 확장한다.

 

시퀀스 차원을 따라 이러한 레이어를 분할함으로써 텐서 병렬 장치 전반에 걸쳐 컴퓨팅 및 가장 중요한 활성화 메모리를 분산할 수 있다. 활성화가 분산되므로 재계산 대신 역방향 패스에 대해 더 많은 활성화를 저장할 수 있다.

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (2).png

 

 

[그림 1] 변환기 레이어 내의 병렬화 모드

[시퀀스 병렬화는 레이어놈(LayerNorm)과 드롭아웃(Dropout) 레이어에서 사용되는 반면 텐서 병렬화는 어텐션 및 FFN 레이어에서 사용된다]

 

선택적 활성화 재계산은 다른 활성화가 재계산하는 데 다른 수의 작업이 필요하다는 점을 인식한다. 이를 통해 메모리 제약으로 인해 활성화의 전부가 아닌 일부를 재계산해야 하는 경우를 개선한다.

 

전체 변환기 레이어를 검사하고 재계산하는 대신, 상당한 양의 메모리를 차지하지만 재계산하는 데 계산 비용이 많이 들지 않는 각 변환기 레이어의 부분만 검사하고 재계산할 수 있다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (3).png

 

 

 

[그림 2] 셀프 어텐션 블록. 빨간색 점선은 선택적 활성화 재계산이 적용되는 영역을 나타낸다.

[어텐션 레이어 내에서 QKT 행렬 곱셈, 소프트맥스(softmax), 소프트맥스 드롭아웃, V 연산에 대한 어텐션 활성화가 재계산된다]

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (4).png

 

[그림 3] SP SAR 덕분에 역방향 패스에 저장된 활성화 메모리의 양. 모델 크기가 증가함에 따라 SP SAR 모두 유사한 메모리 절약 효과를 나타내므로 필요한 메모리가 최대 5배 감소한다.

[시퀀스 병렬화 및 SAR은 메모리를 최대 5배 감소시킨다]

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (5).png

[그림 4] 전체 활성화 재계산 및 SP+SAR에 대한 계산 오버헤드 양.

막대는 순방향, 역방향 및 재계산 시간의 레이어별 분석을 나타낸다.

기준선은 재계산과 시퀀스 병렬화가 없는 경우이다. 이러한 기술은 모든 활성화가 저장되는 대신 재계산될 때 발생하는 오버헤드를 줄이는 데 효과적이다. 가장 큰 모델의 경우 오버헤드가 36%에서 2%로 떨어진다.  시퀀스 병렬화와 SAR은 함께 사용하면 오버헤드가 기준선의 2%로 감소한다.

 

LLM의 기능에 액세스하려면 고도로 최적화된 추론 전략도 필요하다. 사용자는 추론을 위해 훈련된 모델을 쉽게 사용하고 P-튜닝과 신속한 튜닝 기능을 사용하여 다양한 사용 사례에 최적화할 수 있다.

 

이러한 기능은 미세 조정에 대한 파라미터 효율적인 대안이며 LLM이 전체 사전 훈련된 모델을 미세 조정하는 강력한 접근 방식 없이 새로운 사용 사례에 적응할 수 있도록 한다. 이 기술에서는 원래 모델의 파라미터가 변경되지 않는다. 따라서 미세 조정 모델과 관련된 치명적인 '망각(forgetting)' 문제가 방지된다.

 

훈련과 추론을 위한 새로운 하이퍼 파라미터 도구

분산된 인프라에서 LLM 모델 구성을 찾는 과정에는 시간이 많이 소요된다. 네모 메가트론은 코드 변경 없이 최적의 훈련과 추론 구성을 자동으로 찾는 하이퍼 파라미터 도구를 도입한다. LLM은 처음부터 추론을 위해 수렴하도록 훈련되어 효율적인 모델 구성을 검색하는 데 시간을 낭비하지 않는다.

 

데이터 병렬화, 텐서 병렬화, 파이프라인 병렬화, 시퀀스 병렬화, 마이크로 배치 크기, 활성화 체크포인트 레이어 수(선택적 활성화 재계산 포함)와 같은 고유한 파라미터에 대한 경험적 그리드 검색을 사용하여 처리량이 가장 우수한 구성을 찾는다.

 

NGC의 컨테이너에 대한 엔비디아 테스트의 하이퍼 파라미터 도구를 사용하면 24시간 이내에 175B GPT-3 모델에 대한 최적의 훈련 구성에 도달한다(그림 5). 전체 활성화 재계산을 사용하는 일반적인 구성과 비교할 때 처리 속도가 20-30% 향상됐다. 더불어 최신 기술을 사용해 파라미터가 20B 이상인 모델의 처리 속도를 추가로 10-20% 향상시킨다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (6).png

[그림 5] 각 노드가 엔비디아 DGX A100인 경우 시퀀스 병렬화 및 선택적 활성화 재계산을 통해

속도 향상을 나타내는 여러 컨테이너에 대한 HP 도구의 결과.

[시퀀스 병렬화와 선택적 활성화 재계산 기능이 있는 22.06 컨테이너는 전체 재계산 또는 HP도구 기능이 있는 22.05 컨테이너에 비해 30% 더 빠른 속도를 제공한다.]

 

하이퍼 파라미터 도구를 사용하면 추론 중에 처리량이 가장 높거나 지연 시간이 가장 짧은 모델 구성을 찾을 수 있다. 또한 지연 시간과 처리량 제약 조건을 제공해 모델을 지원할 수 있으며, 도구는 적합한 구성을 권장한다.

 

엔비디아, 대규모 언어 모델 AI 플랫폼 ‘네모 메가트론’ 프레임워크 업데이트 발표_7 (1).png

 

[그림 6] 추론을 위한 HP 도구 결과는 GPU당 처리량과 다양한 구성의 지연 시간을 보여준다최적의 구성에는 높은 처리량과 짧은 지연 시간이 포함된다.

[HP 도구는 추론을 위한 높은 처리량과 짧은 대기 시간을 제공하는 최적의 모델 구성을 찾는다. GPT-3: 175B, 40B, 20B 파라미터 모델에 대한 다양한 처리량과 대기시간 트레이드오프가 있는 여러 여러 구성이 그래프에 표시된다.]

 

 

#엔비디아#네모#메가트론#프레임워크#LLM

?

  1. 버티브, 업그레이드된 데이터센터 관리 플랫폼 발표…”아시아 지역 엣지 IT 분야 겨냥“

    - 여러 IT 장비를 관리할 수 있도록 향상된 대시보드 제공 버티브(Vertiv)는 버티브 스마트 인프라사이트(Vertiv Smart InfraSight) 데이터센터 관리 플랫폼을 새롭게 업그레이드 했다고 밝혔다. 이 웹 기반 소프트웨어를 사용하면 모니터링 및 시각화 기술을 ...
    Date2022.08.04 Bynewsit Views621
    Read More
  2. 티피링크, 포브스 선정 ‘2022 고객신뢰도 1위’ 프리미엄 브랜드 2년 연속 수상

    티피링크(TP-Link)는 포브스와 중앙일보가 선정한 ‘2022 고객신뢰도 1위’ 프리미엄 브랜드에서 공유기•홈카메라 부문을 2년 연속 수상하는 쾌거를 거뒀다고 밝혔다. ‘2022 고객신뢰도 1위 프리미엄 브랜드’는 중앙일보와 포브스코리아가 주최, 소비자 빅데이터...
    Date2022.08.04 Bynewsit Views312
    Read More
  3. 티베로, AWS 퀵스타트에 TSC 서비스 등록…"AWS에서 티베로 핵심 기능 빠르게 구현"

    - AWS 퀵스타트, 클라우드 환경 구성 및 실행을 위한 주요 워크로드 자동화해 빠른 배포 실현 - 퀵스타트 채널 통해 TSC 기능을 포함한 티베로를 AWS EC2 클라우드 환경에 신속하고 간편하게 구성 후 사용 가능 티맥스티베로가 아마존웹서비스(AWS) 클라우드 ...
    Date2022.08.04 Bynewsit Views674
    Read More
  4. Veeam, 가트너 ‘백업 및 복구 솔루션 리더’로 6회 연속 선정

    - 빔, 실행 능력서 3년 연속 최고 기업 인정받으며 가트너 매직 쿼드런트 리더로 선정 - 클라우드, 가상환경, 물리환경, SaaS, 쿠버네티스 등 모든 환경에 데이터 보호 솔루션 제공 빔 소프트웨어는 오늘 가트너 매직 쿼드런트에서 ‘2022 매직 쿼드런트 백업 ...
    Date2022.08.04 Bynewsit Views616
    Read More
  5. MSI, 8월 여름방학 기념 ‘MSI 수냉쿨러’ 이벤트

    - 8월 MSI 수냉쿨러 구매 및 사용기 작성 시 최대 7만원 상당 혜택 엠에스아이코리아는 최강 쿨링 MSI 수냉쿨러 구매 고객을 대상으로 최대 7만원 상당의 혜택을 제공하는 이벤트를 진행한다고 밝혔다. 본 이벤트는 8월 1일(월) ~ 8월 31일(수) 진행되며, 대상...
    Date2022.08.03 Bynewsit Views301
    Read More
  6. 마우저, 몰렉스 4년 연속 「올해의 아시아태평양 e-카탈로그 유통기업상」 수상

    마우저 일렉트로닉스는 몰렉스(Molex)로부터 올해의 APS e-카탈로그 유통기업 상을 수상했다고 밝혔다. 마우저는 지난 2021년 아시아태평양(APAC) 지역에서의 고객 수 증가 및 가장 빠른 POS 성장률 등을 인정받아 이번 상을 수상했다. 마우저는 지난 2018년, ...
    Date2022.08.03 Bynewsit Views416
    Read More
  7. 클래로티, 사이버 및 운영 탄력성을 위한 사이버 보안 플랫폼 ‘클래로티 엑스돔’ 공개

    - 기업들이 우리의 삶을 지탱하는 가상물리시스템의 연속성을 보호하고, 현대화할 수 있도록 지원하는 새로운 클래로티 엑스돔(Claroty xDome) 클래로티(Claroty)는 산업 분야의 첨단 기업들을 위해 사이버 및 운영 탄력성을 지원하는 새로운 클라우드 기반 산...
    Date2022.08.03 Bynewsit Views338
    Read More
  8. 솔리다임, PCIe 4.0 SSD ‘솔리다임 P41 플러스’ 출시

    - 하드웨어와 소프트웨어를 결합한 솔리다임(Solidigm) 브랜드의 첫 SSD - 일상적인 컴퓨팅을 위한 탁월한 가성비와 성능을 겸비 솔리다임(Solidigm)이 2021년 12월 창립 이후 첫 번째 SSD 브랜드 제품인 솔리다임 P41 플러스(Solidigm P41 Plus)를 발표했다. ...
    Date2022.08.03 Bynewsit Views292
    Read More
  9. 롯데마트, 오라클 데이터베이스 유지보수 서비스를 '리미니스트리트'로 전환

    - 고품질의 빠른 유지보수 대응을 고려하여 독립적인 3자 유지보수 서비스를 선택 리미니스트리트는 국내 대형 하이퍼마켓 체인인 롯데마트가 오라클 데이터베이스 유지보수 지원 서비스 업체로 리미니스트리트를 택했다고 오늘 밝혔다. 롯데마트는 사업 성장...
    Date2022.08.03 Bynewsit Views620
    Read More
  10. 온세미, 2022년 2분기 분기 매출 20억 달러 첫 돌파

    온세미는 오늘 2022년 2분기 실적을 발표하고, 분기 매출이 전년 동기 대비 25% 증가와 20억달러를 넘었다고 밝혔다. 온세미 CEO 핫산 엘 쿠리(Hassane El-Khoury)는 "온세미는 2022년 2분기 매출이 전년 동기 대비 25% 증가하고 비일반회계기준 총 이익이 1,1...
    Date2022.08.03 Bynewsit Views417
    Read More
  11. VMware, 한국기술교육대학교 스마트 직업훈련 플랫폼 ‘STEP’ 클라우드 전환 완료

    - 코로나19 팬데믹으로 원격 수업 수요 급증하며 높아진 IT 인프라 최신화 필요성에 맞춰 안정적인 클라우드 환경 구축 VMware Korea와 한국기술교육대학교 온라인평생교육원은 소프트웨어 정의 데이터 센터(SDDC)를 최신화하고, 스마트 직업훈련 플랫폼(STEP)...
    Date2022.08.03 Bynewsit Views570
    Read More
  12. No Image

    오라클, 가트너 매직 쿼드런트 ‘서비스 중심 기업 전용 클라우드 ERP 부문’ 리더로 선정

    - 오라클 퓨전 클라우드 ERP, 서비스 중심 클라우드 ERP 시장 분석에서 '실행 능력' 및 '비전 완성도' 항목 내 최고 평가 오라클은 오라클 퓨전 클라우드 ERP가 가트너가 최근 발표한 ‘2022 가트너 매직 쿼드런트 서비스 중심 기업 전용 클라우드 ERP’ 부문에...
    Date2022.08.03 Bynewsit Views586
    Read More
  13. 안랩, ‘정교한 피싱 메일 활용한 악성코드 유포’ 주의보

    - 상호소통형 피싱 메일: 자문요청 메일 먼저 보낸 후 사용자가 긍정적인 답변할 경우에 한해 악성 문서파일 다운로드 URL 포함한 답장 회신 - 업무 요청형 피싱 메일: 구매 주문과 관련된 내용의 메일 속 첨부파일(.html) 실행 시 실제 포털사이트와 유사하게...
    Date2022.08.03 Bynewsit Views322
    Read More
  14.   밀워키, 8월부터 두 달간 ‘썸머 페스티벌’ 구매 인증 이벤트

    - 멀티커터 세트, 팩아웃 진공청소기, 선풍기 등 구매 금액별 100% 사은품 증정 - 온라인·오프라인 구매 상관없이 영수증 인증으로 이벤트 참여 가능 밀워키는 제품을 구매한 고객을 대상으로 여름맞이 사은 이벤트 ‘밀워키 썸머 페스티벌’을 진행한다고 2일 ...
    Date2022.08.02 Bynewsit Views364
    Read More
  15. 사이냅소프트, 투비웨이와 'OCR 이용 RPA 협력' MOU 체결

    사이냅소프트는 엔터프라이즈 데이터 관리 전문 기업 투비웨이와 전략적 사업 협력을 위한 업무 협약을 체결했다고 2일 밝혔다. 사이냅소프트 마곡 본사에서 열린 업무 협약식에는 사이냅소프트 전경헌 대표와 투비웨이 오세창 대표를 포함한 양사 주요 관계자...
    Date2022.08.02 Bynewsit Views624
    Read More
  16. No Image

    유니버설 로봇, “2분기 매출 8,300만 달러, 전년 대비 8% 성장”

    협동로봇 기업 유니버설 로봇(Universal Robots)이 금일 2022년 2분기 매출액으로 8300만 달러(약 1,079억)를 기록하며 호실적을 거두었다고 밝혔다. 이는 전년 동기 대비 8% 성장(덴마크 크로네 기준 22%) 했으며, 2021년 상반기 대비 30% 성장했다. 유니버설...
    Date2022.08.02 Bynewsit Views606
    Read More
  17. 다날 워너아이-케이비앤시, 신개념 데이터 쇼핑몰 ‘위샵’ 오픈

    - MOU 체결, 데이터 쇼핑 활성화 위해 적극 협력키로 - 빅데이터 및 마케팅 절감 비용을 고객 혜택으로 확대 다날의 계열사 워너아이는 이커머스 플랫폼 전문기업인 케이비앤시와 제휴를 맺고 개인의 관심사와 생각 등 데이터에 기반한 신개념 쇼핑몰 ‘위샵’ ...
    Date2022.08.02 Bynewsit Views638
    Read More
  18. 가트너, “2022년 전 세계 RPA 소프트웨어 매출 29억 달러로 전년 대비 19.5% 증가“

    - 2022년 전 세계 RPA 소프트웨어 매출 전년대비 19.5% 증가 - RPA 활용해 비즈니스 프로세스 자동화 이니셔티브와 디지털 전환 계획 가속화 - RPA 공급업체, 초자동화(hyperautomation) 지원 기술로 경쟁력 제고 가트너는 2022년 전 세계 로보틱 프로세스 자...
    Date2022.08.02 Bynewsit Views531
    Read More
  19. 슈나이더 일렉트릭 코리아, 산업현장 안전을 위한 전기·화재 예방 솔루션 제공

    - 중대재해처벌법 시행으로 안전사고에 대한 기업들의 책임감 가중 - 전기· 화재 사고에 대비한 예지 보전 솔루션 도입으로 사업장 안전성 강화 슈나이더 일렉트릭 코리아는 중대재해처벌법에 따라 강화된 산업재해 규제에 대응할 수 있는 전기·화재 사고 예방...
    Date2022.08.02 Bynewsit Views570
    Read More
  20. 이글루코퍼레이션, KISA ‘사이버보안 인공지능 데이터셋 구축 사업’ 수주

    - 한국인터넷진흥원 ‘사이버보안 인공지능 데이터셋(능동형 보안관제 분야)’ 구축 사업 수주 - 데이터 중심 AI 역량 토대로 데이터 사업 전개 박차 이글루코퍼레이션이 KISA 사이버보안 AI 데이터셋 구축 사업을 연이어 수주하며 데이터 사업 확장에 속도를 붙...
    Date2022.08.02 Bynewsit Views334
    Read More
Board Pagination Prev 1 ... 253 254 255 256 257 258 259 260 261 262 ... 268 Next
/ 268
CLOSE