- 엔비디아 A100 GPU, 99점의 백분위 점수로 낮은 지연시간 기록

- 백테스팅, 시뮬레이션 등 워크로드 처리량과 에너지 효율 부분에서 압도적인 성능 제공

엔비디아 A100, 금융 서비스 부문 추론 벤치마크에서 최고 성능 기록.jpg

엔비디아는 슈퍼마이크로 서버의 엔비디아(NVIDIA) A100 텐서 코어 GPU가 최신 STAC-ML 마켓 벤치마크의 추론 부문에서 최고 성능을 기록했다고 밝혔다. STAC-ML은 금융 서비스 관련 기술의 성능을 측정하는 주요 벤치마크이다.

 

엔비디아 A100 GPU는 가장 까다로운 모델에서 초당 수천 개의 추론을 제공하는 등 처리량 면에서 타의 추종을 불허하는 결과를 달성하는 한편, 최신 STAC-ML 추론 표준의 지연시간(latency) 부문에서도 선두에 올랐다.

 

여러 금융 기관들이 근소한 차로 엔비디아의 다음 순위에 올랐다. 최근 조사에 따르면 이들 금융 기관의 4분의 3이 머신 러닝이나 딥 러닝, 고성능 컴퓨팅에 의존하고 있다.

 

엔비디아 A100, 지연시간 부문 선두 기록

STAC-ML 추론 벤치마크는 장단기 메모리(LSTM) 모델 추론의 지연시간을 측정하도록 설계됐다. 여기서 지연시간은 새로운 인풋 데이터를 받아 모델의 아웃풋이 연산되기까지 걸리는 시간을 의미하며, LSTM은 자산 가격과 같은 금융 시계열 데이터의 발견에 주로 사용되는 모델이다. STAC 벤치마크에는 복잡성이 증가하는 LSTM 모델 세 개가 포함됐다. 슈퍼마이크로 울트라 슈퍼서버(Ultra SuperServer)에서 구동되는 엔비디아 A100 GPU99점의 백분위 점수로 낮은 지연시간을 기록했다.

 

STAC-MLSTAC-A2, STAC-A3 벤치마크와 가속 컴퓨팅

엔비디아 A100STAC-ML 추론을 비롯해 STAC-A2 옵션 가격 예시(discovery) 벤치마크와 STAC-A3 모델 백테스팅(backtesting) 벤치마크에서 기록적인 성능을 달성했다. 이를 통해 엔비디아 AI 컴퓨팅이 오늘날 거래 환경의 파이프라인을 가속할 수 있음을 입증했다. 나아가 금융 기관에 최고의 성능과 워크로드의 다기능성을 제공할 수 있는 A100 GPU의 역량을 증명했다.

 

예측 가능한 성능과 지속적인 낮은 지연시간

금융 부문에서 예측 가능한 성능과 그에 따른 낮은 지연시간 환경을 구축하는 것은 매우 중요하다. 급박하게 돌아가는 시장 상황에서 과도한 이상값(outlier)은 상당한 손실을 초래할 수 있기 때문. 엔비디아는 그 지연시간에 큰 이상값이 없었다는 점에서 이목을 끌었다. LSTM모델 일체와 다수의 모델 인스턴스(동시 인스턴스 수 최대 32)에서 최대 지연시간이 중간값의 2.3배를 넘지 않았다.

 

한편 엔비디아는 STAC 타카나 스위트(Tacana Suite) 벤치마크의 성능 결과를 최초로 제출했다. 타카나 스위트는 각 추론 작업에 새로운 시간 단계(timestep)가 추가되고 가장 오래된 것은 제거되는 슬라이딩 윈도에서 추론을 실행한다. 따라서 시장 데이터의 업데이트 전체에서 추론을 수행해야 하는 초단타 매매에 유용한 것으로 알려져 있다.

 

수마코(Sumaco) 스위트의 경우 각 추론이 완전히 새로운 데이터 세트에서 실행되며, 이벤트에 따라 최근의 기록을 기반으로 추론을 진행해야 하는 활용 사례가 대표적이다.

 

우수한 처리량

엔비디아는 FP16 정밀도의 수마코 스위트용으로 동일한 하드웨어에서 처리량을 최적화한 구성을 제출했다. 벤치마크 모델 중 복잡성이 가장 덜한 LSTM에서 슈퍼마이크로 서버의 A100 GPU는 초당 170만 개 이상의 추론이 실행되도록 도왔다. 가장 복잡한 LSTM의 경우에도 초당 12,800개의 추론을 처리했다.

 

엔비디아 A100의 성능과 다기능성

엔비디아 GPU는 전자 거래 스택의 소유 총비용(TCO) 절감에도 활용될 수 있다. 일례로 엔비디아 AI는 단일 플랫폼에서 훈련과 추론을 실행하며 AI 모델의 개발과 백테스팅, 배포의 전 단계에서 최고의 성능을 제공한다. 따라서 개발자의 입장에서는 연구와 거래를 위해 서로 다른 프로그래밍 언어와 프레임워크를 배울 필요가 없다.

 

또한, 엔비디아 쿠다(CUDA) 프로그래밍 모델은 GPU 가속 임베디드 시스템, 데스크톱 워크스테이션, 엔터프라이즈 데이터센터, 클라우드 기반 플랫폼, HPC 슈퍼컴퓨터 전반에 걸쳐 애플리케이션의 개발과 최적화, 배포를 지원한다.

 

효율 개선을 통한 운영비 절감

금융 서비스 업계는 데이터 처리량의 개선과 더불어 운영 효율의 향상을 통해 이익을 창출할 수 있다. 가령 데이터센터 내 시스템들의 에너지와 평방 피트당 사용량을 줄이는 것으로 운영비 지출을 크게 줄일 수 있는데, 이는 새로운 고성능 시스템의 비용 문제로 고민하는 IT 조직들에게 특히 중요한 부분이다.

 

엔비디아 A100은 가장 까다로운 LSTM 모델에서 1킬로와트 기준으로 초당 17,700개가 넘는 추론을 처리하면서 722와트의 전력을 소비해 최고의 에너지 효율을 보였다. 엔비디아 GPU는 이번 벤치마크 결과를 통해 GPU가 백테스팅과 시뮬레이션 같은 워크로드의 처리량과 에너지 효율 부분에서 압도적인 성능을 제공함을 다시 한번 입증했다.

 

#엔비디아#A100#추론#

 

 
?

  1. 엔비디아, 비전 AI 가속화 고급 개발 도구 추가…“발전하는 메트로폴리스 생태계“

    - 1,000개 이상의 기업, 엔비디아 메트로폴리스 사용해 비전 AI로 공간과 프로섹스 혁신 - 엔비디아 메트로폴리스, 100만 회 이상 다운로드 된 개발자 도구로 구성 엔비디아가 AI 및 메타버스 시대를 위한 글로벌 컨퍼런스 GTC 2023에서 차세대 비전 AI 채택을...
    Date2023.03.23 Bynewsit Views591
    Read More
  2. 엔비디아, 아이작 소프트웨어 액세스와 젯슨 플랫폼 가용성 확대…"클라우드에서 엣지까지 로보틱스 가속화"

    - 젯슨 오린 라인업, 로보틱스를 위한 가속화된 컴퓨팅 기능 제공 - 확장 가능한 시뮬레이션을 제공하는 옴니버스 클라우드의 아이작 심(Isaac Sim), 마이크로소프트 애저(Microsoft Azure)에서 제공 엔비디아가 GTC 2023에서 옴니버스 클라우드(Omniverse Clo...
    Date2023.03.23 Bynewsit Views685
    Read More
  3.   엔비디아, 의료 기기 AI 플랫폼 구축 위해 메드트로닉과 협업

    - 메드트로닉의 실시간 AI 내시경 디바이스에 엔비디아 기술 통합 - 환자 치료 및 결과 개선 지원 엔비디아는 세계 최대 헬스케어 기술 제공업체 메드트로닉(Medtronic)과 협업을 발표하고, 헬스케어 시스템에서 AI 개발을 가속화와 환자 치료에 새로운 AI 기...
    Date2023.03.23 Bynewsit Views648
    Read More
  4. 엔비디아, ASML·TSMC·시놉시스와 차세대 칩 제조 기반 구축

    - 반도체 선도 기업들, 엔비디아의 획기적 컴퓨팅 리소그래피 기술 도입 엔비디아가 컴퓨팅 리소그래피 분야에 가속 컴퓨팅을 도입하는 획기적인 기술을 발표했다. 이를 통해 ASML, TSMC, 시놉시스(Synopsys)와 같은 반도체 선도업체들은 현재의 생산 공정이 ...
    Date2023.03.23 Bynewsit Views481
    Read More
  5. 엔비디아, 전기차 제조업체 BYD와 파트너십 체결

    - 엔비디아 드라이브 기반 상용 소프트웨어 정의 차량(SDV) 개발 추진 엔비디아는 신에너지차량(NEV) 선두 제조업체 BYD가 엔비디아 드라이브 오린(DRIVE Orin) 중앙 집중형 컴퓨팅 플랫폼 사용을 차량 전반에 걸쳐 확대할 것이라고 밝혔다. 이번 파트너십 강...
    Date2023.03.23 Bynewsit Views698
    Read More
  6. 힐셔, 컴패니언 솔루션 ‘netRAPID 90’ 제품 양산 시작

    힐셔는 netRAPID 90을 통해 고집적 필드 장치의 산업용 통신 지원용 칩 캐리어 포트폴리오를 확장한다고 밝혔다. netRAPID 90은 자체 개발한 netX90 SoC 기반의 임베디드형 모듈로, 필요한 프로토콜 스택이 제품에 사전 로드되어 테스트까지 완료된 상태로 제...
    Date2023.03.23 Bynewsit Views412
    Read More
  7. 자브라, 프리미엄 스피커폰 ‘스피크2’ 시리즈 출시

    - 자연스러운 양방향 대화가 가능한 풀 듀플렉스 오디오 - 혁신적인 노이즈 캔슬링 기능이 적용된 4개의 빔포밍 마이크 탑재 - 즉각적인 협업을 가능하게 하는 ‘플러그앤플레이(Plug&Play)’ 연결 지원 - 마이크로소프트 팀즈(Microsoft Teams), 구글 미트(Goog...
    Date2023.03.23 Bynewsit Views365
    Read More
  8. 낫싱, 업그레이드 된 무선 이어폰 ‘이어투’ 출시…“풍부한 음질과 사용자 경험”

    - Hi-Res 고해상도 음질 인증 및 업그레이드된 차세대 음성 기술 구현 - 듀얼 커넥션, 3단계 ANC기능 제공 및 Nothing X 앱으로 향상된 사용자 맞춤화 영국의 컨슈머 테크 스타트업 낫싱(Nothing)이 신제품 무선 이어폰 ‘이어투(Ear (2))’를 출시했다. 이번 신...
    Date2023.03.23 Bynewsit Views413
    Read More
  9. 슈나이더 일렉트릭 코리아, 디지털 변압기 모니터링 솔루션 ETE 출시

    - 변압기 수명 최적화를 위한 loT 기반의 디지털 모니터링 솔루션 - 사고 등으로 인한 경제적 피해를 사전 예방해 인적 및 물적 자산 보호 슈나이더 일렉트릭 코리아가 loT 기반의 디지털 변압기 모니터링 솔루션 에코스트럭처 트랜스포머 엑스퍼트(EcoStruxur...
    Date2023.03.23 Bynewsit Views757
    Read More
  10. 포레스터, 레드햇 ‘앤서블 오토메이션 플랫폼’ 인프라 자동화 분야 리더로 선정

    - 레드햇 앤서블 오토메이션 플랫폼, 전략 카테고리에서 최고점 기록…강력한 오픈소스 커뮤니티로 혁신 강화 레드햇은 레드햇 앤서블 오토메이션 플랫폼이 포레스터 리서치의 <2023년 1분기 포레스터 웨이브: 인프라 자동화(The Forrester Wave: Infrastructur...
    Date2023.03.22 Bynewsit Views764
    Read More
  11. 유아이패스, 자동화 워크플로우에 아마존 ‘세이지메이커’ 통합 · · ·“머신 러닝 모델 효용가치 극대화”

    - 유아이패스 비즈니스 오토메이션 플랫폼 신규 기능, - 비즈니스 프로세스 내 머신 러닝 모델 배포에 필요한 시간 및 비용 절감 유아이패스는 엔드 투 엔드 머신 러닝(ML) 서비스인 아마존 세이지메이커(Amazon SageMaker)를 유아이패스 솔루션에 통합해 복잡...
    Date2023.03.22 Bynewsit Views618
    Read More
  12. 마우저, NXP 에지 레디 「SLN-VIZNAS-IOT」 솔루션 제공…“3D 생체 감지 및 안면 인식 가능”

    마우저 일렉트로닉스는 NXP반도체의 안면 인식용 SLN-VIZN3D-IOT 개발 키트를 공급한다고 밝혔다. SLN-VIZNAS-IOT를 통해 개발자는 특히 스마트 홈 및 보안 시장에서 제품에 3D 생체 감지가 가능한 안면 인식 기능을 쉽고 빠르게 추가할 수 있다. NXP의 SLN-VI...
    Date2023.03.22 Bynewsit Views451
    Read More
  13. TI, Arm Cortex 기반 새로운 비전 프로세서 제품군 발표…“스마트 카메라 애플리케이션에서 확장 가능한 엣지 AI 성능 구현”  

    - 빌딩, 산업용 및 소매 자동화 애플리케이션에서 최대 12대의 카메라에 비전 및 AI 프로세싱을 비용 효율적이고 간편하게 추가 가능 텍사스 인스트루먼트(TI)는 오늘 엣지 인텔리전스의 혁신에 더욱 박차를 가하기 위해 새로운 Arm Cortex 기반 비전 프로세서...
    Date2023.03.22 Bynewsit Views563
    Read More
  14. 엔비디아, 셔터스톡과 협력해 생성형 3D 아티스트 툴 위한 AI 기반 구축

    - 엔비디아 피카소 생성형 AI 클라우드 서비스로 훈련된 맞춤형 셔터스톡 콘텐츠 - 텍스트 프롬프트로 산업용 디지털 트윈, 엔터테인먼트 및 게임용 3D를 빠르게 생성 엔비디아가 업계 최초로 셔터스톡(Shutterstock, Inc.)과 맞춤형 3D 모델을 훈련시키기 위...
    Date2023.03.22 Bynewsit Views636
    Read More
  15. 엔비디아, 블루필드 데이터센터 가속화 플랫폼 오라클 클라우드 인프라에 채택

    - 하이퍼스케일러 네트워킹 스택에 블루필드-3 DPU 추가해 CPU 데이터센터 작업 오프로드 엔비디아는 오라클 클라우드 인프라스트럭처(OCI)가 네트워킹 스택의 최신 추가 제품으로 엔비디아 블루필드-3(BlueField-3) DPU를 채택했다고 발표했다. 엔비디아 블루...
    Date2023.03.22 Bynewsit Views616
    Read More
  16. SAP, ‘그로우 위드 SAP’ 출시…“중견기업에 클라우드 ERP 이점 제공”

    SAP는 그로우 위드 SAP(GROW with SAP)를 출시하고 중견기업 고객이 속도와 예측 가능성, 지속적인 혁신 위한 클라우드 전사적자원관리(ERP)를 도입할 수 있도록 지원한다고 22일 밝혔다. SAP는 고객이 빠르게 클라우드 ERP를 구축하고 원활한 업데이트를 제공...
    Date2023.03.22 Bynewsit Views627
    Read More
  17. 한국HPE, 티맥스소프트에 HPE 그린레이크 공급…“서비스형 통합 미들웨어 플랫폼 개발”

    - 티맥스소프트, 글로벌 시장 진출을 위한 차세대 제품 개발 및 서비스 제공 위해 HPE 그린레이크 도입 - HPE 그린레이크로 새로운 인프라 도입 복잡성 해결 및 효율적인 유휴 리소스 관리 지원 - 보다 효율적인 고객 맞춤형 클라우드 솔루션 개발을 위한 발판...
    Date2023.03.22 Bynewsit Views588
    Read More
  18. 포티넷, 싱글 벤더 SASE 솔루션 ‘FortiSASE’ 서비스 확장 지원…“하이브리드 업무 환경 지원”

    - 업계 최고의 싱글 벤더 통합 SASE 솔루션인 ‘FortiSASE’를 확장 - 통합 운영체제 기반으로 에이전트 확대하여 네트워킹과 보안의 컨버전스 구현 포티넷 코리아는 오늘, 프라이빗 애플리케이션, SaaS, 인터넷 전반의 디지털 리소스에 대한 새로운 시큐어 액세...
    Date2023.03.22 Category네트워크 Bynewsit Views636
    Read More
  19. 인피니언, 저전력 디바이스용 고집적 「iMOTION IMI110」 시리즈 출시

    인피니언 테크놀로지스는 새로운 IPM 시리즈인 iMOTION IMI110을 출시한다고 밝혔다. 이 시리즈는 컴팩트한 DSO-22 패키지에 iMOTION 모션 제어 엔진(MCE)과 3상 게이트 드라이버, 600V/2A 또는 600V/4A IGBT를 통합했다. 이 고집적 모터 컨트롤러 시리즈는 소...
    Date2023.03.22 Bynewsit Views590
    Read More
  20. 콩가텍, TI 「TDA4VM」 프로세서 도입으로 전략적 솔루션 포트폴리오 확대

    - ARM Cortex 기반의 TI TDA4VM 프로세서 탑재로 SMARC 모듈을 위한 고성능 생태계 구축 - 맞춤형 설계 대비 초기 비용 절감 및 출시 속도 앞당겨 콩가텍이 텍사스 인스트루먼트(TI) 프로세서를 새롭게 도입해 ARM 프로세서 분야의 전략적 솔루션 포트폴리오를...
    Date2023.03.22 Bynewsit Views533
    Read More
Board Pagination Prev 1 ... 230 231 232 233 234 235 236 237 238 239 ... 289 Next
/ 289
CLOSE