- 엔비디아 A100 GPU, 99점의 백분위 점수로 낮은 지연시간 기록

- 백테스팅, 시뮬레이션 등 워크로드 처리량과 에너지 효율 부분에서 압도적인 성능 제공

엔비디아 A100, 금융 서비스 부문 추론 벤치마크에서 최고 성능 기록.jpg

엔비디아는 슈퍼마이크로 서버의 엔비디아(NVIDIA) A100 텐서 코어 GPU가 최신 STAC-ML 마켓 벤치마크의 추론 부문에서 최고 성능을 기록했다고 밝혔다. STAC-ML은 금융 서비스 관련 기술의 성능을 측정하는 주요 벤치마크이다.

 

엔비디아 A100 GPU는 가장 까다로운 모델에서 초당 수천 개의 추론을 제공하는 등 처리량 면에서 타의 추종을 불허하는 결과를 달성하는 한편, 최신 STAC-ML 추론 표준의 지연시간(latency) 부문에서도 선두에 올랐다.

 

여러 금융 기관들이 근소한 차로 엔비디아의 다음 순위에 올랐다. 최근 조사에 따르면 이들 금융 기관의 4분의 3이 머신 러닝이나 딥 러닝, 고성능 컴퓨팅에 의존하고 있다.

 

엔비디아 A100, 지연시간 부문 선두 기록

STAC-ML 추론 벤치마크는 장단기 메모리(LSTM) 모델 추론의 지연시간을 측정하도록 설계됐다. 여기서 지연시간은 새로운 인풋 데이터를 받아 모델의 아웃풋이 연산되기까지 걸리는 시간을 의미하며, LSTM은 자산 가격과 같은 금융 시계열 데이터의 발견에 주로 사용되는 모델이다. STAC 벤치마크에는 복잡성이 증가하는 LSTM 모델 세 개가 포함됐다. 슈퍼마이크로 울트라 슈퍼서버(Ultra SuperServer)에서 구동되는 엔비디아 A100 GPU99점의 백분위 점수로 낮은 지연시간을 기록했다.

 

STAC-MLSTAC-A2, STAC-A3 벤치마크와 가속 컴퓨팅

엔비디아 A100STAC-ML 추론을 비롯해 STAC-A2 옵션 가격 예시(discovery) 벤치마크와 STAC-A3 모델 백테스팅(backtesting) 벤치마크에서 기록적인 성능을 달성했다. 이를 통해 엔비디아 AI 컴퓨팅이 오늘날 거래 환경의 파이프라인을 가속할 수 있음을 입증했다. 나아가 금융 기관에 최고의 성능과 워크로드의 다기능성을 제공할 수 있는 A100 GPU의 역량을 증명했다.

 

예측 가능한 성능과 지속적인 낮은 지연시간

금융 부문에서 예측 가능한 성능과 그에 따른 낮은 지연시간 환경을 구축하는 것은 매우 중요하다. 급박하게 돌아가는 시장 상황에서 과도한 이상값(outlier)은 상당한 손실을 초래할 수 있기 때문. 엔비디아는 그 지연시간에 큰 이상값이 없었다는 점에서 이목을 끌었다. LSTM모델 일체와 다수의 모델 인스턴스(동시 인스턴스 수 최대 32)에서 최대 지연시간이 중간값의 2.3배를 넘지 않았다.

 

한편 엔비디아는 STAC 타카나 스위트(Tacana Suite) 벤치마크의 성능 결과를 최초로 제출했다. 타카나 스위트는 각 추론 작업에 새로운 시간 단계(timestep)가 추가되고 가장 오래된 것은 제거되는 슬라이딩 윈도에서 추론을 실행한다. 따라서 시장 데이터의 업데이트 전체에서 추론을 수행해야 하는 초단타 매매에 유용한 것으로 알려져 있다.

 

수마코(Sumaco) 스위트의 경우 각 추론이 완전히 새로운 데이터 세트에서 실행되며, 이벤트에 따라 최근의 기록을 기반으로 추론을 진행해야 하는 활용 사례가 대표적이다.

 

우수한 처리량

엔비디아는 FP16 정밀도의 수마코 스위트용으로 동일한 하드웨어에서 처리량을 최적화한 구성을 제출했다. 벤치마크 모델 중 복잡성이 가장 덜한 LSTM에서 슈퍼마이크로 서버의 A100 GPU는 초당 170만 개 이상의 추론이 실행되도록 도왔다. 가장 복잡한 LSTM의 경우에도 초당 12,800개의 추론을 처리했다.

 

엔비디아 A100의 성능과 다기능성

엔비디아 GPU는 전자 거래 스택의 소유 총비용(TCO) 절감에도 활용될 수 있다. 일례로 엔비디아 AI는 단일 플랫폼에서 훈련과 추론을 실행하며 AI 모델의 개발과 백테스팅, 배포의 전 단계에서 최고의 성능을 제공한다. 따라서 개발자의 입장에서는 연구와 거래를 위해 서로 다른 프로그래밍 언어와 프레임워크를 배울 필요가 없다.

 

또한, 엔비디아 쿠다(CUDA) 프로그래밍 모델은 GPU 가속 임베디드 시스템, 데스크톱 워크스테이션, 엔터프라이즈 데이터센터, 클라우드 기반 플랫폼, HPC 슈퍼컴퓨터 전반에 걸쳐 애플리케이션의 개발과 최적화, 배포를 지원한다.

 

효율 개선을 통한 운영비 절감

금융 서비스 업계는 데이터 처리량의 개선과 더불어 운영 효율의 향상을 통해 이익을 창출할 수 있다. 가령 데이터센터 내 시스템들의 에너지와 평방 피트당 사용량을 줄이는 것으로 운영비 지출을 크게 줄일 수 있는데, 이는 새로운 고성능 시스템의 비용 문제로 고민하는 IT 조직들에게 특히 중요한 부분이다.

 

엔비디아 A100은 가장 까다로운 LSTM 모델에서 1킬로와트 기준으로 초당 17,700개가 넘는 추론을 처리하면서 722와트의 전력을 소비해 최고의 에너지 효율을 보였다. 엔비디아 GPU는 이번 벤치마크 결과를 통해 GPU가 백테스팅과 시뮬레이션 같은 워크로드의 처리량과 에너지 효율 부분에서 압도적인 성능을 제공함을 다시 한번 입증했다.

 

#엔비디아#A100#추론#

 

 
?

  1. 안데스-IAR, 일리텍 TDDI ILI6600A SoC 개발 지원

    안데스 테크놀로지(Andes Technology)와 IAR은 일리텍(ILITEK)의 터치·디스플레이 드라이버 통합(TDDI) ILI6600A SoC가 최첨단 차량의 기능 안전성을 지원하기 위해 V5 RISC-V CPU 코어 및 RISC-V용 IAR 인증 임베디드 워크벤치 툴체인을 채택했다고 공동 발표...
    Date2023.03.03 Bynewsit Views506
    Read More
  2. ST, 고집적 32채널 초음파 트랜스미터 「STHVUP32」 출시…“휴대용 스캐너에 최적화“

    ST마이크로일렉트로닉스가 높은 출력 전류로 휴대용 애플리케이션을 지원하는 32채널 모델을 출시하고 첨단 초음파 트랜스미터 제품군을 확장한다고 밝혔다. 새로운 트랜스미터 STHVUP32는 ±800mA를 제공하며, 이는 동축 케이블 장착 프로브를 위해 추가 드라...
    Date2023.03.03 Bynewsit Views514
    Read More
  3. 가민, 차세대 러닝 GPS 스마트워치 ‘포러너 265’ 시리즈와 ‘포러너 965’ 출시

    - 포러너 265 시리즈, 1.3인치의 밝고 선명한 아몰레드(AMOLED) 디스플레이 탑재 - 포러너 965, 티타늄 베젤로 구성되고 추가적인 고급 트레이닝 기능 제공 - 5버튼 디자인에 터치스크린 인터페이스가 더해져 유저 편의성 증대 - 전문적인 트레이닝 기능과 광...
    Date2023.03.03 Bynewsit Views399
    Read More
  4. 멘로시큐리티, 2년 연속 ‘CRN 보안 100대 기업’ 선정

    - 2년 연속 상위 20대 기업에 선정 - 선도적인 보안 기업으로서 솔루션 공급 채널 파트너사를 지원하고 선구적인 혁신 기술과 솔루션을 제공 클라우드 보안 리더 멘로시큐리티는 오늘 CRN ‘2022 보안 100(Security 100) 대 기업’ 목록에 선정되었다고 발표했다...
    Date2023.03.03 Bynewsit Views499
    Read More
  5. 인텔코리아, 13세대 인텔 코어 모바일 프로세서 세부 라인업 공개…“국내 노트북 시장 공략 본격화”  

    - 13세대 인텔 코어 모바일 프로세서 제품 세부 라인업 및 사양 공개… “세계 최고 수준의 성능 제공” - 노트북과 핸드폰 상호 연동 경험 제공하는 ‘인텔 유니슨’ 등 인텔의 노트북 인증 규격 인텔 이보(Evo) 프로그램 업데이트 발표 인텔코리아는 2일 13세대 ...
    Date2023.03.03 Bynewsit Views311
    Read More
  6. 마우저, 인피니언 'XENSIV 커넥티드' 센서 키트 제품 공급

    마우저 일렉트로닉스는 인피니언의 XENSIV KIT CSK PASCO2 및 XENSIV KIT CSK BGT60TR13C 커넥티드 센서 키트(CSK)를 공급한다고 밝혔다. XENSIV 커넥티드 센서 키트는 IoT 디바이스용으로 바로 사용 가능한 센서 개발 플랫폼을 제공한다. CSK 플랫폼을 사용하...
    Date2023.03.02 Bynewsit Views599
    Read More
  7. ADI, O-RAN 정책 연합(ORPC) 리셉션 개최

    아나로그디바이스(ADI)는 MWC 2023 기간 중 대규모 O-RAN(Open RAN) 행사의 일환으로 ‘개방형 무선 접속망 정책 연합(Open RAN Policy Coalition)’ 교류 행사를 개최했다고 밝혔다. ORPC는 개방적이고 상호운용 가능한 무선 접속망(RAN) 솔루션의 광범위한 채...
    Date2023.03.02 Bynewsit Views464
    Read More
  8. ST, 광범위한 안테나 매칭 RF IPD 제품군 발표…“STM32WL MCU 지원”

    ST마이크로일렉트로닉스가 STM32WL 무선 MCU에 최적화된 안테나 임피던스 매칭 및, 발룬, 고조파 필터 회로를 통합해 9종의 RF IPD를 출시하고, 관리를 위한 Cortex-M0+ 코어를 통합해 스마트 커넥티드 기기를 위한 애플리케이션 레벨 프로세싱과 무선 통신 기...
    Date2023.03.02 Bynewsit Views496
    Read More
  9. 바이코, ‘애브넷’과 글로벌 유통 계약 체결…“획기적 솔루션 및 서비스 확장”  

    바이코(Vicor)는 전자 부품 및 서비스를 유통하는 애브넷(Avnet)과 유통 계약을 체결했다고 밝히고, 세계적으로 손꼽히는 애브넷의 설계 및 공급망을 통해 바이코 전력 모듈을 더 널리 유통함으로써 전 세계 고객이 시스템 성능과 확장성 측면에서 획기적인 혁...
    Date2023.03.02 Bynewsit Views524
    Read More
  10. [MWC 2023] 화웨이, 선도적인 5.5G 신규 솔루션 발표…”5.5G 시대의 성공적인 비즈니스 지원”

    화웨이가 MWC 바르셀로나 2023에서 5.5G 시대를 선도하기 위한 기술과 솔루션을 발표하고 이동통신사가 주목해야 할 비즈니스 기회를 공유했다. 먼저 화웨이는 5.5G 시대의 주요 특징으로 10기가비트 경험, 올 시나리오 사물인터넷(all scenario IoT), 통합적...
    Date2023.03.02 Bynewsit Views485
    Read More
  11. EDB, 오픈소스 DBMS ‘EDB PGD 5.0’ 발표

    - 높은 고가용성 보장과 운영 안정성, 확장성 및 재해 복구를 지원하고, 주요 비즈니스 애플리케이션과 데이터 서비스 다운타임을 최소화 오픈소스 PostgreSQL의 최대 지원 기업 EDB는 오늘 주요 비즈니스 애플리케이션과 데이터 액세스의 다운타임을 최소화하...
    Date2023.03.02 Bynewsit Views655
    Read More
  12. Veeam, 마이크로소프트 365용 「빔 백업 v7」 공개…“사이버 공격과 장애 대비“  

    - 사이버 공격, 장애 대비 변경불가 백업 등 데이터 보호 기능 제공… BaaS 제어 기능 향상 - 빔 원, 빔 서비스 공급자 콘솔과의 통합 기능 제공… 문제를 사전에 해결하고 규정 준수를 지원 - 셀프 서비스 복원 포털을 통해 스스로 개별 복원 지점을 선택하고 ...
    Date2023.03.02 Bynewsit Views736
    Read More
  13. 와콤, 학생 구매자 대상 ‘와콤 신학기 프로모션’ 이벤트

    - 와콤 타블렛 구매한 학생 고객 전원에게 사은품 증정 - 와콤 원, 와콤 인튜어스, 와콤 신티크 등 8종 구매 고객 대상 혜택 제공 - 오는 3월 23일(목)까지 공식 온라인스토어 및 온오프라인 판매처에서 동시 진행 - 학업과 개인시간 모두 다양한 활용이 가능...
    Date2023.03.02 Bynewsit Views353
    Read More
  14. HPE, 차세대 데이터 스토리지 서버 ‘HPE 알레트라 4000’ 시리즈 출시

    - 클라우드 네이티브 데이터 인프라스트럭처 솔루션 내 최초의 서버 기반 제품 - 설계에서부터 강화된 엔드-투-엔드 보안 및 직관적인 클라우드 경험으로 더욱 쉬워진 운영 관리 HPE가 차세대 데이터 스토리지 서버인 HPE 알레트라 4000(HPE Alletra 4000) 시...
    Date2023.02.28 Bynewsit Views385
    Read More
  15. [MWC 2023] 화웨이, 친환경과 발전을 모두 아우르는 ‘그린 1-2-3 솔루션’ 발표

    화웨이는 MWC 바르셀로나 2023에서 ‘화웨이 그린 ICT 서밋(Huawei Green ICT Summit)’을 개최하고, 화웨이 ICT 전략 및 마케팅 부문 펑 송(Peng Song) 사장은 ‘친환경과 발전, 선택 아닌 필수(Green & Development, Choosing Not to Choose)’라는 주제로 기조...
    Date2023.02.28 Bynewsit Views514
    Read More
  16. 벤큐, 전자칠판 인증 캠페인 ‘클래스룸케어 인증점’ 전국 400호점 돌파!

    - 클래스룸케어 인증점 400호 돌파 기념 기프트박스 증정 프로모션 3월 한 달간 진행 벤큐(BenQ)가 클래스룸케어 인증점 400호점 돌파 기념으로 3월 한 달간 전자칠판 구매자 대상 기프트박스 증정 프로모션을 진행한다고 밝혔다. 이번 프로모션은 3월 1일부터...
    Date2023.02.28 Bynewsit Views377
    Read More
  17. 노르딕 세미컨덕터, 새로운 「nPM1100」 전력관리 IC 3종 출시…“광범위한 무선 애플리케이션 지원”

    - 웨어러블 및 게임용 마우스, 인이어 헤드폰용 배터리 충전 케이스 등의 애플리케이션에 유용 노르딕 세미컨덕터는 자사의 nPM1100 전력관리 IC 제품군에 새로운 3종의 제품을 추가했다고 밝혔다. 이 제품군은 지금까지 초소형 CSP 패키지(2.1 x 2.1mm)로만 ...
    Date2023.02.28 Bynewsit Views402
    Read More
  18. 인포빕, 스푼라디오에 글로벌 SMS 인증 솔루션 지원

    - 소셜 OTP 인증 서비스 대체, 휴대전화로 가입 절차 간소화 최적 UX 제공 - 500ms 안에 SMS 전송해 가입 과정 진행 중 이탈 80% 감소 - 비용 효율성을 높여 매월 운영비 최대 80% 절감 - 전 세계 70여 개 지사, 650여 개 이통사 협업 통해 현지 규제 준수와 ...
    Date2023.02.28 Bynewsit Views676
    Read More
  19. 스파이런트, 통합 O-RAN 솔루션 전체 제품군 발표…“엔드투엔드 O-RAN 테스트 및 검증 간소화”

    - 뛰어난 에뮬레이션 기술과 자동화 기반으로 맞춤형 솔루션 제공 및 성공적인 테스트 보장 스파이런트 커뮤니케이션이 엔드 투 엔드, O-DU 및 RIC 테스트를 출시하며 O-RAN 테스트 솔루션 포트폴리오를 완성했다고 밝혔다. 이번 솔루션 포트폴리오는 이전에 ...
    Date2023.02.28 Bynewsit Views622
    Read More
  20. 마우저, 다양한 온라인 도구 모음 제공…“부품 선택 및 구매절차 간편화”

    마우저 일렉트로닉스는 구매자와 엔지니어가 부품 선택 및 구매 절차를 간편화 할 수 있는 온라인 도구 모음을 제공한다고 밝혔다. 마우저의 도움말 센터와 서비스 및 도구는 사용자에게 데이터 시트 요청, 주문 확인 및 추적, API 또는 EDI를 활용한 신규 주...
    Date2023.02.27 Bynewsit Views408
    Read More
Board Pagination Prev 1 ... 234 235 236 237 238 239 240 241 242 243 ... 288 Next
/ 288
CLOSE