- 엔비디아 A100 GPU, 99점의 백분위 점수로 낮은 지연시간 기록

- 백테스팅, 시뮬레이션 등 워크로드 처리량과 에너지 효율 부분에서 압도적인 성능 제공

엔비디아 A100, 금융 서비스 부문 추론 벤치마크에서 최고 성능 기록.jpg

엔비디아는 슈퍼마이크로 서버의 엔비디아(NVIDIA) A100 텐서 코어 GPU가 최신 STAC-ML 마켓 벤치마크의 추론 부문에서 최고 성능을 기록했다고 밝혔다. STAC-ML은 금융 서비스 관련 기술의 성능을 측정하는 주요 벤치마크이다.

 

엔비디아 A100 GPU는 가장 까다로운 모델에서 초당 수천 개의 추론을 제공하는 등 처리량 면에서 타의 추종을 불허하는 결과를 달성하는 한편, 최신 STAC-ML 추론 표준의 지연시간(latency) 부문에서도 선두에 올랐다.

 

여러 금융 기관들이 근소한 차로 엔비디아의 다음 순위에 올랐다. 최근 조사에 따르면 이들 금융 기관의 4분의 3이 머신 러닝이나 딥 러닝, 고성능 컴퓨팅에 의존하고 있다.

 

엔비디아 A100, 지연시간 부문 선두 기록

STAC-ML 추론 벤치마크는 장단기 메모리(LSTM) 모델 추론의 지연시간을 측정하도록 설계됐다. 여기서 지연시간은 새로운 인풋 데이터를 받아 모델의 아웃풋이 연산되기까지 걸리는 시간을 의미하며, LSTM은 자산 가격과 같은 금융 시계열 데이터의 발견에 주로 사용되는 모델이다. STAC 벤치마크에는 복잡성이 증가하는 LSTM 모델 세 개가 포함됐다. 슈퍼마이크로 울트라 슈퍼서버(Ultra SuperServer)에서 구동되는 엔비디아 A100 GPU99점의 백분위 점수로 낮은 지연시간을 기록했다.

 

STAC-MLSTAC-A2, STAC-A3 벤치마크와 가속 컴퓨팅

엔비디아 A100STAC-ML 추론을 비롯해 STAC-A2 옵션 가격 예시(discovery) 벤치마크와 STAC-A3 모델 백테스팅(backtesting) 벤치마크에서 기록적인 성능을 달성했다. 이를 통해 엔비디아 AI 컴퓨팅이 오늘날 거래 환경의 파이프라인을 가속할 수 있음을 입증했다. 나아가 금융 기관에 최고의 성능과 워크로드의 다기능성을 제공할 수 있는 A100 GPU의 역량을 증명했다.

 

예측 가능한 성능과 지속적인 낮은 지연시간

금융 부문에서 예측 가능한 성능과 그에 따른 낮은 지연시간 환경을 구축하는 것은 매우 중요하다. 급박하게 돌아가는 시장 상황에서 과도한 이상값(outlier)은 상당한 손실을 초래할 수 있기 때문. 엔비디아는 그 지연시간에 큰 이상값이 없었다는 점에서 이목을 끌었다. LSTM모델 일체와 다수의 모델 인스턴스(동시 인스턴스 수 최대 32)에서 최대 지연시간이 중간값의 2.3배를 넘지 않았다.

 

한편 엔비디아는 STAC 타카나 스위트(Tacana Suite) 벤치마크의 성능 결과를 최초로 제출했다. 타카나 스위트는 각 추론 작업에 새로운 시간 단계(timestep)가 추가되고 가장 오래된 것은 제거되는 슬라이딩 윈도에서 추론을 실행한다. 따라서 시장 데이터의 업데이트 전체에서 추론을 수행해야 하는 초단타 매매에 유용한 것으로 알려져 있다.

 

수마코(Sumaco) 스위트의 경우 각 추론이 완전히 새로운 데이터 세트에서 실행되며, 이벤트에 따라 최근의 기록을 기반으로 추론을 진행해야 하는 활용 사례가 대표적이다.

 

우수한 처리량

엔비디아는 FP16 정밀도의 수마코 스위트용으로 동일한 하드웨어에서 처리량을 최적화한 구성을 제출했다. 벤치마크 모델 중 복잡성이 가장 덜한 LSTM에서 슈퍼마이크로 서버의 A100 GPU는 초당 170만 개 이상의 추론이 실행되도록 도왔다. 가장 복잡한 LSTM의 경우에도 초당 12,800개의 추론을 처리했다.

 

엔비디아 A100의 성능과 다기능성

엔비디아 GPU는 전자 거래 스택의 소유 총비용(TCO) 절감에도 활용될 수 있다. 일례로 엔비디아 AI는 단일 플랫폼에서 훈련과 추론을 실행하며 AI 모델의 개발과 백테스팅, 배포의 전 단계에서 최고의 성능을 제공한다. 따라서 개발자의 입장에서는 연구와 거래를 위해 서로 다른 프로그래밍 언어와 프레임워크를 배울 필요가 없다.

 

또한, 엔비디아 쿠다(CUDA) 프로그래밍 모델은 GPU 가속 임베디드 시스템, 데스크톱 워크스테이션, 엔터프라이즈 데이터센터, 클라우드 기반 플랫폼, HPC 슈퍼컴퓨터 전반에 걸쳐 애플리케이션의 개발과 최적화, 배포를 지원한다.

 

효율 개선을 통한 운영비 절감

금융 서비스 업계는 데이터 처리량의 개선과 더불어 운영 효율의 향상을 통해 이익을 창출할 수 있다. 가령 데이터센터 내 시스템들의 에너지와 평방 피트당 사용량을 줄이는 것으로 운영비 지출을 크게 줄일 수 있는데, 이는 새로운 고성능 시스템의 비용 문제로 고민하는 IT 조직들에게 특히 중요한 부분이다.

 

엔비디아 A100은 가장 까다로운 LSTM 모델에서 1킬로와트 기준으로 초당 17,700개가 넘는 추론을 처리하면서 722와트의 전력을 소비해 최고의 에너지 효율을 보였다. 엔비디아 GPU는 이번 벤치마크 결과를 통해 GPU가 백테스팅과 시뮬레이션 같은 워크로드의 처리량과 에너지 효율 부분에서 압도적인 성능을 제공함을 다시 한번 입증했다.

 

#엔비디아#A100#추론#

 

 
?

  1. 라이언로켓, “스포키(Sporky) 출시 일주일, 유저 데이터 15만 건 돌파”

    - 국내 최초 텍스트 명령어 입력하면 원하는 이미지 구현 가능한 TTI(Text To Image) 기술 기반 이미지 생성 AI 워크플로우 웹 플랫폼으로 유저들의 폭발적인 반응 - 기존 유저가 만든 프롬프트 활용한 이미지 생성의 선순환으로 국내 생성형 AI 기술 기업 선...
    Date2023.03.15 Bynewsit Views725
    Read More
  2. 포티넷코리아, ‘포티넷 Secure OT Summit 2023’ 성료

    - 다양한 OT 보안 전문가들과 함께 산업 전반에 걸친 OT 보안에 대한 트렌드 공유 및 유의미한 인사이트 제공 포티넷 코리아는 2023년 3월 14일(화), 서울시 중구 더 플라자 호텔에서 ‘포티넷 Secure OT Summit 2023’을 성공리에 개최했다고 밝혔다. 이번 행사...
    Date2023.03.15 Bynewsit Views451
    Read More
  3. 알서포트, 오라클 클라우드 인프라스트럭처 구축…“원격지원 서비스 운영 고도화”

    - OCI기반의 유연하고 안정적인 인프라 운영 통해 원격지원 - 화상회의 서비스 만족도 제고…기존 인프라 환경 대비 40% 비용 절감 효과 최근 국내 기업들의 오라클 클라우드를 통한 서비스 운영 고도화 성공 사례가 증가하는 가운데, 오라클은 글로벌 비대면·...
    Date2023.03.15 Bynewsit Views609
    Read More
  4. 팀뷰어, 애플망고에 AR 플랫폼 ‘프론트라인 엑스어시스트’ 공급…“원격 공장 실사 디지털 전환 지원”

    - 애플망고코리아, 산업용 AR 플랫폼 ‘프론트라인’으로 연간 약 60회의 해외 공장 비대면 실사 진행 및 출장비 약 1억 7천만 원 절감 팀뷰어(TeamViewer)가 식품 전문 수출입 컨설팅 기업 애플망고코리아에 산업용 증강 현실(AR) 솔루션인 팀뷰어 ‘프론트라인 ...
    Date2023.03.14 Bynewsit Views686
    Read More
  5. NH투자증권, ‘베리타스 인포스케일’ 도입…“100만명 동시접속 대규모 매매체결 시스템 성능·안정성 강화”

    - NH투자증권, 매매체결 시스템 교체 사업에 고가용성 및 재해복구 솔루션인 베리타스 인포스케일 도입, 비즈니스 연속성 및 성능 안정화 - 최대 100만명 동시 접속 시에도 안정적으로 서비스 매매체결 서비스 제공, 대고객 서비스 강화 베리타스코리아는 NH투...
    Date2023.03.14 Bynewsit Views766
    Read More
  6. 슈나이더 일렉트릭, 2022년 지속가능성 영향(SSI) 성과 발표

    - 2022년 지속가능성 영향 목표 점수 4.70점을 넘어 4.91점 초과 달성 - SBTi에 의해 검증된 전체 가치 사슬에 대해 넷제로 목표를 달성한 최초 기업 중 하나 슈나이더 일렉트릭은 2022년 지속가능성 영향(SSI) 프로그램의 성과를 발표했다. 슈나이더 일렉트릭...
    Date2023.03.14 Bynewsit Views620
    Read More
  7. 이글루코퍼레이션, 온라인 AI 탐지모델 서비스 개발 완료...“챗GPT 연계한 국내 최초 AI 보안 서비스”

    - AI 판단 결과의 신뢰성과 이해도를 높이는 ‘설명형·생성형 AI’ 기술 접목… 4월 초 시범 서비스 오픈 - 이글루코퍼레이션, AI 포트폴리오 강화… 생성형 AI 및 AI 공격 방어 기술 연구 박차 이글루코퍼레이션은 AI가 판단한 공격 결과에 대한 신뢰성과 이해도...
    Date2023.03.14 Bynewsit Views456
    Read More
  8. 1인 가구 비중 사상 최대, “공간 활용성 높은 IT 기기 각광”

    - 전체 가구의 40%를 차지하게 된 1인 가구, 사상 최대치 기록 - 한정된 공간에서의 활용성 높은 IT 제품에 대한 수요 점점 높아지고 인기 사회의 변화와 함께 1인 가구가 늘어나면서 라이프스타일 트렌드에도 변화의 바람이 불고 있다. 행정안전부가 발간한 ‘...
    Date2023.03.13 Bynewsit Views407
    Read More
  9. 팔로알토 네트웍스, <2023 클라우드 네이티브 보안 현황 보고서> 공개…“1시간 이내에 사이버 위협 탐지 및 대응에 90%는 실패”  

    팔로알토 네트웍스는 <2023 클라우드 네이티브 보안 현황 보고서>를 발표하고, 전 세계 2500여명의 C레벨 임직원들의 응답 결과와 클라우드 도입 전략 및 현황에 대한 내용을 담았다. 다양한 규모의 조직에서 더 많은 작업을 클라우드로 이전함에 따라 상당 수...
    Date2023.03.13 Bynewsit Views535
    Read More
  10. Veeam, ‘쿠버네티스 데이터 보호’ 최고 기업 선정

    - 빔 소프트웨어, 기가옴 레이더 보고서에서 유일하게 5개 평가 지표 모두 최고 등급 받아 - 쿠버네티스 전용 관리 플랫폼 카스텐… 컨테이너 기반 백업, 복원, DR, 모빌리티 기능 제공 빔 소프트웨어가 쿠버네티스 데이터 보호에 대한 기가옴 레이더(GigaOm Ra...
    Date2023.03.13 Bynewsit Views588
    Read More
  11. 마우저, 글로벌 설계 컨테스트 ‘2023 Create the Future’ 후원

    - 인텔과 아나로그디바이스(ADI), 기술 혁신 장려 위해 20주년 행사 공동 후원 마우저 일렉트로닉스는 전 세계의 엔지니어 및 혁신가들이 미래의 훌륭한 제품을 설계하여 도전하는 제 21회 ‘Create the Future’ 설계 컨테스트를 후원한다고 밝혔다. 마우저는 ...
    Date2023.03.13 Bynewsit Views436
    Read More
  12. 마우저-TE 커넥티비티, ‘7인의 전문가가 말하는 차량 텔레매틱스 설계 고려 사항’ 전자책 발간

    마우저 일렉트로닉스는 TE 커넥티비티)와 협력하여 차량 텔레매틱스와 관련한 설계 과제를 중점적으로 다룬 새로운 전자책을 발표했다. <7인의 전문가가 말하는 차량 텔레매틱스 설계 고려 사항(7 Experts on Design Considerations for Fleet Telematics)>이...
    Date2023.03.10 Bynewsit Views572
    Read More
  13. 레이저, 풀체인지 게이밍 노트북 ‘레이저 블레이드 16·18’ 출시

    - 인텔 13세대 i9-13950HX와 엔비디아 RTX 40 시리즈 조합 - 기존 노트북과 다른 16형, 18형 대화면 디스플레이 장착 - Mini-LED를 통한 UHD 120Hz, FHD 240Hz 듀얼 해상도 지원 글로벌 게이밍 라이프 스타일 브랜드 레이저(RAZER)는 인텔 13세대 프로세서 i9-...
    Date2023.03.10 Bynewsit Views350
    Read More
  14. VMware, 멀티 클라우드 콘퍼런스 ‘VMware 익스플로어 코리아’ 개최

    - 4월 6일 삼성동 그랜드 인터컨티넨탈 서울 파르나스 그랜드볼룸에서 개최 - 키트 콜버트 VMware 수석 부사장 겸 최고 기술 책임자 기조 연설 발표 - 고객 및 파트너 ‘클라우드 스마트’ 도약 위한 성공적인 멀티 클라우드 운영 방안 공유 VMware 코리아가 오...
    Date2023.03.10 Bynewsit Views727
    Read More
  15. 써모스, 봄 맞이 캠핑 시즌 겨냥 ‘트래블 킹’ 시리즈 신제품 출시  

    - 캠핑, 나들이 등 야외활동에 최적화된 아웃도어 제품 ‘트래블 킹’ 시리즈 신제품 선보여 - 캠핑 장비들과 잘 어울리는 샌드블랙과 아이보리블랙 컬러로 트렌드와 감성 모두 잡아 글로벌 보온병 브랜드 써모스가 봄을 맞아 캠핑, 나들이 등 야외활동에 최적화...
    Date2023.03.09 Bynewsit Views426
    Read More
  16. 인비전 에너지, 신형 스마트 풍력 터빈 개발에 ‘ADI MEMS 센서’ 기술 채택

    아나로그디바이스는 세계적인 친환경 기술 기업 인비전 그룹(Envision Group)의 자회사 인비전 에너지(Envision Energy)가 자사의 신형 스마트 풍력 터빈 개발에 ADI의 MEMS 센서 기술을 채택했다고 밝혔다. 이번 협업의 초기 목표 중에는 보다 안전한 풍력 발...
    Date2023.03.09 Bynewsit Views643
    Read More
  17. 슈나이더 일렉트릭, 데이터센터 관리 백서 발표…“하이브리드 IT 관리 문제 해결 방법 제시“

    - 데이터센터와 IT 현장의 정보를 통합해 고객에게 전력, 에너지 비용, 랙 공간 등 다양한 정보 제공 - 모바일에서도 실시간으로 데이터센터를 모니터링해 문제 발생 시 즉각적인 대처 가능 슈나이더 일렉트릭이 하이브리드 IT 환경에서 발생하는 DCIM(Data Ce...
    Date2023.03.09 Bynewsit Views743
    Read More
  18. ST, 새로운 STM32 마이크로프로세서 「STM32MP13」 출시…“첨단 커넥티드 기기의 성능과 전력, 비용 최적화”

    - STM32MP13, 비용에 민감한 싱글 코어 디바이스 신제품에 추가 성능과 보안이 강화된 아키텍처, 에너지 효율성을 제공해 기존 임베디드 MCU 숙제 해결 ST마이크로일렉트로닉스가 최신 STM32 마이크로프로세서 STM32MP13을 출시하고, 안전하고 지속가능한 생활...
    Date2023.03.09 Bynewsit Views464
    Read More
  19. 엔비디아, 'GTC 2023' 개최…“한국 개발자 위한 스페셜 데이”

    - 3월 20일부터 24일까지 진행, 젠슨 황 기조 연설부터 650개 이상 세션 공개 - 3월 24일, 한국 개발자를 위한 Korea AI Day 마련 엔비디아가 3월 20일부터 24일까지 엔비디아 GTC 2023 콘퍼런스를 개최한다고 밝혔다. 엔비디아 GTC는 AI와 메타버스 시대를 위...
    Date2023.03.09 Bynewsit Views887
    Read More
  20. 윈드리버-엘리사, 자동화 엣지 클라우드 인프라 구축…“유럽 최초 도심지역 대규모 5G 상용화 주도“

    윈드리버는 핀란드 통신사업자 엘리사(Elisa)와 함께 유럽 최초의 완전 자동화 된 5G 분산 엣지 클라우드 구축을 완료했다고 밝혔다. 양사의 5G 분산 코어 플랫폼은 대규모의 5G 구축을 가속화하고, 유럽 전역의 디지털 트랜스포메이션이 빠르게 확산될 수 있...
    Date2023.03.09 Bynewsit Views498
    Read More
Board Pagination Prev 1 ... 232 233 234 235 236 237 238 239 240 241 ... 288 Next
/ 288
CLOSE