- 엔비디아 A100 GPU, 99점의 백분위 점수로 낮은 지연시간 기록

- 백테스팅, 시뮬레이션 등 워크로드 처리량과 에너지 효율 부분에서 압도적인 성능 제공

엔비디아 A100, 금융 서비스 부문 추론 벤치마크에서 최고 성능 기록.jpg

엔비디아는 슈퍼마이크로 서버의 엔비디아(NVIDIA) A100 텐서 코어 GPU가 최신 STAC-ML 마켓 벤치마크의 추론 부문에서 최고 성능을 기록했다고 밝혔다. STAC-ML은 금융 서비스 관련 기술의 성능을 측정하는 주요 벤치마크이다.

 

엔비디아 A100 GPU는 가장 까다로운 모델에서 초당 수천 개의 추론을 제공하는 등 처리량 면에서 타의 추종을 불허하는 결과를 달성하는 한편, 최신 STAC-ML 추론 표준의 지연시간(latency) 부문에서도 선두에 올랐다.

 

여러 금융 기관들이 근소한 차로 엔비디아의 다음 순위에 올랐다. 최근 조사에 따르면 이들 금융 기관의 4분의 3이 머신 러닝이나 딥 러닝, 고성능 컴퓨팅에 의존하고 있다.

 

엔비디아 A100, 지연시간 부문 선두 기록

STAC-ML 추론 벤치마크는 장단기 메모리(LSTM) 모델 추론의 지연시간을 측정하도록 설계됐다. 여기서 지연시간은 새로운 인풋 데이터를 받아 모델의 아웃풋이 연산되기까지 걸리는 시간을 의미하며, LSTM은 자산 가격과 같은 금융 시계열 데이터의 발견에 주로 사용되는 모델이다. STAC 벤치마크에는 복잡성이 증가하는 LSTM 모델 세 개가 포함됐다. 슈퍼마이크로 울트라 슈퍼서버(Ultra SuperServer)에서 구동되는 엔비디아 A100 GPU99점의 백분위 점수로 낮은 지연시간을 기록했다.

 

STAC-MLSTAC-A2, STAC-A3 벤치마크와 가속 컴퓨팅

엔비디아 A100STAC-ML 추론을 비롯해 STAC-A2 옵션 가격 예시(discovery) 벤치마크와 STAC-A3 모델 백테스팅(backtesting) 벤치마크에서 기록적인 성능을 달성했다. 이를 통해 엔비디아 AI 컴퓨팅이 오늘날 거래 환경의 파이프라인을 가속할 수 있음을 입증했다. 나아가 금융 기관에 최고의 성능과 워크로드의 다기능성을 제공할 수 있는 A100 GPU의 역량을 증명했다.

 

예측 가능한 성능과 지속적인 낮은 지연시간

금융 부문에서 예측 가능한 성능과 그에 따른 낮은 지연시간 환경을 구축하는 것은 매우 중요하다. 급박하게 돌아가는 시장 상황에서 과도한 이상값(outlier)은 상당한 손실을 초래할 수 있기 때문. 엔비디아는 그 지연시간에 큰 이상값이 없었다는 점에서 이목을 끌었다. LSTM모델 일체와 다수의 모델 인스턴스(동시 인스턴스 수 최대 32)에서 최대 지연시간이 중간값의 2.3배를 넘지 않았다.

 

한편 엔비디아는 STAC 타카나 스위트(Tacana Suite) 벤치마크의 성능 결과를 최초로 제출했다. 타카나 스위트는 각 추론 작업에 새로운 시간 단계(timestep)가 추가되고 가장 오래된 것은 제거되는 슬라이딩 윈도에서 추론을 실행한다. 따라서 시장 데이터의 업데이트 전체에서 추론을 수행해야 하는 초단타 매매에 유용한 것으로 알려져 있다.

 

수마코(Sumaco) 스위트의 경우 각 추론이 완전히 새로운 데이터 세트에서 실행되며, 이벤트에 따라 최근의 기록을 기반으로 추론을 진행해야 하는 활용 사례가 대표적이다.

 

우수한 처리량

엔비디아는 FP16 정밀도의 수마코 스위트용으로 동일한 하드웨어에서 처리량을 최적화한 구성을 제출했다. 벤치마크 모델 중 복잡성이 가장 덜한 LSTM에서 슈퍼마이크로 서버의 A100 GPU는 초당 170만 개 이상의 추론이 실행되도록 도왔다. 가장 복잡한 LSTM의 경우에도 초당 12,800개의 추론을 처리했다.

 

엔비디아 A100의 성능과 다기능성

엔비디아 GPU는 전자 거래 스택의 소유 총비용(TCO) 절감에도 활용될 수 있다. 일례로 엔비디아 AI는 단일 플랫폼에서 훈련과 추론을 실행하며 AI 모델의 개발과 백테스팅, 배포의 전 단계에서 최고의 성능을 제공한다. 따라서 개발자의 입장에서는 연구와 거래를 위해 서로 다른 프로그래밍 언어와 프레임워크를 배울 필요가 없다.

 

또한, 엔비디아 쿠다(CUDA) 프로그래밍 모델은 GPU 가속 임베디드 시스템, 데스크톱 워크스테이션, 엔터프라이즈 데이터센터, 클라우드 기반 플랫폼, HPC 슈퍼컴퓨터 전반에 걸쳐 애플리케이션의 개발과 최적화, 배포를 지원한다.

 

효율 개선을 통한 운영비 절감

금융 서비스 업계는 데이터 처리량의 개선과 더불어 운영 효율의 향상을 통해 이익을 창출할 수 있다. 가령 데이터센터 내 시스템들의 에너지와 평방 피트당 사용량을 줄이는 것으로 운영비 지출을 크게 줄일 수 있는데, 이는 새로운 고성능 시스템의 비용 문제로 고민하는 IT 조직들에게 특히 중요한 부분이다.

 

엔비디아 A100은 가장 까다로운 LSTM 모델에서 1킬로와트 기준으로 초당 17,700개가 넘는 추론을 처리하면서 722와트의 전력을 소비해 최고의 에너지 효율을 보였다. 엔비디아 GPU는 이번 벤치마크 결과를 통해 GPU가 백테스팅과 시뮬레이션 같은 워크로드의 처리량과 에너지 효율 부분에서 압도적인 성능을 제공함을 다시 한번 입증했다.

 

#엔비디아#A100#추론#

 

 
?

  1. [MWC 2023] 화웨이, MWC 2023에서 '지능형 세상을 위한 혁신' 발표  

    화웨이가 오는 27일 스페인 바르셀로나에서 개막하는 MWC 2023에 참가해 캐리어 네트워크, 엔터프라이즈, 컨슈머 등 세 가지 주요 사업 부문의 최신 제품 및 솔루션을 전시한다. 화웨이는 이 자리에서 글로벌 통신사와 업계 전문가, 오피니언 리더와 함께 신성...
    Date2023.02.24 Bynewsit Views575
    Read More
  2. AMD 코리아, 라데온 그래픽 카드 구매 고객 대상 포토후기 이벤트

    – 2월 23일부터 라데온 RX 6000 및 RX 7000 시리즈 그래픽 카드 또는 탑재 PC 구매 고객 선착순 100명 대상으로 포토후기 작성 시 5만 원 상당의 신세계상품권 제공 AMD 코리아는 AMD 라데온(Radeon) RX 6000 및 RX 7000 시리즈 구매 고객을 대상으로 포토후기...
    Date2023.02.24 Bynewsit Views355
    Read More
  3. 가민코리아, ‘골프/아웃도어’ 브랜드위크 프로모션 이벤트

    - 스마트 기기 브랜드 가민, 오는 24일부터 3월 1일까지 ‘골프/아웃도어’ 프로모션 진행 - ‘피닉스 7’ 시리즈, ‘어프로치’ 시리즈, ‘인스팅트 2 솔라’ 등 인기 제품 최대 60% 할인 - 전국 가민 공식 브랜드샵 온·오프라인 매장 및 파트너사 온라인 몰에서 만나...
    Date2023.02.24 Bynewsit Views250
    Read More
  4. 노조미네트웍스, OT/IoT 엔드포인트 보안 센서 ‘노조미 아크(Nozomi Arc)’ 발표

    - 노조미 아크, 엔드포인트 공격 표면 전반에서 가시성을 크게 확장하고, 보안 위협을 크게 줄이며, 모든 자산과 사이트에서 배포 속도를 높여 운영 탄력성 개선 노조미네트웍스는 오늘 완전한 운영 복원력에 도달하는 시간을 기하급수적으로 단축시키는 업계 ...
    Date2023.02.24 Bynewsit Views367
    Read More
  5. 마우저, Linx 테크놀러지스 IPW 시리즈 실외용 안테나 제품 공급

    마우저 일렉트로닉스는 Linx 테크놀로지의 IPW 시리즈 러기드형 실외용 IP67 등급 다이폴 안테나 제품을 공급한다고 밝혔다. 617MHz ~ 7.1GHz의 주파수 범위와 최대 8.7dBi의 이득을 제공하는 새로운 실외용 안테나 제품은 다양한 셀룰러, 와이파이 및 LPWA/IS...
    Date2023.02.23 Bynewsit Views497
    Read More
  6. HP OMEN, 프로게임단 T1과 2023 브랜드 캠페인 전개

    - 지난 해 ‘오멘룰(OMEN Rule)’ 캠페인에 이어 2년 연속 T1과 손잡고 차별화된 마케팅 ‘박차’ - ‘진정한 실력’을 향한 T1 선수들의 포부와 다짐을 담은 영상 순차 공개, 첫 주자는 ‘페이커’ - HP OMEN, 게이밍 퍼포먼스를 극대화하는 고성능 PC로 3년 연속 LCK...
    Date2023.02.23 Bynewsit Views324
    Read More
  7. 벤큐, 프로 디자이너용 모니터암 일체형 4K 모니터 「PD2705UA/PD3205UA」 출시

    - 모니터암 일체형 프리모션 스탠드로 상하 좌우 전후 자유로운 모니터 세팅 가능 - 27, 32인치 제로베젤에 4K UHD 해상도를 지원하여 선명하고 생생한 화면 제공 - Calman, PANTONE & PANTONE SkinTone 인증, 팩토리 캘리브레이션 지원으로 정확한 색상 구현 ...
    Date2023.02.23 Bynewsit Views286
    Read More
  8. 버티브, 냉수식 냉각 솔루션버티브 「Liebert AHU」 출시

    - 최소한의 풋프린트로 높은 열 부하 지원 버티브(Vertiv)는 새롭게 업그레이드된 대용량 냉수식 냉각 솔루션 버티브 리버트 AHU(Air Handling Unit)를 출시한다고 밝혔다. Liebert AHU는 고밀도 컴퓨팅 환경에 사용하기에 적합하도록 설계되었으며, 열 관리에...
    Date2023.02.23 Bynewsit Views551
    Read More
  9. 스틸시리즈, 새로운 시즌 맞이 지마켓 프로모션 이벤트

    - 스틸시리즈 전 제품 10% 할인 쿠폰 발급 - 베스트셀러 제품, 한정판 마우스 패드 등 놓칠 수 없는 사은 혜택 까지 스틸시리즈(SteelSeries)가 3월 새로운 시작을 맞이하는 팬들을 위해 지마켓에서 프로모션을 진행한다고 밝혔다. 이번 프로모션은 2월 23일부...
    Date2023.02.23 Bynewsit Views272
    Read More
  10. 가민, 럭셔리 모던 툴 워치 ‘마크 시리즈’ 2세대 컬렉션 5종 추가

    - 마크 시리즈에 스포츠, 탐험, 골프, 세일링 및 항공기 조정 분야 2세대 컬렉션 추가 - 탐험가를 위해 디자인된 ‘마크 어드벤처러 2세대’, CES 2023 혁신상 수상 - 각 분야의 전문성 있는 스마트 기능과 더불어 다양한 건강·헬스 기능 제공 - 국내 100대 한정...
    Date2023.02.23 Bynewsit Views274
    Read More
  11. No Image

    노조미네트웍스, “2022년 하반기까지 철도, 병원, 제조, 에너지 등 중요 인프라에 대한 공격 지속”

    - 와이퍼 멀웨어, IoT 봇넷 활동, 러시아/우크라이나 전쟁이 2022년 위협 환경에 상당한 영향 노조미네트웍스는 오늘 노조미네트웍스 랩(Nozomi Networks Labs)의 <OT/IoT 보안 보고서:ICS 위협 환경에 대한 심층 조사(OT/IoT Security Report: A Deep Look In...
    Date2023.02.23 Bynewsit Views365
    Read More
  12. 파인더갭, 요기요와 ‘버그바운티’ 진행…“선제적 보안 강화”

    파인더갭은 국내 대표 배달앱 요기요 이용 고객들의 개인 정보를 더 안전하게 관리하기 위해 요기요 운영사 위대한상상과 버그바운티 운영 계약을 맺고 선제적인 보안 강화에 나선다고 22일 밝혔다. 버그바운티는 기업이 제공하는 상품이나 서비스의 보안 취약...
    Date2023.02.22 Bynewsit Views419
    Read More
  13. 프랙틸리아, FAME 포트폴리오에 FAME 300 추가…“HVM 팹에 스토캐스틱 분석 기술 제공으로 EUV 패턴 제어 및 수율 향상”  

    - FAME 300 시리즈, 스토캐스틱 결함에 대한 실시간 모니터링을 제공 - HVM 팹에서 단 몇 분만에 잠재적인 공정 문제를 파악하도록 지원 스토캐스틱(stochastic) 기반 분석과 제어를 이끌어가는 차세대 반도체 산업 주자 프랙틸리아는 자사의 FAME(Fractilia A...
    Date2023.02.22 Bynewsit Views445
    Read More
  14. 티맥스오에스, ‘Tmax 구름 SD’ 패스트트랙 1 선정 기념 특별 프로모션

    - Tmax구름 SD 혁신제품 선정 기념 공공기관 대상 6월 말까지 특별 프로모션 통해 프리미어 서비스 제공 - 운영체제 제품 중 최초로 공개SW 확인서를 취득하며 개방형 운영체제로서 신뢰성을 입증하는 등 높은 평가 받는 제품 티맥스오에스는 ‘Tmax구름 SD’의 ...
    Date2023.02.22 Bynewsit Views694
    Read More
  15. 써모스-블랙야크, 등산족 겨냥한 종주 챌린지 콜라보 이벤트

    - 10주간의 국내 대표 종주 코스 ‘불수사도북’ 종주 챌린지…BAC 앱 통해 참여 가능 - 일회용품 아닌 텀블러 사용을 통한 친환경적인 산행의 가치…종주의 도전과 즐거움을 동시 경험 써모스가 블랙야크와 함께 등산을 즐기는 아웃도어족을 위한 ‘불수사도북’ 챌...
    Date2023.02.22 Bynewsit Views453
    Read More
  16. 퓨리오사AI, 허깅페이스와 파트너십 체결…“초거대 언어모델 타겟으로 차세대 칩 개발 가속화“

    - 퓨리오사AI의 차세대 AI 반도체… 챗GPT, Stable Diffusion 등 AI 생성모델 지원 - 글로벌 선도 인공지능 플랫폼 ‘허깅페이스’와 협업… AI 모델 차세대칩에 최적화 - 현재 양산형 칩 설계 완료...24년 상반기 중 빠르게 본격 상용화 퓨리오사AI가 인공지능 분...
    Date2023.02.22 Bynewsit Views490
    Read More
  17. 프로스트 앤드 설리번, 미디어 서비스 시장 내 1위 클라우드 서비스 사업자로 ‘텐센트 클라우드’ 선정

    - 텐센트 클라우드, 아태지역 미디어 서비스 시장 주도하며 Web3.0과 메타버스 시대 속 기업의 디지털 전환 가속하는 “몰입형 융합” 지원 - 아태지역 미디어 서비스 시장, 향후 4년간 연평균 성장률 27% 기록하고 2026년 약 9조원 (69억 8700만 달러) 규모 이...
    Date2023.02.21 Bynewsit Views487
    Read More
  18. 텔레다인 플리어, 도로 및 터널 내 자동 사고 감지용 ‘ITS 시리즈 듀얼 AID 카메라’ 공급

    텔레다인 플리어는 자동 사고 감지(AID)를 위한 듀얼 비전 카메라 ‘FLIR ITS 시리즈 듀얼 AID’ 카메라를 출시한다고 밝혔다. FLIR ITS 시리즈 듀얼 AID 카메라는 640 x 512 픽셀 해상도의 열화상 기술과 더불어 실화상 카메라를 포함하고 있으며, 여기에 플리...
    Date2023.02.21 Bynewsit Views365
    Read More
  19. WD, ‘마이 북’ 데스크톱 라인업에 22TB∙44TB 대용량 추가

    웨스턴디지털이 ‘마이 북(My Book)’과 ‘마이 북 듀오(My Book Duo)’에 각각 22TB 및 44TB 대용량 모델을 새롭게 추가하며 WD 브랜드 ‘마이 북(My Book)’ 데스크톱 스토리지 라인업을 강화한다. 이는 자사 소비자용 드라이브 중 가장 높은 용량을 달성한 것으로...
    Date2023.02.21 Category저장장치 Bynewsit Views470
    Read More
  20. 옴디아, ”2023년은 유망 AI 칩 스타트업들의 시험대“

    옴디아는 주요 AI 하드웨어 스타트업 마켓 레이더(Top AI Hardware Startups Market Radar)를 통해 100군데 이상의 벤처캐피탈(VC)이 2018년부터 상위 25개 인공지능(AI) 칩 스타트업에 60억달러 이상을 투자했다고 밝혔다. 2021년은 예외적인 상황이었으며, ...
    Date2023.02.21 Bynewsit Views443
    Read More
Board Pagination Prev 1 ... 218 219 220 221 222 223 224 225 226 227 ... 270 Next
/ 270
CLOSE