- 144개 칩 확장·4배 효율성 향상대규모 AI 모델 훈련 기간 대폭 단축

 

AWS, 차세대 Trainium3 칩 발표.jpg

AWSAWS 리인벤트 2025에서 3나노미터 공정 기반 트레이니움3(Trainium3) 칩을 탑재한 아마존 EC2 Trn3 울트라서버(Amazon EC2 Trn3 UltraServers)’를 공식 출시했다고 밝혔다. 이를 통해 기업은 대규모 AI 모델을 더 빠르게 훈련하고 더 많은 사용자에게 낮은 비용으로 서비스를 제공할 수 있는 고성능 인프라를 확보하게 된다.

 

144개 칩 확장 지원차세대 AI 모델 위한 컴퓨팅 설계

Trn3 울트라서버는 최대 144개의 트레이니움3 칩으로 확장이 가능하며, 최대 362PFLOPs(평가 기준 FP8) 성능을 제공한다. 이전 세대 대비 4.4배 향상된 컴퓨팅 성능, 4배 높은 에너지 효율성, 4배 넓은 메모리 대역폭을 제공해 모델 훈련 기간을 몇 달에서 수 주로 단축한다. GPT-OSS 기반 테스트 결과, Trn2 대비 칩당 처리량은 3, 응답 속도는 4배 향상된 것으로 확인됐다.

 

네트워크 병목 제거한 트레이니움3 전용 패브릭 구조

AWS는 칩 아키텍처부터 소프트웨어 스택까지 수직 통합된 구조를 적용했다. 새로운 뉴런스위치-v1은 울트라서버 내부에서 2배 대역폭을 제공하며, 통신 지연을 10마이크로초 미만으로 줄인 뉴런 패브릭은 대규모 분산 AI 훈련의 병목을 제거하는 역할을 한다.

EC2 울트라클러스터 3.0은 수천 대의 Trn3 울트라서버를 연결해 최대 100만 개 트레이니움 칩을 활용할 수 있는 인프라를 구성한다.

 

고객 사례 기반 비용 절감 효과 입증

앤트로픽, 카라쿠리, 네토닷에이아이, 리코 등 고객사는 트레이니움을 활용해 훈련 비용을 최대 50% 절감했다고 밝힌 바 있다. AI 영상 생성 기업 디카트는 GPU 대비 절반 비용으로도 4배 빠른 프레임 생성 성능을 확보해 실시간 인터랙티브 콘텐츠 구현 범위를 확대하고 있다.

아마존 베드록은 이미 트레이니움3 기반 프로덕션 워크로드를 운영 중이다.

 

트레이니움4 개발 착수FP8 성능 3배 향상 목표

AWS는 차세대 트레이니움4’ 개발에 돌입해 FP4 성능 6, FP8 성능 3, 메모리 대역폭 4배 강화를 목표로 하고 있다. NV링크 퓨전 기반 고속 연결 기술을 지원해 트레이니움그래비톤·EFA 기반 인프라를 단일 MGX 랙에서 구성할 수 있도록 설계 중이다.

 

#AWS #Trainium3 #Trn3울트라서버 #EC2UltraCluster #AWSAI #NeuronSwitch #Bedrock #Anthropic #생성형AI #AI추론 #AI훈련 #3nmAI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5170 라바웨이브, 동절기 몸캠피싱 피해 급증 경고 file newsit 2025.12.16 138
5169 S&P 글로벌, AWS와 협력해 고객 AI 워크플로우에 신뢰 기반 데이터 직접 제공 file newsit 2025.12.16 149
5168 레노버, AI 레디 인프라 구축 위한 데이터 스토리지 솔루션·서비스 출시 file newsit 2025.12.16 143
5167 엔비디아, 네모트론 3 오픈 모델 제품군 공개… 언슬로스 기반 LLM 미세 조정 가속화 file newsit 2025.12.16 134
5166 HS효성인포메이션, 히타치 밴타라-슈퍼마이크로와 엔터프라이즈 AI 인프라 협력 file newsit 2025.12.16 145
5165 리벨리온, 설립 5년 만에 AI 반도체 핵심 기업 도약…글로벌 인프라 시장 공략 file newsit 2025.12.16 84
5164 가민, ‘2025 가민 커넥트 데이터 보고서’ 발표…한국 일평균 걸음 수 세계 2위 file newsit 2025.12.16 176
5163 키옥시아, 고적층형 산화물 반도체 3D DRAM 핵심 기술 발표 file newsit 2025.12.15 116
5162 ams OSRAM, 차세대 자동차용 LiDAR 레이저 출시 file newsit 2025.12.15 89
5161 AWS, 비자와 차세대 에이전틱 커머스 역량 구현 file newsit 2025.12.15 111
5160 슈퍼마이크로, 엔비디아 HGX B300 탑재 수냉식 솔루션 출시 file newsit 2025.12.15 140
5159 카스퍼스키, ‘ISO/IEC 27001:2022’ 국제 정보보호 표준 재인증 획득 file newsit 2025.12.15 93
5158 온세미, 포비아 헬라와 차세대 전력 기술 전략적 협력 확대 file newsit 2025.12.15 102
5157 한서대학교, 프라스카 신형 비행훈련장치 도입…항공 훈련 프로그램 확대  file newsit 2025.12.12 92
5156 티티테크오토, 자동차 통신용 통합 미들웨어 ‘모션와이즈 커뮤니케이션’ 출시 file newsit 2025.12.12 154
5155 MSI, 2025 다나와 노트북 부문 ‘히트브랜드’ 수상! file newsit 2025.12.12 145
5154 아마존·어도비, AI 시대 창의성과 마케팅 재편 위한 협력 강화 file newsit 2025.12.12 123
5153 ST, 셀룰러 커넥티비티 지원 NB-IoT 모듈 공개…개발 에코시스템 강화 file newsit 2025.12.12 104
5152 와콤-전남과학대, 창의융합형 콘텐츠 인재 양성 협약…디지털 창작 교육 인프라 강화 file newsit 2025.12.12 110
5151 카스퍼스키, ‘다크웹 구직 시장 분석 보고서’ 발표…“다크웹 구직 게시물 2배 증가” file newsit 2025.12.12 91
Board Pagination Prev 1 ... 21 22 23 24 25 26 27 28 29 30 ... 284 Next
/ 284
CLOSE