- AMD 인스팅트 MI300X 기반 첫 대규모 MoE 모델 ‘ZAYA1’ 공개

- Llama 3·OLMoE 대비 우수 성능학습 효율성과 저장 속도 크게 향상

 

AMD MI350.PNG

AMD가 자이프라(Zyphra)의 대규모 전문가 혼합(MoE) 기반 AI 모델 ‘ZAYA1’ 개발을 지원하며 프런티어급 AI 학습 분야에서 새로운 성과를 달성했다고 밝혔다. ZAYA1AMD 인스팅트(Instinct) MI300X GPUAMD 펜산도(Pensando) 네트워킹, ROCm 오픈 소스 소프트웨어 스택을 기반으로 학습된 최초의 대규모 MoE 모델이다.

 

ZAYA1, 주요 오픈 모델 대비 경쟁력 확보

자이프라에 따르면 ZAYA1 Base 모델은 추론·수학·코딩 등 다양한 벤치마크에서 Llama 3 8BOLMoE를 능가했으며, Qwen3 4BGemma3 12B와 견줄 만한 성능을 보였다. 83억 파라미터 구조 중 활성 파라미터는 76천만 개에 불과하지만, 효율적 구조 설계를 통해 비용·속도·정확성의 균형을 확보했다.

 

“AI 모델 학습 복잡성 크게 줄였다

AMD 인공지능 그룹 에마드 바르숨 부사장은 이번 성과는 복잡한 대규모 모델 학습에서 AMD 인스팅트 GPU와 펜산도 네트워킹의 유연성과 성능을 증명하는 사례라며 “AMD는 혁신 기업들이 한계를 확장할 수 있도록 지속 지원하겠다고 밝혔다.

 

효율성 중심 설계 철학의 결과

자이프라 CEO 크리틱 푸탈라스는 “ZAYA1은 모델 아키텍처, 알고리즘, 하드웨어 선택까지 효율성을 최우선으로 설계한 결과물이며, AMD 플랫폼에서 대규모 학습을 구현한 첫 사례라는 점에서 의미가 크다고 말했다. 이어 “AMD·IBM과 협력을 강화해 차세대 멀티모달 파운데이션 모델 개발에 속도를 낼 것이라고 덧붙였다.

 

대용량 메모리 기반 학습 효율성·속도 향상

AMD 인스팅트 MI300X192GB 고대역폭 메모리를 제공해 텐서 샤딩이나 고비용 전문가 활용 없이도 대규모 MoE 학습을 지원한다. 이를 통해 학습 복잡성 감소 전체 처리량 증가 분산 I/O 최적화로 모델 저장 시간 약 10배 단축 등의 효과가 확인됐다.

 

자이프라는 AMD·IBM과 협력해 MI300X GPU와 고성능 클라우드 패브릭·스토리지 아키텍처로 구성된 대규모 학습 클러스터도 구축했으며, 이는 ZAYA1 사전학습의 핵심 인프라로 활용됐다.

 

#AMD #Zyphra #ZAYA1 #MI300X #AI모델학습 #MoE #ROCm #펜산도 #대규모모델 #AI반도체

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5110 티티테크오토, 아시아 OEM과 MotionWise 협력 강화…SDV 안전 아키텍처 적용 확대 file newsit 2025.12.04 127
5109 온세미, 이노사이언스와 협력해 GaN 전력 포트폴리오 확대 가속화 file newsit 2025.12.04 97
5108 마우저-온세미, 자율 로보틱스의 발전을 조명한 새로운 전자책 발간 file newsit 2025.12.04 116
5107 이글루코퍼레이션, ‘2026년 사이버 보안 위협 및 기술 전망 보고서’ 발표 file newsit 2025.12.04 72
5106 엔비디아, 미스트랄 AI와 협력해 ‘미스트랄 3’ 신형 오픈 모델 제품군 가속화 file newsit 2025.12.04 121
5105 크리테오 코리아, ‘에이전시 어워즈 2025’ 개최… 파트너사 성과 조명 file newsit 2025.12.04 123
5104 스틸시리즈, ‘스틸시리즈와 함께하는 T1 팬미팅’ 개최… 네이버 구매 고객 대상 초청 이벤트 진행 file newsit 2025.12.04 111
5103 세일즈포스, ‘에이전트포스 인더스트리 서밋’ 개최… 에이전틱 AI 기반 산업별 AX 전략·혁신 사례 공개 file newsit 2025.12.04 140
5102 엔비디아, ‘연운’·‘포레스트 더즌 케어’에 DLSS 기술 적용…연말 RTX 이벤트 강화 file newsit 2025.12.03 118
5101 티맥스티베로, 광주미래차모빌리티진흥원과 MOU 체결…V2X 기반 미래차 데이터 공동 표준화 추진 file newsit 2025.12.03 125
5100 AWS, 차세대 Trainium3 칩 발표…엔터프라이즈 AI 확장 본격화   file newsit 2025.12.03 152
5099 레드햇, AWS와 협업 확대…AWS 전반에서 향상된 AI 추론 제공   file newsit 2025.12.03 130
5098 AMD, HPE와 협력 확대, 개방형 랙 스케일 AI 인프라 혁신 주도 file newsit 2025.12.03 140
5097 MSI, 지포스 RTX 50 시리즈 연말 감사 특별 사용 후기 이벤트 file newsit 2025.12.03 125
5096 ECS텔레콤, NICE와 AI 기반 CCaaS로 차세대 고객 경험 패러다임 제시 file newsit 2025.12.03 131
5095 사이냅소프트, 프라이빗 AI 기반 지식관리 플랫폼 ‘키냅스’ 출시 file newsit 2025.12.03 117
5094 콩가텍, 보안 갖춘 임베디드 솔루션 제공 위해 콘트론과 협력 강화 file newsit 2025.12.03 102
5093 레인보우로보틱스, HD현대미포 ‘스마트 조선소’ 위한 협동로봇 용접 시스템 공급 file newsit 2025.12.03 130
5092 카스퍼스키, 연말 신규 고객 대상 ‘1GB eSIM 무료 제공’ 프로모션 진행 file newsit 2025.12.03 76
5091 아비바, 디지털 트윈 포트폴리오 대폭 강화 file newsit 2025.12.03 116
Board Pagination Prev 1 ... 17 18 19 20 21 22 23 24 25 26 ... 277 Next
/ 277
CLOSE