- AMD 인스팅트 MI300X 기반 첫 대규모 MoE 모델 ‘ZAYA1’ 공개

- Llama 3·OLMoE 대비 우수 성능학습 효율성과 저장 속도 크게 향상

 

AMD MI350.PNG

AMD가 자이프라(Zyphra)의 대규모 전문가 혼합(MoE) 기반 AI 모델 ‘ZAYA1’ 개발을 지원하며 프런티어급 AI 학습 분야에서 새로운 성과를 달성했다고 밝혔다. ZAYA1AMD 인스팅트(Instinct) MI300X GPUAMD 펜산도(Pensando) 네트워킹, ROCm 오픈 소스 소프트웨어 스택을 기반으로 학습된 최초의 대규모 MoE 모델이다.

 

ZAYA1, 주요 오픈 모델 대비 경쟁력 확보

자이프라에 따르면 ZAYA1 Base 모델은 추론·수학·코딩 등 다양한 벤치마크에서 Llama 3 8BOLMoE를 능가했으며, Qwen3 4BGemma3 12B와 견줄 만한 성능을 보였다. 83억 파라미터 구조 중 활성 파라미터는 76천만 개에 불과하지만, 효율적 구조 설계를 통해 비용·속도·정확성의 균형을 확보했다.

 

“AI 모델 학습 복잡성 크게 줄였다

AMD 인공지능 그룹 에마드 바르숨 부사장은 이번 성과는 복잡한 대규모 모델 학습에서 AMD 인스팅트 GPU와 펜산도 네트워킹의 유연성과 성능을 증명하는 사례라며 “AMD는 혁신 기업들이 한계를 확장할 수 있도록 지속 지원하겠다고 밝혔다.

 

효율성 중심 설계 철학의 결과

자이프라 CEO 크리틱 푸탈라스는 “ZAYA1은 모델 아키텍처, 알고리즘, 하드웨어 선택까지 효율성을 최우선으로 설계한 결과물이며, AMD 플랫폼에서 대규모 학습을 구현한 첫 사례라는 점에서 의미가 크다고 말했다. 이어 “AMD·IBM과 협력을 강화해 차세대 멀티모달 파운데이션 모델 개발에 속도를 낼 것이라고 덧붙였다.

 

대용량 메모리 기반 학습 효율성·속도 향상

AMD 인스팅트 MI300X192GB 고대역폭 메모리를 제공해 텐서 샤딩이나 고비용 전문가 활용 없이도 대규모 MoE 학습을 지원한다. 이를 통해 학습 복잡성 감소 전체 처리량 증가 분산 I/O 최적화로 모델 저장 시간 약 10배 단축 등의 효과가 확인됐다.

 

자이프라는 AMD·IBM과 협력해 MI300X GPU와 고성능 클라우드 패브릭·스토리지 아키텍처로 구성된 대규모 학습 클러스터도 구축했으며, 이는 ZAYA1 사전학습의 핵심 인프라로 활용됐다.

 

#AMD #Zyphra #ZAYA1 #MI300X #AI모델학습 #MoE #ROCm #펜산도 #대규모모델 #AI반도체

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5097 MSI, 지포스 RTX 50 시리즈 연말 감사 특별 사용 후기 이벤트 file newsit 2025.12.03 125
5096 ECS텔레콤, NICE와 AI 기반 CCaaS로 차세대 고객 경험 패러다임 제시 file newsit 2025.12.03 130
5095 사이냅소프트, 프라이빗 AI 기반 지식관리 플랫폼 ‘키냅스’ 출시 file newsit 2025.12.03 116
5094 콩가텍, 보안 갖춘 임베디드 솔루션 제공 위해 콘트론과 협력 강화 file newsit 2025.12.03 102
5093 레인보우로보틱스, HD현대미포 ‘스마트 조선소’ 위한 협동로봇 용접 시스템 공급 file newsit 2025.12.03 129
5092 카스퍼스키, 연말 신규 고객 대상 ‘1GB eSIM 무료 제공’ 프로모션 진행 file newsit 2025.12.03 76
5091 아비바, 디지털 트윈 포트폴리오 대폭 강화 file newsit 2025.12.03 116
5090 엑시스, 세계 최초 네트워크 카메라 발명가 ‘마틴 그렌’ 방한…차세대 AI 보안 전략·ARTPEC 비전 공개 file newsit 2025.12.03 62
5089 다쏘시스템–미스트랄 AI, 소버린 AI 파트너십 강화… 유럽 규제 산업 지원 확대 file newsit 2025.12.02 139
5088 안랩 V3, AV-TEST서 ‘홈·비즈니스’ 전 부문 만점… 우수 제품 선정 file newsit 2025.12.02 68
5087 티맥스소프트, ‘AI 솔루션 생태계’ 본격 확대… 2025 파트너 데이 개최 file newsit 2025.12.02 145
5086 AWS, ‘에이전틱 AI’ 29종 공개… 고객센터 자동화·상담원 지원 기능 강화 file newsit 2025.12.02 134
5085 IFA 베를린, 한국과의 파트너십 강화… 글로벌 혁신 교류의 장으로 자리매김 file newsit 2025.12.02 143
5084 딥엘, DeepL Agent·실시간 음성 번역 등 핵심 기술 시연 file newsit 2025.12.02 132
5083 큐브리드, DBMS 기반 디지털 재해복구 시스템 구축 전략 공개 file newsit 2025.12.02 103
5082 EDB, ‘오라클 탈출’ 위한 라이선스·TCO 통합 진단 프로그램 발표 file newsit 2025.12.02 96
5081 ST, 리모컨용 배터리 절감형 무선 MCU ‘STM32WL3R’ 출시 file newsit 2025.12.01 108
5080 티머니, ‘2025년 지역사회공헌 인정기업’ 선정 file newsit 2025.12.01 77
5079 DJI·스카이픽셀, 제11회 사진·영상 공모전 접수 시작 file newsit 2025.12.01 141
5078 카스퍼스키, 2025년 글로벌 제조기업 랜섬웨어 피해액 180억 달러 이상 추정 file newsit 2025.12.01 70
Board Pagination Prev 1 ... 17 18 19 20 21 22 23 24 25 26 ... 276 Next
/ 276
CLOSE