- AMD 인스팅트 MI300X 기반 첫 대규모 MoE 모델 ‘ZAYA1’ 공개

- Llama 3·OLMoE 대비 우수 성능학습 효율성과 저장 속도 크게 향상

 

AMD MI350.PNG

AMD가 자이프라(Zyphra)의 대규모 전문가 혼합(MoE) 기반 AI 모델 ‘ZAYA1’ 개발을 지원하며 프런티어급 AI 학습 분야에서 새로운 성과를 달성했다고 밝혔다. ZAYA1AMD 인스팅트(Instinct) MI300X GPUAMD 펜산도(Pensando) 네트워킹, ROCm 오픈 소스 소프트웨어 스택을 기반으로 학습된 최초의 대규모 MoE 모델이다.

 

ZAYA1, 주요 오픈 모델 대비 경쟁력 확보

자이프라에 따르면 ZAYA1 Base 모델은 추론·수학·코딩 등 다양한 벤치마크에서 Llama 3 8BOLMoE를 능가했으며, Qwen3 4BGemma3 12B와 견줄 만한 성능을 보였다. 83억 파라미터 구조 중 활성 파라미터는 76천만 개에 불과하지만, 효율적 구조 설계를 통해 비용·속도·정확성의 균형을 확보했다.

 

“AI 모델 학습 복잡성 크게 줄였다

AMD 인공지능 그룹 에마드 바르숨 부사장은 이번 성과는 복잡한 대규모 모델 학습에서 AMD 인스팅트 GPU와 펜산도 네트워킹의 유연성과 성능을 증명하는 사례라며 “AMD는 혁신 기업들이 한계를 확장할 수 있도록 지속 지원하겠다고 밝혔다.

 

효율성 중심 설계 철학의 결과

자이프라 CEO 크리틱 푸탈라스는 “ZAYA1은 모델 아키텍처, 알고리즘, 하드웨어 선택까지 효율성을 최우선으로 설계한 결과물이며, AMD 플랫폼에서 대규모 학습을 구현한 첫 사례라는 점에서 의미가 크다고 말했다. 이어 “AMD·IBM과 협력을 강화해 차세대 멀티모달 파운데이션 모델 개발에 속도를 낼 것이라고 덧붙였다.

 

대용량 메모리 기반 학습 효율성·속도 향상

AMD 인스팅트 MI300X192GB 고대역폭 메모리를 제공해 텐서 샤딩이나 고비용 전문가 활용 없이도 대규모 MoE 학습을 지원한다. 이를 통해 학습 복잡성 감소 전체 처리량 증가 분산 I/O 최적화로 모델 저장 시간 약 10배 단축 등의 효과가 확인됐다.

 

자이프라는 AMD·IBM과 협력해 MI300X GPU와 고성능 클라우드 패브릭·스토리지 아키텍처로 구성된 대규모 학습 클러스터도 구축했으며, 이는 ZAYA1 사전학습의 핵심 인프라로 활용됐다.

 

#AMD #Zyphra #ZAYA1 #MI300X #AI모델학습 #MoE #ROCm #펜산도 #대규모모델 #AI반도체

 

 
?

  1. EDB, ‘오라클 탈출’ 위한 라이선스·TCO 통합 진단 프로그램 발표

  2. ST, 리모컨용 배터리 절감형 무선 MCU ‘STM32WL3R’ 출시

  3. 티머니, ‘2025년 지역사회공헌 인정기업’ 선정

  4. DJI·스카이픽셀, 제11회 사진·영상 공모전 접수 시작

  5. 카스퍼스키, 2025년 글로벌 제조기업 랜섬웨어 피해액 180억 달러 이상 추정

  6. 지멘스, 서터스 세미컨덕터에 AI 기반 맞춤형 IC 설계 검증 솔루션 ‘솔리도(Solido)’ 공급

  7. 스틸시리즈, 셰에라자드에 ‘아크티스 노바 엘리트’ 무선 게이밍 헤드셋 체험존 마련

  8. 티오리-포스코DX, AX 시대 대응 위한 AI 보안 체계 구축 본격화  

  9. ams OSRAM, 정전용량식 감지 센서 ‘AS8580’ 출시… “까다로운 자동차 환경 대응”

  10. 안랩, 기업 고객 보안담당자 대상 ‘안랩 ISF 스퀘어 2025 for Enterprise’ 성료

  11. 이큐포올, 2025 정부혁신박람회서 ‘온글’로 쉬운 정보 혁신 강조

  12. 퓨어스토리지-MS, 애저 마이그레이션 간소화 솔루션 공개

  13. 캐논코리아, 하반기 전략 신제품 ‘EOS C50’과 ‘EOS R6 Mark III’ 공개

  14. TUV SUD, ‘World Hydrogen Expo 2025’ 참가

  15. 엔비디아, RTX GPU에 ‘플럭스.2’ 이미지 생성 모델 최적화

  16. 샌디스크, 피너츠 75주년 기념 ‘스누피 리미티드 에디션 스토리지’ 공개

  17. 안랩, ‘2026년 5대 사이버 보안 위협 전망’ 발표… “AI 적응형 공격 확산·국가 인프라 위협 부상”

  18. 가트너, 전 세계 정부 CIO 52% “2026년 AI 예산 확대 전망”

  19. 함샤우트 글로벌·AI 매터스, 한국인이 가장 많이 쓰는 ‘Top 10 AI’ 첫 공개

  20. 티맥스소프트, ‘AI x 소프트웨이브 2025’ 참가…“소버린 AI 프레임워크 개발 비전 제시”

Board Pagination Prev 1 ... 14 15 16 17 18 19 20 21 22 23 ... 273 Next
/ 273
CLOSE