- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5202 레드햇, 2026년 엔터프라이즈 IT 전망 제시…AI 에이전트·IT 주권·추론 환경이 핵심 변수 file newsit 2025.12.22 152
5201 티유브이슈드, 인덕과학기술고와 고전압 전기차 안전교육 협력…미래 모빌리티 인재 양성 file newsit 2025.12.22 155
5200 카스퍼스키, ‘2026 산업제어시스템(ICS) 보안 트렌드’ 발표…“산업제어시스템 5대 중 1대 공격받아” file newsit 2025.12.22 124
5199 온세미, 글로벌파운드리와 차세대 650V GaN 개발…AI 데이터센터 전력 인프라 겨냥 file newsit 2025.12.22 110
5198 딥엘, “2026년, AI는 도구가 아니라 인프라가 된다” file newsit 2025.12.22 158
5197 매스로보틱스, AWS·엔비디아와 피지컬 AI 펠로우십 확대…2026년 코호트 모집 file newsit 2025.12.19 145
5196 캐논코리아, 캐논 마스터즈 장민승과 몰입형 사진극장 시즌 3 ‘위로 ː 緯路’ 성료 file newsit 2025.12.19 129
5195 노르딕 세미컨덕터-OQ 테크놀로지, 저궤도 위성과 직접 연결 성공 file newsit 2025.12.19 128
5194 엔비디아, RTX PRO 5000 72GB 블랙웰 GPU 출시…데스크톱 에이전틱 AI 메모리 한계 확장 file newsit 2025.12.19 133
5193 코헤시티, AWS와 전략적 협력 계약 체결…AI 기반 사이버 레질리언스 강화 file newsit 2025.12.19 162
5192 DJI, 크리스마스 시즌 맞아 인기 드론·카메라 최대 32% 할인 file newsit 2025.12.19 153
5191 안랩, 차세대 위협 인텔리전스 플랫폼 ‘안랩 TIP’ 맞춤형 대시보드 기능 강화   file newsit 2025.12.19 112
5190 사이냅소프트, 'HWP 원본 분석'으로 공공 문서 AI 데이터화 해법 제시 file newsit 2025.12.19 119
5189 슈나이더 일렉트릭, AI·HPC 전용 CDU 2종 출시 file newsit 2025.12.19 128
5188 클루커스, 데이터·클라우드 산업 진흥 유공 장관표창 수상 file newsit 2025.12.18 141
5187 신한투자증권, ‘코스피 4000시대’ 개인 투자자 성과 분석 공개 file newsit 2025.12.18 82
5186 라바웨이브, 해외 유학생·주재원 노린 몸캠피싱 급증 file newsit 2025.12.18 106
5185 벡터코리아, DevOps 기반 SDV 테스트 자동화 플랫폼 공개 file newsit 2025.12.18 139
5184 티맥스티베로, 대한민국 AI·SW기업 경쟁력 대상 ‘클라우드 서비스 부문 최우수상’ 수상 file newsit 2025.12.18 134
5183 가트너, CPS 보안 AI 경쟁 보고서에서 노조미 네트웍스를 선도 기업으로 평가 file newsit 2025.12.18 98
Board Pagination Prev 1 ... 11 12 13 14 15 16 17 18 19 20 ... 276 Next
/ 276
CLOSE