- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2168 [CES 2026] 엔비디아·지멘스, AI 팩토리 시대 겨냥한 산업용 AI 운영체제 협력 - AI 혁신으로 설계·제조·운영을 잇는 산업용 AI 팩토리 청사진 제시 엔비디아가 CES 2026에서 지멘스와의 전략적 파트너십을 확대하며 산업 현장에서의 AI 적용... file newsit 2026.01.09 189
2167 [CES 2026] 레노버, 2026 FIFA 월드컵 혁신할 차세대 AI 솔루션 공개 - 지능형 운영·선수 및 코치 지원·몰입형 팬 경험까지 AI 기반 월드컵 기술 청사진 제시 레노버가 FIFA와 협력해 CES 2026에서 열린 연례 행사 테크월드(Tech Wor... file newsit 2026.01.09 172
2166 SAP, 美 NRF 2026서 유통 전반 아우르는 AI 혁신 전략 공개 - 임베디드 AI로 커머스·물류·운영·기획 통합…속도·회복탄력성·고객 충성도 강화 SAP가 전미소매협회(NRF)가 주최한 유통산업 최대 행사 ‘리테일즈 빅 쇼(Retail’... file newsit 2026.01.09 185
2165 트리나스토리지, S&P 글로벌 에너지 BESS 통합업체 글로벌 8위로 톱10 진입 - 유럽·중동·아프리카·호주 등 주요 지역서도 상위 10위 올라 - 누적 설치·계약 용량 기준 글로벌 에너지 저장 시스템 통합 역량 입증 트리나스토리지가 S&P 글로... file newsit 2026.01.08 166
2164 [CES 2026] 엔비디아, 엔터프라이즈 AI 팩토리 검증 설계에 블루필드 기반 보안·인프라 가속 통합 - 아르미스·레드햇·트렌드 마이크로 등과 협력해 AI 런타임 보호 강화 - 네트워킹·스토리지·보안 가속으로 GPU·CPU 연산 집중도 향상 엔비디아가 CES 2026에서 엔... file newsit 2026.01.08 221
2163 [CES 2026] 엔비디아, 드라이브 하이페리온 글로벌 생태계 확장… 레벨 4 완전 자율주행 가속 - 엔비디아 할로스 기반 드라이브 하이페리온 플랫폼으로 레벨 4 자율주행 본격화 - 아에바·보쉬·콴타·소니 등 1차 공급업체·센서 파트너 생태계 확대 - 드라이브... file newsit 2026.01.08 163
2162 [CES 2026] 레노버, 개인화 AI 슈퍼 에이전트 ‘키라’ 공개… 모바일부터 게이밍까지 디바이스 혁신 - 개인화 AI 중심 신제품·PoC 대거 공개… ‘모두를 위한 더 스마트한 AI’ 비전 구체화 레노버가 CES 2026에서 자사 디바이스 전반을 아우르는 개인화 AI 전략과 함... file newsit 2026.01.08 163
2161 슈퍼마이크로, 차세대 엔비디아 베라 루빈 NVL72·HGX 루빈 NVL8 지원… 수냉식 AI 인프라 구축 가속 - 수냉식 AI 솔루션 대응 위한 랙 스케일 제조 역량 확대 - DCBBS·DLC 기술 기반으로 차세대 수냉식 AI 인프라 신속 구축 지원 슈퍼마이크로가 엔비디아와의 협력... file newsit 2026.01.08 166
2160 리미니스트리트, 글로벌 CxO 4,300명 설문 ‘IT 혁신 가속화 보고서’ 발표 - 더 빠른 혁신·ROI 제고·비즈니스 회복탄력성 강화가 핵심 과제로 부상 - 비용 상승·리스크 확대·IT 인재 부족 속 AI 기반 전환 압박 심화 리미니스트리트가 전 ... file newsit 2026.01.08 160
2159 케이투스, 유럽서 100캐비닛 액체냉각 AI 데이터센터 초고속 구축 - 턴키 모듈형 솔루션으로 구축 효율 80% 개선, 고밀도 액체냉각 클러스터 성능 20% 향상 케이투스(KAYTUS)가 통합 턴키 서비스를 통해 대규모 액체냉각 AI 데이... file newsit 2026.01.08 155
목록
Board Pagination Prev 1 ... 16 17 18 19 20 21 22 23 24 25 ... 237 Next
/ 237
CLOSE