- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2188 케이투스, 데이터센터 운영 플랫폼 KSManage 고도화…AI 인프라 가시성 강화 - 부품부터 AI 작업까지 4단계 통합 가시성으로 안정성·운영 효율 동시 강화 엔드투엔드 AI 및 액체냉각 솔루션 전문기업 케이투스가 AI 데이터센터 운영·관리 플... file newsit 2026.01.20 130
2187 세일즈포스, WEF 2026서 AI 컨시어지 앱 ‘EVA’ 공개 - 에이전트포스 360 기반 에이전틱 AI로 3,000여 명 참석자 일정·의사결정 지원 - 단순 챗봇 넘어 추론·행동 수행… WEF AX 가속화 사례 제시 세일즈포스가 56회 ... file newsit 2026.01.19 153
2186 HS효성인포메이션시스템, AI 데이터 레이크 고도화로 스트라드비젼 학습·검증 효율 개선 - 오브젝트 스토리지·올플래시 NAS 최적 설계로 GPU 활용률·데이터 처리 성능 동시 향상 - 단순 구축 넘어 AI 비즈니스 성장을 고려한 중장기 인프라 전략 지원 A... file newsit 2026.01.19 163
2185 티맥스티베로, 삼성클라우드플랫폼 마켓플레이스에 이중화 기술 ‘TAC’ 등록 - 공유 디스크 기반 액티브-액티브 이중화로 공공 클라우드 서비스 연속성 대응 - 공공 IT 장애 이후 확산되는 고가용 DB 수요에 대안 제시 데이터베이스 전문기... file newsit 2026.01.16 180
2184 알리바바, Qwen 앱 고도화… 커머스·결제·여행 잇는 에이전틱 AI 공개 - 커머스·여행·결제·생활 서비스 아우르는 실행형 AI로 진화 알리바바그룹이 소비자 대상 AI 애플리케이션 Qwen 앱의 대규모 업데이트를 공개하며, ‘에이전틱 AI(... file newsit 2026.01.16 159
2183 티유브이슈드, 국립목포대·대만 TIWTC와 풍력 안전·기술 인재 양성 협약 - 신안 GWO 교육센터 기반, 풍력산업 안전 및 기술 역량 고도화를 위한 3자 협력 글로벌 시험 인증기관 티유브이슈드(TUV SUD)는 국립목포대학교, 대만국제풍력교... file newsit 2026.01.16 145
2182 스노우플레이크, 2026년 엔터프라이즈 AI 전망…에이전틱 AI·데이터 전략이 성과 좌우 - 신뢰성 확보·데이터 활용 전략이 핵심 변수…리테일·금융·제조 산업별 방향 제시 스노우플레이크가 ‘AI + 데이터 예측 2026 보고서’를 발간하고, 2026년 엔터프... file newsit 2026.01.15 143
2181 [CES 2026] 위로보틱스, CES서 휴머노이드·웨어러블 로봇 사업 성과 가시화 - 휴머노이드 로봇 ALLEX·웨어러블 로봇 WIM 중심으로 글로벌 협업 논의 구체화 로보틱스 기업 위로보틱스가 미국 라스베이거스에서 열린 CES 2026 전 일정을 성... file newsit 2026.01.15 151
2180 데클라, 공급망 신호 해석·예측·실행 잇는 에이전틱 AI 공개 - 8가지 AI 인텔리전스로 구성된 ‘에이전트 계층’으로 공급망 신호 해석·예측·실행 자동화 데클라가 공급망 전반에서 발생하는 신호를 실시간으로 해석하고 예측·... file newsit 2026.01.15 169
2179 벡터·QNX, SDV 소프트웨어 운영 플랫폼 ‘알로이 코어’ 공개 - 메르세데스-벤츠 도입…차량 소프트웨어 인프라 복잡성 해소와 혁신 가속 목표 벡터코리아와 QNX가 소프트웨어 정의 차량(SDV) 개발을 단순화하고 가속화하기 위... file newsit 2026.01.15 177
목록
Board Pagination Prev 1 ... 5 6 7 8 9 10 11 12 13 14 ... 228 Next
/ 228
CLOSE