- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5266 [CES 2026] 엔비디아, 신형 메르세데스-벤츠 CLA에 드라이브 AV 소프트웨어 탑재 file newsit 2026.01.07 115
5265 [CES 2026] 엔비디아, 루빈 플랫폼·오픈 모델·자율주행으로 AI 풀스택 청사진 제시   file newsit 2026.01.07 119
5264 엔비디아 젠슨 황 CEO, 가속 컴퓨팅 혁신으로 ‘2026년 IEEE 최고 명예 메달’ 영예 file newsit 2026.01.07 123
5263 카스퍼스키, 학술 포털 위장한 APT ‘ForumTroll’ 포착…연구자 표적 피싱 공격 확산 file newsit 2026.01.07 95
5262 [CES 2026] NXP 반도체, SDV 겨냥 ‘S32N7’ 초통합 프로세서 공개…차량 핵심 기능 중앙화 file newsit 2026.01.07 106
5261 [CES 2026] 델, 52형 6K ‘델 울트라샤프’ 신제품 공개…초대형 업무 화면으로 생산성 재정의 file newsit 2026.01.07 87
5260 [CES 2026] 엔비디아, 블루필드-4로 차세대 AI 위한 AI 네이티브 스토리지 인프라 구현 file newsit 2026.01.06 119
5259 마우저, 르네사스 RA8T2 MCU·모터 제어 키트 공급…산업용 설계 간소화 file newsit 2026.01.06 86
5258 [CES 2026] 엔비디아, 차세대 AI 위한 ‘루빈’ 플랫폼 공개…6종 신규 칩으로 AI 슈퍼컴퓨터 재정의 file newsit 2026.01.06 123
5257 프로틴테크, 우선 클라우드로 AWS 선정…업계 최초 AI 항체 어시스턴트 ‘에이블’ 출시 file newsit 2026.01.06 113
5256 [CES 2026] 샌디스크, WD_BLACK·WD Blue NVMe SSD 라인업 ‘SANDISK Optimus’로 재편 file newsit 2026.01.06 102
5255 [CES 2026] 인텔, 18A 공정 기반 첫 프로세서 공개…코어 Ultra 시리즈 3 출시 file newsit 2026.01.06 109
5254 카테노이드 콜러스, 아마존 ‘베가 OS’ 공식 지원…스마트 TV·CTV 시장 공략 가속 file newsit 2026.01.06 114
5253 [CES 2026] TI, 확장된 자동차 반도체 포트폴리오로 자율주행 전환 가속 file newsit 2026.01.06 114
5252 콩가텍, 인텔 코어 울트라 시리즈 3 기반 패스트트랙 COM 출시…최대 180 TOPS로 임베디드 AI 가속   file newsit 2026.01.06 111
5251 클루커스·파이브트란, 국내 기업 AI 전환 가속 협력...서울 리전 공식 지원 연계 데이터·AI 활용 기반 강화   file newsit 2026.01.06 90
5250 엠클라우드브리지, 셀프서비스형 생성형(Generative) BI ‘Ai 365 데이터 에이전트’ 발표…자연어 기반 데이터 분석·시각화 구현 file newsit 2026.01.06 125
5249 [CES 2026] 엔비디아, ‘알파마요’ 오픈 AI 모델 제품군 공개…추론 기반 자율주행 가속화 file newsit 2026.01.06 128
5248 [CES 2026] 엔비디아, 새로운 피지컬 AI 모델 공개…글로벌 파트너와 차세대 로봇 협력 확대 file newsit 2026.01.06 119
5247 [CES 2026] 델, 프리미엄 노트북 ‘XPS’ 신규 라인업 공개…디자인·성능·배터리 전면 진화 file newsit 2026.01.06 116
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 275 Next
/ 275
CLOSE