- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2118 세일즈포스, 아스트라제네카에 ‘에이전트포스 라이프사이언스’ 공급 - 에이전틱 AI 기반 글로벌 고객 관리·운영 체계 구축 세일즈포스가 글로벌 제약바이오 기업 아스트라제네카에 ‘에이전트포스 라이프사이언스’를 공급하며, 에이... file newsit 2025.12.18 145
2117 사이냅소프트, 대한민국 AI·SW기업 경쟁력 대상 ‘AI솔루션 부문 우수상’ 수상 - KOSA 주관 시상식서 신설 AI솔루션 부문 첫 수상…Document AI 기술력 입증 Document AI 전문 기업 사이냅소프트가 한국인공지능·소프트웨어산업협회(KOSA)가 주... file newsit 2025.12.18 136
2116 넷앱, 데이터 인프라가 AI 성패 가른다…2026년 본격 확산 국면 진입 - 지능형 데이터 인프라·에이전틱 AI·하이브리드 멀티클라우드 통합이 AI 운영 경쟁력 좌우 넷앱은 AI 활용이 실험 단계를 넘어 본격적인 운영 국면에 진입하면서... file newsit 2025.12.18 165
2115 유클릭, ‘그로우파이’로 AI·클라우드 인재 양성 본격화…오라클 공인 교육 센터 출범 - AI·클라우드 실무 역량 강화 위한 기업·재직자 대상 공인·전문 교육 과정 제공 - 오라클 공식 인증 교육 센터 지정…국내 유일 시험 바우처 직접 구매 서비스 운... file newsit 2025.12.17 135
2114 서비스나우, 무브웍스 인수 완료…AI 에이전트·지능형 워크플로우·엔터프라이즈 검색 결합 - 임직원 업무 환경 위한 AI 네이티브 프론트 도어 제시 비즈니스 혁신을 위한 AI 플랫폼 서비스나우가 무브웍스 인수를 공식 완료했다. 이번 인수로 서비스나우... file newsit 2025.12.17 145
2113 라바웨이브, 동절기 몸캠피싱 피해 급증 경고 - 실내 체류 시간 증가로 몸캠피싱·스마트폰 피싱 범죄 노출 확대 - 가해 관련 자료 보관·확보가 초기 대응과 유포 방지의 핵심 디지털 범죄 대응 전문기업 라바... file newsit 2025.12.16 127
2112 S&P 글로벌, AWS와 협력해 고객 AI 워크플로우에 신뢰 기반 데이터 직접 제공 - 아마존 퀵 스위트와 MCP 서버 통합으로 S&P 글로벌 데이터 접근성 강화 - 시장·금융·에너지 인텔리전스를 에이전틱 AI 워크플로우 전반으로 확대 서울, 2025년 ... file newsit 2025.12.16 145
2111 엔비디아, 네모트론 3 오픈 모델 제품군 공개… 언슬로스 기반 LLM 미세 조정 가속화 - RTX AI PC·DGX 스파크로 LLM 미세 조정과 맞춤형 AI 어시스턴트 구축 지원 - 엔비디아 네모트론 나노 3, 슈퍼, 울트라 공개… 하이브리드 MoE 아키텍처 기반 설... file newsit 2025.12.16 130
2110 HS효성인포메이션, 히타치 밴타라-슈퍼마이크로와 엔터프라이즈 AI 인프라 협력 - VSP One 통합 스토리지와 슈퍼마이크로 GPU 컴퓨팅 결합 - 미션 크리티컬 애플리케이션·생성형 AI·데이터 레이크하우스 대응 강화 HS효성인포메이션시스템이 히... file newsit 2025.12.16 133
2109 AWS, 비자와 차세대 에이전틱 커머스 역량 구현 - 비자 인텔리전트 커머스, AWS 마켓플레이스·아마존 베드록 에이전트코어 통해 제공 AWS가 AWS re:Invent 2025에서 비자와 협력해 에이전틱 커머스를 구축하는 ... file newsit 2025.12.15 107
목록
Board Pagination Prev 1 ... 16 17 18 19 20 21 22 23 24 25 ... 232 Next
/ 232
CLOSE