- AWS 트레이니움·인퍼런시아 기반 레드햇 AI로 프로덕션 AI 워크로드에 더 폭넓은 성능·유연성 확보

 

레드햇, AWS와 협업 확대.jpg

레드햇 매트 힉스 CEOAWS와의 협업을 확대해 AWS 전반에서 레드햇 AIAWS AI 실리콘을 결합한 엔터프라이즈 생성형 AI 지원을 강화한다고 밝혔다. 이번 협력은 기업이 기반 하드웨어와 무관하게 고효율·고성능 AI 추론을 대규모로 운영하도록 돕는 데 초점을 맞춘다.

 

AWS AI 칩 기반으로 강화된 레드햇 AI 인퍼런스 서버

레드햇은 vLLM 기반 레드햇 AI 인퍼런스 서버AWS 인퍼런시아2와 트레이니움3 칩에서 실행할 수 있도록 확장했다. 이를 통해 고객은 모든 세대의 생성형 AI 모델을 공통 레이어에서 운영할 수 있으며, 기존 GPU 기반 EC2 환경 대비 30~40% 향상된 가격 대비 성능을 확보할 수 있다. 고대역폭·저지연 추론 환경도 제공해 프로덕션 AI 배포의 효율성을 높였다.

 

오픈시프트 전반에 AWS 가속기 지원 확대

양사는 레드햇 오픈시프트, 오픈시프트 AI, ROSA에서 AWS 가속기를 활용할 수 있도록 ‘AWS 뉴런 오퍼레이터를 공동 개발했다. 이를 통해 고객은 AWS 인프라에서 AI 워크로드를 더 쉽게 배포·관리할 수 있는 실행 환경을 제공받는다. 레드햇은 또한 ‘amazon.ai 인증 앤서블 컬렉션을 출시해 오픈시프트 기반 워크로드에서 AWS AI 서비스를 자동화·오케스트레이션할 수 있도록 지원하고 있다.

 

접근성과 운영 유연성을 높이는 협업 구조

레드햇은 AWS 환경에서 필요한 대규모 AI 가속기에 대한 접근성을 강화하고, 고객 워크로드의 배포 용이성을 높이는 방향으로 지원을 확장한다. 두 회사는 AWS AI 칩 플러그인을 최적화하기 위해 vLLM 업스트림 개발에도 공동 기여하고 있으며, 이는 Red Hat OpenShift AI 3에서도 상업적으로 활용되고 있다.

 

하이브리드 클라우드 기반 AI 운영을 위한 지원 강화

레드햇과 AWS의 장기 협력은 데이터센터부터 엣지까지 이어지는 하이브리드 클라우드 전략을 기반으로 한다. 이번 협력 확대는 기업이 생성형 AI를 운영 환경에 통합하는 과정에서 필요한 성능 효율성, 확장성, 비용 절감 요구를 충족하도록 설계됐다.

 

AWS 뉴런 커뮤니티 오퍼레이터는 오픈시프트 및 ROSA 환경에서 바로 사용할 수 있다. AWS AI 칩 기반 레드햇 AI 인퍼런스 서버는 20261월 개발자 프리뷰로 제공될 예정이다.

 

#레드햇 #AWS #OpenShiftAI #트레이니움 #인퍼런시아 #레드햇AI #vLLM #AWSNeuron #Ansible #클라우드AI #엔터프라이즈AI

 

 
?

  1. 안랩클라우드메이트, ‘2025년 민간클라우드 기반 AI·데이터레이크 활용지원 사업’ 완수

    - 초거대 AI 기반 정책정보 서비스 고도화… NKIS 국가정책연구포털 접근성 확장 안랩클라우드메이트는 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 추진한 ‘2025년 민간클라우드 기반 AI·데이터레이크 활용지원 사업’을 성공적으로 완수했다고 밝혔다...
    Date2025.12.11 Bynewsit Views146
    Read More
  2. 쿤텍, ‘2025 K-Aerospace 오픈 이노베이션’ 우주항공청장상 수상

    - 디지털 트윈 기반 항공 기술 혁신으로 우주항공청장상 선정 DX보안 기업 쿤텍은 우주항공청이 주최하고 한국항공우주산업(KAI), 연구개발특구진흥재단, 진주강소특구(경상대학교), 한국항공우주연구원이 주관한 ‘2025 K-Aerospace 오픈 이노베이션’에서 우주...
    Date2025.12.11 Bynewsit Views162
    Read More
  3. 패스트파이브 ‘파이브클라우드’, AWS ‘KPPL’ 4회 연속 수상

    - Distribution Premier Partner 선정… 스타트업 기술 성장 파트너십 강화 패스트파이브가 운영하는 IT 솔루션 브랜드 ‘파이브클라우드’가 AWS가 주관하는 ‘2025 하반기 파트너 프로스펙팅 리그(KPPL)’에서 디스트리뷰선 프리미어 파트너(DPP) 부문 수상자로 ...
    Date2025.12.11 Bynewsit Views169
    Read More
  4. 사이냅소프트, 토스랩에 ‘사이냅 도큐애널라이저’ 공급…협업툴 데이터 분석 고도화

    - 금융·공공 기관에 이어 SaaS 시장까지 확장…RAG 최적화 포맷 지원 강화 AI 전문기업 사이냅소프트가 토스랩의 협업툴 ‘잔디(JANDI)’에 문서 구조 분석 솔루션 ‘사이냅 도큐애널라이저’를 공급했다고 밝혔다. 협업 환경에 축적되는 비정형 문서를 고품질 데이...
    Date2025.12.10 Bynewsit Views136
    Read More
  5. 닛산, AWS 활용한 SDV 개발 플랫폼 구축…차량 소프트웨어 테스트 75% 단축

    - 글로벌 5,000명 개발자를 하나의 환경으로 연결한 통합 개발 체계 구축 아마존웹서비스(AWS)는 <AWS re:Invent 2025>에서 닛산이 신규 클라우드 기반 개발 플랫폼 ‘닛산 확장형 오픈 소프트웨어 플랫폼(Nissan Scalable Open Software Platform)’을 공개하며...
    Date2025.12.10 Bynewsit Views151
    Read More
  6. 티맥스소프트, ‘엔터프라이즈 AI’ 전략 제시…AI 솔루션 생태계로 산업 혁신 선언

    - 고객 초청 세미나에서 AI 네이티브 전략과 엔터프라이즈 AI 방향성 공개 티맥스소프트가 12월 10일 서울 그랜드 인터컨티넨탈 파르나스에서 고객 세미나를 열고 ‘엔터프라이즈 AI’ 전략을 공개했다. 회사는 AI 솔루션 생태계 구축을 중심에 두고 기업의 전사...
    Date2025.12.10 Bynewsit Views137
    Read More
  7. 넷앱, AWS와 협력해 엔터프라이즈 데이터를 AWS AI 서비스와 직접 연결

    - ONTAP 데이터, FSx for ONTAP용 S3 Access Point로 AI·ML·애널리틱스 서비스 연동 확대 넷앱(NetApp)이 AWS AI 및 애널리틱스 서비스와 자사 데이터를 직접 연결하는 기능을 공개했다. 신규 기능은 온프레미스와 클라우드 환경 모두에서 적용되며, 기업이 워...
    Date2025.12.09 Bynewsit Views164
    Read More
  8. 리미니스트리트, ERP 프로세스를 에이전틱 AI로 지능형 자동화하는 ‘Rimini Agentic UX’ 출시

    - ERP 업그레이드 없이 자동화·생산성 향상·운영 가시성 강화 리미니스트리트(Rimini Street)가 에이전틱 AI를 기반으로 ERP 프로세스를 자동 실행하고 운영 효율을 높이는 사용자 인터페이스 ‘Rimini Agentic UX’를 공개했다. 신규 UX는 고비용의 ERP 업그레...
    Date2025.12.09 Bynewsit Views151
    Read More
  9. 한국퀀텀컴퓨팅, IBK기업은행과 PQC 기술검증 완료

    - 금융권 양자내성암호 적용 가능성·성능·보안성 전방위 점검 한국퀀텀컴퓨팅이 IBK기업은행과 함께 차세대 금융보안 기술인 양자내성암호(PQC)의 기술 개념검증(PoC)을 성공적으로 마쳤다고 밝혔다. 이번 검증은 양자컴퓨터 시대에 기존 암호체계가 무력화될 ...
    Date2025.12.09 Bynewsit Views191
    Read More
  10. No Image

    레드햇, ‘레드햇 오픈시프트 버추얼라이제이션 엔진 4’ 보안기능 확인서 획득

    - 컨테이너 기반 가상화 제품 최초 인증… 공공·민간 가상화 인프라 보안 요구에 대응 레드햇이 ‘레드햇 오픈시프트 버추얼라이제이션 엔진 4(OVE 4)’가 한국정보보안기술원(KOIST)으로부터 보안기능확인서를 획득했다고 밝혔다. OVE 4는 컨테이너 플랫폼 기반 ...
    Date2025.12.08 Bynewsit Views146
    Read More
목록
Board Pagination Prev 1 ... 22 23 24 25 26 27 28 29 30 31 ... 237 Next
/ 237
CLOSE