- 부품부터 AI 작업까지 4단계 통합 가시성으로 안정성·운영 효율 동시 강화

 

케이투스, AI 데이터센터 운영 가시성 강화하는 KSManage 업그레이드.jpg

엔드투엔드 AI 및 액체냉각 솔루션 전문기업 케이투스가 AI 데이터센터 운영·관리 플랫폼 ‘KSManage’를 업그레이드하며, AI 데이터센터 운영 가시성과 안정성 강화에 나섰다.

 

이번에 선보인 KSManage는 부품·서버·캐비닛·클러스터·AI 작업으로 이어지는 4단계 통합 가시성을 제공해, 복잡도가 급격히 높아진 AI 데이터센터 환경에서도 높은 가용성과 운영 효율을 동시에 확보할 수 있도록 설계됐다.

 

강화된 KSManage는 장애 원인을 보다 정밀하게 식별하고 사고 대응 속도를 높이며, 사전 예방형 운영 체계를 구현한다. 이를 통해 복잡한 장애 분석, 증가하는 부품 고장률, 애플리케이션 간 의존성 확대, 운영·유지보수(O&M) 대응 지연 등 AI 데이터센터가 직면한 핵심 과제를 효과적으로 해소한다.

 

국내에서도 AI 모델 학습과 추론 수요가 빠르게 증가하면서 고밀도 GPU 서버와 대규모 AI 클러스터를 운영하는 데이터센터가 확산되고 있다. 특히 높은 전력 비용과 제한된 부지, 24시간 무중단 운영 요구가 결합된 한국 환경에서는 장애를 조기에 탐지하고 자원을 정밀하게 관리하는 운영 가시성이 핵심 경쟁력으로 부상하고 있다. KSManage는 이러한 국내 환경에 최적화된 통합 가시성 플랫폼으로, 안정적인 AI 인프라 운영을 지원한다.

 

AI 데이터센터 운영을 제약하는 네 가지 핵심 과제

대규모 언어 모델(LLM) 확산과 함께 CPU·GPU·DPU가 혼합된 아키텍처, 지역 간 협업 환경이 빠르게 확대되며 O&M 복잡도는 크게 증가하고 있다. 단 한 번의 장애로도 수백만 달러 규모의 손실이 발생할 수 있는 상황에서 운영 안정성은 필수 요건으로 자리 잡았다.

 

기존 분산형 모니터링 방식은 컴퓨팅·네트워크·스토리지·전력이 긴밀하게 연결된 환경을 통합적으로 파악하기 어렵다. 고전력·고밀도 운영으로 GPU와 스토리지 고장 위험은 증가하고 있지만, 실시간 추적과 예측이 제한적이다. 또한 하드웨어 문제와 개별 AI 학습·추론 작업 간 연관 가시성이 부족해 실제 비즈니스 영향 분석에도 한계가 있다. 여기에 수작업 중심 O&M과 전문 인력 부족이 더해지며 대응 속도 저하와 오류 가능성이 커지고 있다.

 

KSManage, 4단계 통합 가시성으로 운영 혁신

업그레이드된 KSManage는 부품서버·캐비닛클러스터AI 작업으로 이어지는 4단계 통합 가시성 체계를 기반으로 AI 데이터센터 전체를 하나의 연관 시스템으로 인식한다.

 

실시간 3D 시각화 기반 풀스택 가시성을 통해 GPU·CPU 사용률, 전력 소비, 네트워크 대역폭, 스토리지 상태 등 핵심 지표를 이벤트 로그와 함께 통합 분석한다. 자동 토폴로지 탐색 기능으로 노드 간 워크로드 흐름을 시각적으로 추적해, 문제 해결 효율을 최대 90%까지 끌어올린다.

 

예측 기반 하드웨어 상태 관리 기능도 강화했다. GPU와 스토리지 성능 추이를 분석해 이상 징후를 조기에 감지하고, 최대 7일 전에 고장 위험을 예측함으로써 계획되지 않은 다운타임을 줄인다.

 

인프라 장애와 AI 워크로드를 연결하는 종단 간 가시성도 제공한다. 대역폭, 지연 시간, 패킷 손실 지표를 개별 AI 학습·추론 작업과 직접 매핑해 분석하며, 내부 지연을 밀리초 수준으로 유지하고 패킷 손실률을 0.01% 이하로 관리해 연산 자원 낭비를 최소화한다.

 

지능형 자동화 O&M 프레임워크는 장애 감지부터 원인 분석, 복구까지 전 과정을 자동화한다. 자동 백업 성공률 99.8%, 5분 이내 장애 원인 자동 식별률 최대 90%를 달성하며, O&M 효율을 최대 4배까지 향상시킨다. 스토리지 용량 리스크를 최대 3일 전에 예측해 총소유비용(TCO)을 최대 40% 절감하고 평균 복구 시간(MTTR)도 크게 단축한다.

 

검증된 성과 기반으로 한국 시장 공략 확대

케이투스는 KSManage를 포함한 AI 데이터센터 운영 솔루션을 중심으로 국내 클라우드 사업자와 AI 인프라 운영 기업과의 기술 협력 및 파트너십을 확대할 계획이다. 이를 통해 한국 AI 데이터센터의 안정성과 운영 효율 향상을 적극 지원한다.

 

#케이투스 #KAYTUS #KSManage #AI데이터센터 #데이터센터운영 #운영가시성 #GPU클러스터 #액체냉각

 
?

  1. 서비스나우·오픈AI, 엔터프라이즈 AI 성과 가속 위한 전략적 협력 확대

    - 다년 계약 기반 최첨단 오픈AI 모델 역량 직접 활용 - STS·네이티브 음성 기술로 언어 장벽 제거 및 자연스러운 상호작용 구현 - 서비스나우 고객 대상 오픈AI 모델 우선 AI 지능 제공 서비스나우는 오픈AI와 에이전틱 AI 경험 강화를 위한 전략적 협력을 확...
    Date2026.01.21 Bynewsit Views9
    Read More
  2. 티맥스티베로, 근로복지공단 ‘고용·산재보험 토탈서비스’ 클라우드 네이티브 전환 성료

    - 대규모 트래픽 환경서 응답 속도 95% 개선 - 티베로 DBMS 기반 MSA 최적화로 무중단 운영 구현 공공 대국민 행정 시스템의 클라우드 네이티브 전환이 성능 개선 성과로 이어지고 있다. 데이터베이스 전문기업 티맥스티베로는 근로복지공단의 핵심 대국민 서...
    Date2026.01.21 Bynewsit Views15
    Read More
  3. 케이투스, 데이터센터 운영 플랫폼 KSManage 고도화…AI 인프라 가시성 강화

    - 부품부터 AI 작업까지 4단계 통합 가시성으로 안정성·운영 효율 동시 강화 엔드투엔드 AI 및 액체냉각 솔루션 전문기업 케이투스가 AI 데이터센터 운영·관리 플랫폼 ‘KSManage’를 업그레이드하며, AI 데이터센터 운영 가시성과 안정성 강화에 나섰다. 이번에...
    Date2026.01.20 Bynewsit Views15
    Read More
  4. 세일즈포스, WEF 2026서 AI 컨시어지 앱 ‘EVA’ 공개

    - 에이전트포스 360 기반 에이전틱 AI로 3,000여 명 참석자 일정·의사결정 지원 - 단순 챗봇 넘어 추론·행동 수행… WEF AX 가속화 사례 제시 세일즈포스가 56회 세계경제포럼(WEF) 연차총회에서 AI 컨시어지 애플리케이션 ‘EVA’를 공개했다. EVA는 에이전트포...
    Date2026.01.19 Bynewsit Views27
    Read More
  5. HS효성인포메이션시스템, AI 데이터 레이크 고도화로 스트라드비젼 학습·검증 효율 개선

    - 오브젝트 스토리지·올플래시 NAS 최적 설계로 GPU 활용률·데이터 처리 성능 동시 향상 - 단순 구축 넘어 AI 비즈니스 성장을 고려한 중장기 인프라 전략 지원 AI·데이터 인프라 솔루션 기업 HS효성인포메이션시스템이 자율주행 AI 비전 인식 기업 스트라드비...
    Date2026.01.19 Bynewsit Views22
    Read More
  6. 티맥스티베로, 삼성클라우드플랫폼 마켓플레이스에 이중화 기술 ‘TAC’ 등록

    - 공유 디스크 기반 액티브-액티브 이중화로 공공 클라우드 서비스 연속성 대응 - 공공 IT 장애 이후 확산되는 고가용 DB 수요에 대안 제시 데이터베이스 전문기업 티맥스티베로가 티베로 DBMS의 공유 디스크 기반 고가용성 클러스터링 솔루션 ‘티베로 TAC(Tib...
    Date2026.01.16 Bynewsit Views37
    Read More
  7. 알리바바, Qwen 앱 고도화… 커머스·결제·여행 잇는 에이전틱 AI 공개

    - 커머스·여행·결제·생활 서비스 아우르는 실행형 AI로 진화 알리바바그룹이 소비자 대상 AI 애플리케이션 Qwen 앱의 대규모 업데이트를 공개하며, ‘에이전틱 AI(Agentic AI)’ 전략을 본격화했다. 이번 업데이트는 고도화된 AI 역량을 일상 서비스 실행 단계까...
    Date2026.01.16 Bynewsit Views44
    Read More
  8. 티유브이슈드, 국립목포대·대만 TIWTC와 풍력 안전·기술 인재 양성 협약

    - 신안 GWO 교육센터 기반, 풍력산업 안전 및 기술 역량 고도화를 위한 3자 협력 글로벌 시험 인증기관 티유브이슈드(TUV SUD)는 국립목포대학교, 대만국제풍력교육공사(TIWTC)와 풍력산업 인력 양성 및 안전, 기술 교육 강화를 위한 업무협약(MOU)을 체결했다...
    Date2026.01.16 Bynewsit Views35
    Read More
  9. 스노우플레이크, 2026년 엔터프라이즈 AI 전망…에이전틱 AI·데이터 전략이 성과 좌우

    - 신뢰성 확보·데이터 활용 전략이 핵심 변수…리테일·금융·제조 산업별 방향 제시 스노우플레이크가 ‘AI + 데이터 예측 2026 보고서’를 발간하고, 2026년 엔터프라이즈 AI 성과를 가르는 핵심 요소로 에이전틱 AI의 신뢰성 확보와 데이터 활용 전략을 제시했다...
    Date2026.01.15 Bynewsit Views42
    Read More
  10. [CES 2026] 위로보틱스, CES서 휴머노이드·웨어러블 로봇 사업 성과 가시화

    - 휴머노이드 로봇 ALLEX·웨어러블 로봇 WIM 중심으로 글로벌 협업 논의 구체화 로보틱스 기업 위로보틱스가 미국 라스베이거스에서 열린 CES 2026 전 일정을 성공적으로 마무리했다. 위로보틱스는 이번 CES를 통해 휴머노이드 로봇과 웨어러블 로봇을 중심으...
    Date2026.01.15 Bynewsit Views44
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 220 Next
/ 220
CLOSE