- 사전 학습된 머신 러닝 모델을 엣지 추론 노드에 분산 배포

- 180개 이상의 엣지 노드로 구성된 지코어 글로벌 네트워크 통해 최종 사용자와 가장 가까운 곳에서 실행

- AI 추론에 특화된 엔비디아 L40S GPU에서 실행. 30밀리초 미만의 응답시간 보장

 

지코어, ‘인퍼런스 앳더 엣지’ 솔루션 출시…“원활한 실시간 추론 보장“.PNG

지코어(Gcore)AI 애플리케이션에 초저지연 경험을 실시간 제공하는 인퍼런스 앳더 엣지(Inference at the Edge)’ 솔루션을 출시한다고 10일 밝혔다. 이 혁신적인 솔루션은 사전 학습된 머신 러닝 모델을 전 세계에 분포돼 있는 엣지 추론 노드 중 사용자와 가장 가까운 경로 또는 위치에서 응답할 수 있도록 함으로써 원활한 실시간 추론을 보장한다.

 

지코어 인퍼런스 앳더 엣지는 180개 이상의 엣지 노드로 구성된 지코어의 광범위한 글로벌 네트워크(PoP)에서 실행되며, 모두 지코어의 정교한 저지연 스마트 라우팅 기술로 상호 연결된다. 고성능의 각 노드는 지코어 네트워크 중 최종 사용자와 가까운 엣지에 전략적으로 배치된다.

 

무엇보다 지코어 각 엣지에서의 AI 추론은, 이를 위해 특별히 설계된 업계 내 최고의 칩인 엔비디아(NVIDIA) L40S GPU에서 실행된다. 사용자가 요청을 보내면 엣지 노드는 지연 시간이 가장 짧은, 가장 가까운 엣지 추론 노드로 경로를 설정하여 일반적으로 30ms 미만의 응답 시간을 보장한다. 네트워크 간 최대 대역폭도 200Tbps로 최고 수준의 학습 및 추론 능력이 가능하다.

 

또한, 인퍼런스 앳더 엣지는 광범위한 기본 머신 러닝 및 커스텀 모델을 지원한다. 지코어 머신 러닝 모델 허브에서 사용 가능한 오픈 소스 기반 모델로는 LLaMA Pro 8B, Mistral 7B, Stable-Diffusion XL 등이 있다. 여러 형식 또는 여러 소스로부터 데이터를 수신해, 모델을 사용 사례에 맞게 선택하고 학습한 후 전 세계에 위치하고 있는 인퍼런스 앳더 엣지 노드에 배포할 수 있다. 이는 일반적으로 개발팀이 직면하는 중요한 문제 중 하나인, 이미 AI 모델이 학습된 동일한 서버에서 다시 실행됨으로써 발생하는 성능이 저하되는 문제를 해결해 준다.

 

지코어 인퍼런스 앳더 엣지의 주요 이점에는 유연한 가격구조로 고객이 사용한 리소스에 대해서만 비용을 지불할 수 있어 비용 효율적인 배포가 가능 디도스 공격에도 머신 러닝의 각 앤드포인트가 지코어의 인프라를 통해 자동으로 보호되는 내장형 디도스 보호 기능 GDPR, PCI DSS, ISO/IEC 27001 등 업계 표준을 준수하는 뛰어난 데이터 프라이버시 및 보안을 보장 모델 자동확장 기능으로 모델이 항상 최대 수요는 물론 예기치 않은 로드 급증을 지원 빠르게 진화하는 요구에 맞춰 S3 호환 클라우드 오브젝트 스토리지를 무제한 제공등이 있다.

 

이러한 강점을 통해 지코어 인퍼런스 앳더 엣지는 자동차, 제조업, 유통, 테크놀로지 등 다양한 산업 분야의 기업들이 비용 효율적이고 확장 가능하며, 안전한 AI 모델 배포를 통해 역량을 강화할 수 있도록 지원한다. 이를 통해 기업은 생성형 AI, 객체 인식, 실시간 행동 분석, 가상 비서, 생산 모니터링과 같은 사용 사례를 글로벌 규모로 빠르게 실현할 수 있다.

 

지코어 안드레 레이텐바흐 CEO"지코어 인퍼런스 앳더 엣지는 고객이 전 세계에 AI 애플리케이션을 배포하는 데 필요한 비용과 기술, 인프라에 대해 걱정할 필요 없이 머신 러닝 모델을 학습시키는 데 집중할 수 있도록 지원한다고 설명하고, “지코어는 엣지가 최고의 성능과 최종 사용자 경험을 제공하는 곳이라고 믿으며, 모든 고객이 탁월한 규모와 성능을 누릴 수 있도록 지속적으로 혁신해 나가고 있다고 밝혔다.

 

또한, “인퍼런스 앳더 엣지는 전 산업 분야에 걸쳐 현대적이고 효과적이며, 가장 효율적인 AI 추론 환경을 제공하게 될 것"이라고 강조했다.

 

#지코어#AI#인퍼런스#엣지#머신러닝#추론#엔비디아#

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3113 헥사곤-경남대, 글로컬대학30 및 RISE 사업 추진 협력 MOU 체결 file newsit 2024.07.26 499
3112 Dell, 델 데이터 레이크하우스에 성능 ‘워프 스피드’ 추가 file newsit 2024.07.26 444
3111 캐논코리아, 'PIXMA G' 시리즈 신제품 6종 출시…“자동양면인쇄와 대용량 출력 기능” file newsit 2024.07.26 183
3110 엔비디아 AI 파운드리, 메타 '라마 3.1'로 전 세계 기업 맞춤형 AI 강화 file newsit 2024.07.25 277
3109 쿠도커뮤니케이션, 카스퍼스키 글로벌 신뢰성 강조…“국내 고객 지원 강화” file newsit 2024.07.25 190
3108 티머니, ‘비전 2030’ 선포식 개최…“더 편한 이동과 결제를 위한 플랫폼 기업” file newsit 2024.07.25 130
3107 효성인포메이션시스템, 고성능 AMD 기반 하이브리드 클라우드 솔루션 제공 file newsit 2024.07.25 245
3106 알리바바, ‘To the Greatness of HER’ 공개…“여성 올림픽 선수의 업적 기념 단편 영화” file newsit 2024.07.25 378
3105 딥엘, AI 번역 서비스에 ‘중국어 번체’ 추가 file newsit 2024.07.25 414
3104 이글루코퍼레이션, 클라우드 및 SOAR 특허 2건 취득…“클라우드 보안·SOAR 솔루션 품질 향상 위한 핵심 기술 확보” file newsit 2024.07.25 224
3103 지코어, 6천만 달러 규모의 시리즈A 투자 유치 file newsit 2024.07.24 392
3102 유니버설 로봇 코리아, '이티에스로보틱스 공인인증 교육센터 '개소 file newsit 2024.07.24 412
3101 캐논코리아, 골프 거리측정기 ‘파워샷 골프’ 정식 판매 개시 file newsit 2024.07.24 183
3100 엠클라우드브리지, 기업용 오픈AI & 챗GPT 업무 플랫폼 출시…“즉시 사용 가능” file newsit 2024.07.24 504
3099 지멘스-BAE, 디지털 혁신 가속 위한 5년 협약 체결 file newsit 2024.07.24 428
3098 가민, 가민 런 클럽(GRC) 4기 모집…“가민 전문 페이서 육성” file newsit 2024.07.24 188
3097 원프레딕트, ‘AI 자율제조 얼라이언스’ 가입… 국내 제조업 AI 도입 가속화 지원 file newsit 2024.07.24 359
3096 벡터, 닛산 자동차의 오토사(AUTOSAR) 기본 소프트웨어 공급 벤더로 선정 file newsit 2024.07.24 473
3095 가트너, "2023년 전 세계 IaaS 시장 16.2% 성장" file newsit 2024.07.23 380
3094 ST, 새로운 싱글존 다이렉트 ToF 센서 「VL53L4ED」 출시…“산업용 애플리케이션에서 확장된 동작 온도 지원” file newsit 2024.07.23 268
Board Pagination Prev 1 ... 128 129 130 131 132 133 134 135 136 137 ... 288 Next
/ 288
CLOSE