- 데이터 플라이휠 활용해 지속적으로 최적화하는 엔드 투 엔드 개발자 플랫폼 제공

- 기업 맞춤형 AI 에이전트 구축 위한 다양한 마이크로서비스 통합 지원

- AT&T, 블랙록, 시스코 등에서 선도적으로 도입해 AI 에이전트 정확성과 응답 시간 개선

 

엔비디아, 기업 생산성 강화하는 ‘네모 마이크로서비스’ 정식 출시.jpg

엔비디아가 에이전트 기반 AI 플랫폼 개발을 가속화하고 기업의 생산성을 높이는 ‘엔비디아 네모 마이크로서비스(NVIDIA NeMo microservices)’를 정식 출시했다고 밝혔다. AI 에이전트의 정확성, 적시성, 관련성은 이것을 구동하는 데이터에 달려 있다.

 

이번에 정식 출시된 엔비디아 네모 마이크로서비스는 기업 IT 부서가 데이터 플라이휠(flywheel)을 활용해 직원 생산성을 높일 수 있는 AI 팀원을 빠르게 구축하도록 지원한다. 또한, 엔드 투 엔드 개발자 플랫폼을 제공해 최첨단 에이전틱 AI(Agentic AI) 시스템 개발 및  추론 결과, 비즈니스 데이터, 사용자 선호도에 기반한 데이터 플라이휠을 통해 지속적인 최적화를 지원한다.

 

데이터 플라이휠을 통해 기업 IT 부서는 AI 에이전트를 디지털 팀원으로 온보딩할 수 있다. 이러한 에이전트는 사용자 상호작용과 AI 추론 과정에서 생성된 데이터를 활용해 모델 성능을 지속적으로 개선할 수 있다. 이를 통해 ‘사용’을 ‘인사이트’로, ‘인사이트’를 ‘실행’으로 전환할 수 있다.

 

에이전틱 AI를 위한 강력한 데이터 플라이휠 구축

데이터베이스, 사용자 상호작용, 현실 세계의 신호 등의 고품질 입력이 지속적으로 제공되지 않으면 에이전트의 이해력은 약화된다. 그 결과, 응답의 신뢰성은 떨어지고 에이전트의 생산성도 저하될 수 있다.

 

운영 환경에서 AI 에이전트를 구동하는 모델을 유지하고 개선하기 위해서는 세 가지 유형의 데이터가 필요하다. 인사이트를 수집하고 변화하는 데이터 패턴에 적응하기 위한 추론 데이터, 인텔리전스를 제공하기 위한 최신 비즈니스 데이터, 모델과 애플리케이션이 예상대로 작동하는지를 판단하기 위한 사용자 피드백 데이터가 그것이다. 네모 마이크로서비스는 개발자가 이 세 가지 유형의 데이터를 효율적으로 활용할 수 있도록 지원한다.

 

또한, 네모 마이크로서비스는 에이전트를 구동하는 모델을 선별하고, 맞춤화하며, 평가하고, 안전장치를 적용하는 데 필요한 엔드 투 엔드 툴을 제공함으로써 AI 에이전트 개발 속도를 높인다.

 

엔비디아 네모 마이크로서비스네모 커스터마이저(Customizer), 네모 이밸류에이터(Evaluator), 네모 가드레일(Guardrails)을 포함하며, 네모 리트리버(Retreiver), 네모 큐레이터(Curator)와 함께 사용되어 맞춤형 엔터프라이즈 데이터 플라이휠을 통해 AI 에이전트의 구축 및 최적화, 확장하는 과정을 기업이 보다 수월하게 수행할 수 있도록 지원한다.

 

  • 네모 커스터마이저거대 언어 모델(LLM) 미세 조정을 가속화해 최대 1.8배 높은 훈련 처리량을 제공한다. 이 고성능 마이크로서비스는 확장성이 뛰어나며, 지도 학습 미세 조정(supervised fine-tuning)과 LoRA(Low-Rank Adaptation) 등 널리 사용되는 사후 훈련 기술을 사용한다.
  • 네모 이밸류에이터는 개인과 산업 벤치마크에서 AI 모델과 워크플로우의 평가를 단 5번의 API 호출로 간소화한다.
  • 네모 가드레일은 단 0.5초의 추가 지연 시간만으로 규정 준수 보호 기능을 최대 1.4배까지 향상시킨다. 이를 통해 조직은 정책과 지침에 부합하는 강력한 안전, 보안 조치를 구현할 수 있다.

 

개발자는 네모 마이크로서비스를 통해 AI 에이전트의 정확성과 효율성을 높이는 데이터 플라이휠을 구축할 수 있다. 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼을 통해 배포되는 네모 마이크로서비스는 온프레미스 또는 클라우드의 모든 가속 컴퓨팅 인프라에서 엔터프라이즈급 보안, 안정성, 지원과 함께 손쉽게 운영할 수 있다. 이 마이크로서비스는 기업들이 수백 개의 전문화된 에이전트를 협업시키는 대규모 멀티 에이전트 시스템을 구축하고 있는 현재, 정식 출시됐다. 각 에이전트는 고유의 목표와 워크플로우를 가지고 있으며, 디지털 팀원으로서 복잡한 업무를 함께 해결하며 직원들의 업무를 보조하고 강화하며 가속화한다.

 

이러한 기업 전반의 영향력은 AI 에이전트를 1조 달러 규모의 기회로 자리매김하게 한다. 적용 사례는 자동 사기 탐지, 쇼핑 도우미, 예측 기반 설비 유지보수, 문서 검토 등 다양하다. 또한, 비즈니스 데이터를 실행 가능한 인사이트로 전환하는 데 있어 데이터 플라이휠이 얼마나 중요한 역할을 하는지 다시 한번 강조한다.

 

네모 마이크로서비스로 AI 에이전트의 정확도를 높이는 업계 선도 기업들

엔비디아 파트너사들과 업계 선도 기업들은 디지털 팀원이 더 많은 업무를 수행할 수 있도록 반응형 AI 플랫폼을 구축하기 위해 네모 마이크로서비스를 사용하고 있다.

 

AT&T아리즈(Arize), 퀀티파이(Quantiphi)와 협력해 약 1만 건의 문서로 구성된 지식 베이스를 매주 업데이트하며 처리할 수 있는 고급 AI 기반 에이전트를 엔비디아 네모를 사용해 구축했다. 이 확장 가능한 고성능 AI 에이전트는 속도, 비용 효율성, 정확성이라는 세 가지 핵심 비즈니스 우선순위에 맞게 미세 조정됐고, 이는 AI 도입이 확대됨에 따라 점점 더 중요해지고 있다.

 

AT&T는 개인화된 서비스 제공, 사기 방지, 네트워크 성능 최적화를 위해 미스트랄(Mistral) 7B 모델을 미세 조정했다. 여기에는 네모 커스터마이저와 이밸류에이터가 활용됐으며, 이를 통해 AI 에이전트의 정확도는 최대 40%까지 향상됐다.

 

블랙록(BlackRock)은 공통 데이터 언어를 통해 투자 관리 프로세스를 통합하는 자사의 알라딘(Aladdin) 기술 플랫폼에 에이전틱 AI 기능을 더하기 위해 네모 마이크로서비스를 활용한다. 갈릴레오(Galileo)와 협력한 시스코(Cisco)의 아웃시프트(Outshift) 팀은 도구 선택 오류를 최대 40% 줄이고 최대 10배 빠른 응답 시간을 달성하는 코딩 어시스턴트를 구동하기 위해 엔비디아 네모 마이크로서비스를 사용하고 있다.

 

나스닥(Nasdaq)은 네모 리트리버 마이크로서비스와 엔비디아 NIM 마이크로서비스로 나스닥 젠 AI 플랫폼(Gen AI Platform)을 가속화하고 있다. 네모 리트리버는 플랫폼의 검색 기능을 향상시켜 정확도와 응답 시간을 최대 30%까지 개선하는 동시에 비용을 절감했다.

 

#엔비디아#네모#마이크로서비스#AI

?

  1. 엔비디아, MS와 함께 RTX AI PC 생태계 확장

    - 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’로 AI 성능 대폭 강화 - 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신 - 프로젝트 G-어시스트 통해 코딩 없이도 AI 기능 개발 지원 엔비디아가 마이크로소프트(Microsoft)와 협력해...
    Date2025.05.21 Bynewsit Views377
    Read More
  2. 스틸시리즈, ‘라이벌 3 Gen 2’ 마우스 출시…“강화된 성능과 다양한 컬러로 재탄생”

    - 라이벌 3 시리즈 5주년 기념 동급 대비 최고 속도, 성능, 내구성으로 업그레이드 - 봄을 맞아 블랙부터 화이트, 라벤더, 아쿠아까지 다양한 색상의 무선 게이밍 마우스 출시 - 5월 21일 ~ 5월 25일 네이버 공식스토어 및 쿠팡 동시 사전 예판 진행 게이밍 기...
    Date2025.05.21 Bynewsit Views140
    Read More
  3. SAP, 연례 콘퍼런스 ‘SAP사파이어 2025’ 개최…“AI 혁신으로 업무 생산성 최대 30% 향상”

    - 기업 운영 방식 재정의할 비즈니스 AI 공개 - 퍼플렉시티 및 팔란티어와의 파트너십 통해 고객의 잠재력 극대화 SAP가 20일 미국 플로리다 올랜도에서 SAP의 연례 콘퍼런스 ‘SAP 사파이어(SAP Sapphire)‘를 개최했다. SAP는 이번 행사에서 모든 사용자에게 ...
    Date2025.05.21 Bynewsit Views508
    Read More
  4. 피아이이, 판교 위든타워에 ‘PIE AI R&D Campus’ 설립…“서강대와 산학협력 본격화”

    - ‘AI+X’ 융합 기술 중심 연구 거점 구축…이차전지 넘어 첨단 산업 맞춤형 AI 솔루션 확대 - 서강대와 산학협력으로 최신 AI 기술의 산업 적용 가속화 및 실용적 기술 생태계 조성 기대 AI 전문기업 피아이이는 서강대학교와 함께 AI 산업화 기술에 관한 연구 ...
    Date2025.05.21 Bynewsit Views463
    Read More
  5. ASUS, 2025 ROG 및 TUF 게이밍 노트북 대거 런칭…“RTX 5060/5070 GPU 탑재”

    - 에이수스, 엔비디아 RTX 5060 및 5070 GPU 탑재한 프리미엄 게이밍 노트북 대거 공개 및 예약 판매 - ROG 스트릭스 G16/18, Q-Latch 힌지 디자인의 원터치 하판 분리 가능…쉽고 간편한 메모리 업그레이드 가능 - TUF 게이밍 A14, 국내 최초 엔비디아 지포스 ...
    Date2025.05.21 Bynewsit Views158
    Read More
  6. 레드햇, ‘레드햇 엔터프라이즈 리눅스 10’ 출시…“하이브리드 환경에서 인텔리전스 및 보안 강화”

    - IT 혁신 위한 견고한 기반 ‘RHEL 10’, AI 기반 리눅스 관리 통해 더욱 지능적인 하이브리드 클라우드 운영 지원 - 미래 양자 기반 위협 완화 위한 보안 기능 추가 - 컨테이너를 OS의 언어로 활용… 신규 ‘레드햇 인사이트’ 기능 통해 보다 정확한 정보에 기반...
    Date2025.05.21 Bynewsit Views434
    Read More
  7. 데카, IBM과 팬아웃 인터포저(MFIT) 제조 계약 체결 발표

    데카 테크놀로지는 IBM과 캐나다 퀘벡주 브로몽에 위치한 IBM의 첨단 패키징 시설에 데카의 M-시리즈 및 어댑티브 패터닝(Adaptive Patterning) 기술을 구현한다는 내용의 계약을 체결한다고 발표했다. 이번 계약을 통해 IBM은 데카의 M-시리즈 팬아웃 인터포...
    Date2025.05.21 Bynewsit Views215
    Read More
  8. [DTW 2025] 델, 소프트웨어 기반의 분리형 인프라로 혁신적인 데이터센터 운영 전략 제시

    - 분리형 인프라스트럭처 전략의 토대로 스토리지 성능 및 사이버 회복탄력성 관련 제품 기능 강화 - 소프트웨어 개발로 프라이빗 클라우드 및 엣지 솔루션의 관리 및 구축 자동화 델 테크놀로지스는 오늘 분리형(disaggregated) 데이터센터를 통한 인프라 현...
    Date2025.05.21 Bynewsit Views445
    Read More
  9. No Image

    슬랙, NH투자증권 혁신금융서비스 지정 승인…“금융 산업의 디지털 업무 환경 구축 선도”

    - NH투자증권, 국내 최초 혁신금융서비스 지정 승인 기반의 슬랙 도입 - 온프레미스 시스템 한계 극복… 실시간 커뮤니케이션 및 자동화로 생산성 극대화 - 고객 응대 속도 향상 및 의사결정 체계 간소화 기대… 국내 금융권 디지털 전환 기반 마련 세일즈포스는...
    Date2025.05.21 Bynewsit Views634
    Read More
  10. 사이냅소프트, 국내 최대 B2B 오픈마켓 도매꾹에 ‘사이냅 OCR Pro’ 공급

    - 사이냅 OCR Pro, 대형 이미지 문제 해결 생산성 극대화 사이냅소프트는 자사의 AI기술이 적용된 ‘사이냅 OCR Pro’를 국내 최대 B2B 오픈마켓 ‘도매꾹·도매매’에 공급했다고 밝혔다. 이번 공급을 통해 지앤지커머스가 운영하는 ‘도매꾹·도매매’ 서비스의 제품...
    Date2025.05.20 Bynewsit Views445
    Read More
  11. MSI, 지포스 RTX 5060 GPU 시리즈 그래픽카드 출시

    - GDDR7 메모리와 DLSS 4 탑재, 고해상도 게임 성능 대폭 향상 - 이전 세대 대비 냉각 기술이 모두 업그레이드 된 게이밍, 벤투스, 신제품 쉐도우 출시 엠에스아이코리아는 새롭게 출시된 NVIDIA 지포스 RTX 5060 GPU 기반의 최신 그래픽카드 라인업인 ‘게이밍...
    Date2025.05.20 Bynewsit Views167
    Read More
  12. MSI, ‘플레이엑스포’에서 NVIDIA 지포스 RTX 50 체험존 운영

    - 수도권 최대 게이밍 이벤트 플레이엑스포에서 ‘지포스 RTX 50 시리즈 체험존’ 운영 - 지포스 RTX 5090/5080이 탑재된 데스크탑, 노트북을 직접 체험 가능 엠에스아이코리아는 수도권 최대 규모의 게임문화 축제 ‘2025 플레이엑스포(PlayX4)’에 ‘지포스 RTX 5...
    Date2025.05.20 Bynewsit Views146
    Read More
  13. ST, 새로운 통합 「STM32WBA6」 무선 마이크로컨트롤러 출시…“기능 및 성능, 전력 효율성 결합”

    - 스마트 홈, 헬스케어, 공장, 농업 분야의 새로운 2.4GHz 무선 애플리케이션 지원 ST마이크로일렉트로닉스가 컨슈머 및 산업용 기기를 IoT에 손쉽게 연결하도록 지원하는 차세대 STM32 저전력 근거리 무선 마이크로컨트롤러(MCU)를 출시했다. 새로운 STM32WBA...
    Date2025.05.20 Bynewsit Views463
    Read More
  14. 슈퍼마이크로, 혁신적인 데이터센터 빌딩 블록 솔루션 공개…“수냉식 데이터센터의 글로벌 구축 간소화 및 가속화”

    - 모든 크리티컬 컴퓨팅 및 냉각 인프라의 설계, 구축, 배포, 운영 간편하게 구현 - 모듈형 구조로 시스템부터 랙, 데이터센터 규모까지 비용 효율성 극대화 - 업계 선도적인 설계, 제조 역량, 관리 소프트웨어, 현지 서비스 및 글로벌 지원으로 높은 품질과 ...
    Date2025.05.20 Bynewsit Views108
    Read More
  15. [Computex 2025] 엔비디아, 폭스콘·대만 정부와 협력해 AI 팩토리 구축

    - 폭스콘 자회사 빅 이노베이션 컴퍼니, 엔비디아 블랙웰 GPU 10,000개 탑재한 엔비디아 블랙웰 슈퍼컴퓨터 구축 - TSMC, 연구 개발 위해 빅 이노베이션 컴퍼니 클라우드 AI 인프라 활용 - 대만 국가과학기술위원회, 산업 전반의 AI 개발과 채택 가속화 위해 ...
    Date2025.05.20 Bynewsit Views417
    Read More
  16. 콩가텍, 콘트론과 협력…“글로벌 제조 역량 향상”

    - 콘트론의 전세계 글로벌 생산 네트워크 기반, 관세 부담 줄이고 글로벌 입지 강화 콩가텍은 글로벌 IoT 공급업체 콘트론(Kontron)과 자사 컴퓨터 온 모듈(COM) 제조 분야에서 협력한다고 발표하고, 콘트론의 SMT(표면실장) 조립 기술 전문성과 전 세계 20개 ...
    Date2025.05.20 Bynewsit Views255
    Read More
  17. 가민, 스마트 인도어 사이클링 트레이너 ‘탁스 네오 3M’ 국내 출시

    - 자갈길, 포장도로, 내리막길 등 실제 주행 도로 지형 조건 완벽 구현 - 가상 플라이휠 및 다방향 움직임 지원하는 모션 플레이트 내장… 혁신 기능 탑재로 최상의 실내 사이클링 훈련 환경 제공 - 실외 주행이 어려운 장마철, 실내에서도 끊김 없는 훈련 가능...
    Date2025.05.20 Bynewsit Views150
    Read More
  18. [Computex 2025] 인텔, 컴퓨텍스에서 AI·워크스테이션용 최신 GPU ‘아크프로 B60/50’ 공개

    - 인텔 아크 프로 GPU 제품 라인업을 프로슈머 및 AI 개발자까지 확대, - 인텔 가우디 3 AI 가속기 랙 스케일 및 PCIe 방식 공급 개시 발표 인텔은 컴퓨텍스 2025에서 전문가와 개발자를 위한 강력한 신규 그래픽 처리 장치(GPU) 및 AI 가속기 제품군을 공개했...
    Date2025.05.20 Bynewsit Views304
    Read More
  19. 델, 엔비디아와 협력해 차세대 엔터프라이즈 AI 솔루션 공개

    - 새롭게 업데이트 된 ‘엔비디아 기반 델 AI 팩토리’, 컴퓨팅 및 데이터 처리 가속화를 위한 혁신 주도, 운영 간소화, AI 구축의 모든 단계에서 더 빠른 성과 내게끔 지원 - 업계 최초이자 유일한 엔드투엔드 엔터프라이즈 AI 솔루션에 업그레이드된 인프라스...
    Date2025.05.20 Bynewsit Views428
    Read More
  20. [Computex 2025] 엔비디아, 세계 최대 규모 양자 연구용 슈퍼컴퓨터 ‘ABCI-Q’ 지원

    - 퀀텀2 인피니밴드 네트워킹 플랫폼으로 상호 연결된 H100 GPU 2,020개 탑재 - 다양한 큐비트 양식 전반에 걸쳐 하이브리드 양자 GPU 작업 실현 엔비디아가 양자-AI 기술 기반 비즈니스 글로벌 R&D 센터(G-QuAT)의 개소를 발표했다. 이 센터에는 엔비디아(NVI...
    Date2025.05.19 Bynewsit Views640
    Read More
Board Pagination Prev 1 ... 57 58 59 60 61 62 63 64 65 66 ... 272 Next
/ 272
CLOSE