- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

 

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

 

 

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다. 

 

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

 

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

 

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

 

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

 

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다. 

 

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

 

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

 

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다. 

 

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

 

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

 

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

 

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

 

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

 

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다. 

 

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고  밝히고,  "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

 

#엔비디아#네모#라이터#인셉션#트리톤#추론#

 

 

?

  1. 캐논코리아, CCTV 마스킹 솔루션 'CKR 프라이버시 마스크’ 국제나은병원에 1호 구축

    - 캐논코리아, 국제나은병원에 의료사고 방지 및 프라이버시 보호 솔루션'CKR 프라이버시 마스크’ 공급 - ▲AI기반 카메라 ▲녹화 관제 소프트웨어 ▲암호화 반출프로그램을 결합한 원스텝 통합영상보안솔루션 캐논코리아는 네트워크 카메라 마스킹 솔루션인 ‘CKR...
    Date2023.08.31 Bynewsit Views393
    Read More
  2. 어플라이드 머티어리얼즈, 새로운 웨이퍼 생산 플랫폼 ‘비스타라’ 발표… 반도체 생산 문제 해결 지원

    - 유연성: 어플라이드 및 어플라이드 고객사의 다양한 챔버 유형∙크기∙구성 수용 - 인텔리전스: 방대한 센서 데이터가 어플라이드 AIx 플랫폼에 전달… 연구개발 가속, 출시 속도 단축, 생산량∙수율 극대화 - 지속가능성: 플랫폼 최초로 팹 전력, 화학물질, 건...
    Date2023.08.31 Bynewsit Views463
    Read More
  3. 이글루코퍼레이션, SIEM 특허 취득…“사이버 위협 분석 시간 단축으로 공격 대응 역량 향상”

    - 이글루코퍼레이션, 보안 운영 효율성·SIEM 솔루션 성능 높이는 기술 개발 - 공격자 IP 정보 추출 소요 시간 단축하는 특허 적용 통해, 공격 대응 역량 향상 기대 이글루코퍼레이션은 사이버 위협 분석 시간을 단축시키는 보안 정보 및 이벤트 관리(SIEM) 특...
    Date2023.08.31 Bynewsit Views322
    Read More
  4. 뱅앤올룹슨, 페라리와 협업으로 ‘페라리 컬렉션’ 론칭…“헤드폰과 스피커 시리즈 재해석”

    - 최고의 성능과 우아한 디자인, 정교한 장인정신을 결합한 컬렉션 완성 뱅앤올룹슨(Bang & Olufsen)이 모터스포츠의 선구자 페라리와 함께 새로운 컬렉션을 발표했다. 뱅앤올룹슨 페라리 컬렉션은 기존의 헤드폰과 스피커 시리즈의 재해석을 통해 뱅앤올룹슨...
    Date2023.08.30 Bynewsit Views359
    Read More
  5. 엔비디아, 구글 클라우드와 파트너십 확대...“새로운 AI 인프라와 소프트웨어 출시”

    - 엔비디아 생성형 AI 기술, 구글 딥마인드와 구글 리서치 팀부터 전 세계 구글 클라우드 고객까지 지원 엔비디아가 구글 클라우드(Google Cloud)와 파트너십을 확대한다고 발표했다. 이 파트너십을 통해 고객을 위한 새로운 AI 인프라와 소프트웨어를 출시할 ...
    Date2023.08.30 Bynewsit Views710
    Read More
  6. 캐논코리아, 물류관리시스템 「SAON Pro」출시…“병원 실무에 최적화”

    - 캐논코리아 Medical ERP의 물류관리 모듈을 별도 개발한 신규 물류관리시스템 - 소규모 의원 및 중소병원의 물류관리 프로세스 맞춤 솔루션으로 업무 효율성 향상 캐논코리아가 소규모 의원 및 중소병원을 타깃으로 한 병원 실무에 최적화된 물류관리시스템 ...
    Date2023.08.30 Bynewsit Views718
    Read More
  7. 뉴렐릭, 업계 최초 AI 기반 추천 알림 기능으로 AIOps 역량 향상

    - 알림 설정 내 커버리지 갭 파악 및 AI 기반 추천 조건을 활용한 새로운 알림 생성 - 뉴렐릭 올인원 플랫폼 서비스로 이용 가능 뉴렐릭이 추천 알림(Recommended alerts)기능으로 AIOps 역량을 더욱 개선했다고 밝혔다. 해당 기능은 인공지능(AI)를 활용해 비...
    Date2023.08.30 Bynewsit Views747
    Read More
  8. 슈나이더 일렉트릭, 차세대 무효전력 보상 솔루션 ‘파워로직 EVC 플러스(EVC+)’ 출시…“전기 에너지 효율 개선”

    - 전력·기계 장비에서 발생되는 무효전력으로 인한 역률 저하 개선 - 공항, 병원, 선박, 상업 시설 등 전기가 사용되는 다양한 산업군에서 사용 가능 슈나이더 일렉트릭 코리아는 차세대 무효전력 보상 솔루션 ’파워로직(PowerLogic) EVC플러스(EVC+)’를 출시...
    Date2023.08.30 Bynewsit Views532
    Read More
  9. 마우저, 디지털 공장 구현 전자책 발간…“ADI의 혁신 기술 정보 수록”

    마우저 일렉트로닉스는 아나로그디바이스와 협력하여 센서, 에지 컴퓨팅 및 고속 산업용 통신 등 디지털 공장을 지원하는 새로운 기술 발전을 탐구할 수 있는 전자책을 발간했다고 밝혔다. ‘디지털 공장으로 나아가는 길’이라는 제목으로 여러 산업 분야 9명의...
    Date2023.08.29 Bynewsit Views494
    Read More
  10. 인포빕, 대화형 상거래를 통한 고객 경험 혁신’ 인포브리프 발간…“한국 기업 75% 대화형 AI 고객 서비스 확대”

    - 고객 중심 전략 위한 AI 기반 대화형 상거래, 옴니채널 커뮤니케이션 플랫폼 부각 - 한국 기업, 디지털 전환과 신규 수익원 창출 등 목표로 커뮤니케이션 플랫폼 활용 - 한국 기업 63% 커뮤니케이션 플랫폼 사용… 75% 기업 2024년까지 투자 확대 전망 인포빕...
    Date2023.08.29 Bynewsit Views555
    Read More
  11. HPE 아루바, ‘컬리’에 네트워킹 모빌리티 컨덕터 기반 지능형 무선랜 인프라 구축…“최첨단 물류 시스템 실현”

    - HPE 아루바 네트워킹 모빌리티 컨덕터 기반 지능형 무선랜 인프라 구축으로 컬리 최대규모 평택 물류센터 내 무중단 서비스 구현 - HPE 아루바 네트워킹 UXI로 중앙에서 자동으로 문제 식별할 수 있는 네트워크 품질 감지 체계를 마련, 더욱 신속하게 대응 ...
    Date2023.08.29 Bynewsit Views301
    Read More
  12. 스틸시리즈-펄어비스, 검은사막에 최적화된 검은사마우스 한정판 출시

    - 검은사막 아침의 나라를 모티브로 디자인된 검은사마우스 출시 - 검은사마우스 한정판, 스틸시리즈 에어록스 5 무선 게이밍 마우스, - 검은사막 동양화 미니 병풍, 인 게임 쿠폰 3종 구성으로 게이머 소장욕구 자극 스틸시리즈가 게임 개발사 펄어비스와 함...
    Date2023.08.29 Bynewsit Views435
    Read More
  13. MSI, IFA 2023에서 혁신적인 노트북 대거 공개…“압도적 성능과 빼어난 디자인”

    - 9월 1일부터 베를린에서 열리는 'IFA 2023' 참가 엠에스아이코리아는 오는 9월 1일부터 5일까지 독일 베를린에서 열리는 국제가전박람회 'IFA 2023'에 참가해 '스텔스 16 메르세데스-AMG 모터스포츠' 및 '커머셜 14 H' 등 고성능 노트북을 전시한다고 밝혔다...
    Date2023.08.29 Bynewsit Views369
    Read More
  14. 캐논코리아, 컬러 디지털 상업 인쇄기 ‘imagePRESS V900’ 시리즈 출시

    - imagePRESS V900, 캐논의 차세대 컬러 디지털 상업 인쇄기 라인업인 ‘V’ 시리즈를 완성하는 엔트리 모델 캐논코리아가 상업 인쇄 비즈니스에 최적화된 컬러 디지털 상업 인쇄기 'imagePRESS V900' 시리즈를 출시했다고 밝혔다. 'imagePRESS V900' 시리즈는 ...
    Date2023.08.29 Bynewsit Views436
    Read More
  15. 모토로라, ‘레이저40 울트라’ 국내 출시… 플립형 스마트폰 중 최대 크기 3.6인치 커버 디스플레이 탑재

    - 출시 초기 프로모션 통해 쿠팡, 11번가 기준 최대99만9천원의 파격적 할인 혜택 제공 - 기존 레이저폰 재해석한 세련된 디자인으로 3.6인치 시원한 크기와 144Hz 고속 화면 재생율 조합 - 업계 최고 성능 커버 디스플레이와 접었을 때 틈새 없는 설계 바탕으...
    Date2023.08.29 Bynewsit Views413
    Read More
  16. 포티넷, 2가지 신규 SD-WAN 서비스 발표…“디지털 경험을 향상과 SD-WAN 운영 간소화”

    - 새로운 언더레이 및 오버레이 서비스 통해 운영자 리소스가 부족한 조직들도 효과적으로 SD-WAN을 구축 가능 포티넷 코리아는 오늘, ‘SD-WAN을 위한 언더레이 성능 모니터링 서비스(Underlay Performance Monitoring Service for SD-WAN)’와 ‘SD-WAN을 위한 ...
    Date2023.08.29 Bynewsit Views390
    Read More
  17. 오라클 OCI, VM웨어 클라우드 유니버설 프로그램에 합류

    - 고객의 애플리케이션 및 클라우드 현대화 조기 달성 지원 위해 VM웨어와 협력 강화 오라클이 고객의 오라클 클라우드 인프라스트럭처(OCI) 기반 VM웨어 워크로드 현대화를 지원하기 위해 VM웨어와의 파트너십을 확장했다. 확장된 파트너십 하에서 고객들은 ...
    Date2023.08.29 Bynewsit Views655
    Read More
  18. SAP, WTA의 데이터 기반 운영 효율성 제고

    - SAP, SAP 비즈니스 테크놀로지 플랫폼으로 여자 테니스 협회(WTA) 데이터 관리 일원화 및 인사이트 도출 지원 - WTA, 오는 10월 하나은행 코리아오픈 테니스대회 비롯해 다수의 대회 연내 개최하고 SAP 솔루션 적극 활용 SAP는 여자 테니스 협회(WTA)가 SAP ...
    Date2023.08.28 Bynewsit Views530
    Read More
  19. 시디즈, 프리미엄 게이밍 의자 ‘GC PRO’ IDEA 디자인 어워드 본상 수상

    - GC PRO, 게이머의 ‘앉음’을 고려해 기능은 물론 감성적인 부분까지 고안한 디자인 우수성 입증 - 사용자의 목적과 상황에 맞는 ‘시팅 솔루션’ 제공하는 인간공학적 의자 지속 공개 예정 퍼시스그룹의 의자 전문 브랜드 시디즈는 프리미엄 게이밍 의자 ‘GC PR...
    Date2023.08.25 Bynewsit Views391
    Read More
  20. 크리아이티, VM웨어 데스크톱 가상화 솔루션 ‘국가정보원 보안기능확인서’ 취득

    클라우드 전문기업 크리아이티는 자사에서 개발한 VM웨어 가상화 관리 솔루션 ‘VDCops v3.0 for Horizon’이 국가 및 공공기관의 제품 도입 필수항목인 ‘국가정보원 보안기능확인서’를 취득했다고 밝혔다. 이로써 VM웨어 VDI 솔루션을 고려 중이던 공공기관들은...
    Date2023.08.25 Bynewsit Views464
    Read More
Board Pagination Prev 1 ... 196 197 198 199 200 201 202 203 204 205 ... 288 Next
/ 288
CLOSE