- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

 

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

 

 

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다. 

 

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

 

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

 

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

 

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

 

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다. 

 

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

 

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

 

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다. 

 

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

 

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

 

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

 

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

 

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

 

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다. 

 

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고  밝히고,  "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

 

#엔비디아#네모#라이터#인셉션#트리톤#추론#

 

 

?

  1. 세일즈포스, ‘슬랙 세일즈 엘리베이트’ 공개…영업 및 업무 생산성 향상 정조준

    - 슬랙, 세일즈 클라우드와의 통합으로 빠르고 효율적인 영업 활동 지원 - 사용자 피드백 및 요구사항 바탕으로 사용자 경험 및 생산성 향상 위한 기능 및 디자인 대규모 업데이트 세일즈포스가 영업 및 업무 환경의 효율성을 강화하기 위한 ‘슬랙 세일즈 엘리...
    Date2023.08.17 Bynewsit Views555
    Read More
  2. 딥엘, 구독 번역 서비스「딥엘 프로」 출시…“AI 번역기로 한국 기업의 글로벌 소통 지원”

    AI 커뮤니케이션 기업 딥엘(DeepL)이 유료 구독 서비스 딥엘 프로(DeepL Pro)를 국내에 출시했다. 딥엘 프로는 기업, 조직 및 개인이 딥엘의 정확도 높은 AI 기반 번역기에 고급 기능을 추가 지원한다. 한국어를 30개 이상의 글로벌 언어로 번역할 수 있어 한...
    Date2023.08.17 Bynewsit Views604
    Read More
  3. 아이스아이, NASA ‘상업용 소형위성 데이터 획득 프로그램’의 첫 임무 수주  

    아이스아이 US는 올해 초 발표된 NASA와 BPA에 따라 첫 작업 임무를 수주했다고 밝혔다. 이번 임무는 NASA의 지구과학연구 목표를 발전시키기 위한 적합성을 결정하기 위해 아이스아이의 SAR(합성개구레이더) 데이터를 수집하여 과학 및 학계의 평가를 지원하...
    Date2023.08.17 Bynewsit Views369
    Read More
  4. 슈나이더 일렉트릭코리아, 경남대학교와 디지털 기술 인재 양성 위한 MOU 체결

    - 전 사업 영역에서 IT 및OT 통합한 디지털 솔루션 제공 - 디지털 기반 기술 보급 및 개방형 소프트웨어 기반 제어 기술 IEC 61499 표준 활용 인력 양성 슈나이더 일렉트릭 코리아가 경남대학교 산학협력단과 함께 산업 자동화 엔지니어 육성에 적극적으로 나...
    Date2023.08.17 Bynewsit Views491
    Read More
  5. 팔로알토 네트웍스, 프리즈마 클라우드 CI/CD 보안 모듈 출시…“사이더 시큐리티 통합”

    - CNAPP 공급업체 중 최초로 소프트웨어 공급 파이프라인 보안 강화 팔로알토 네트웍스가 CI/CD(지속적 통합/배포) 보안 모듈을 코드-투-클라우드 기능의 일부로서 통합 소프트웨어 형태로 프리즈마 클라우드(Prisma Cloud) 클라우드 네이티브 애플리케이션 보...
    Date2023.08.17 Bynewsit Views309
    Read More
  6. CEVA, 삼성 SAFE 파운드리 프로그램 합류

    - 모바일, 생활가전, 자동차, 무선 인프라 및 IoT 시장 칩 설계 가속화 CEVA는 삼성 어드밴스드 파운드리 에코시스템(SAFE)에 합류한다고 17일 밝혔다. CEVA는 삼성의 고급 파운드리 공정을 활용하여 칩 설계를 간소화하고, CEVA 라이선스의 시장 출시 일정을 ...
    Date2023.08.17 Bynewsit Views463
    Read More
  7. SS&C 블루프리즘, 가트너 매직 쿼드런트RPA 부문5년 연속 리더 선정

    SS&C 블루프리즘이 ‘2023 가트너 매직 쿼드런트 RPA(Gartner Magic Quadrant for Robotic Process Automation)’ 부문에서 5년 연속 리더로 선정됐다고 밝혔다. SS&C 블루프리즘은 전 세계 2800개 이상의 기업에 지능형 자동화(IA)를 제공하고 있으며, IA 플랫...
    Date2023.08.17 Bynewsit Views603
    Read More
  8. 이글루코퍼레이션, ‘다부처 공동 암호화 사이버위협 대응기술 개발사업’ 참여

    - 비복호화 기반 암호화 도로교통 사이버위협 탐지 기술 개발 나선다 - 도로교통 환경 노리는 암호화 형태의 사이버 공격 원천 차단 - 자율주행 차량·자율운항 선박 등에 암호화 통신 보안관제 원천 기술 확대 적용 이글루코퍼레이션은 한국과학기술정보연구원...
    Date2023.08.17 Bynewsit Views286
    Read More
  9. 퓨어스토리지, 충북테크노파크 AI 개발 플랫폼 고도화…”지역 기업 혁신성장 성공적 지원“

    퓨어스토리지는 충청북도의 지역혁신거점기관인 충북테크노파크가 자사의 초고속 통합 파일 및 오브젝트 스토리지 플랫폼인 플래시블레이드(FlashBlade)를 활용하여 스토리지 데이터 처리 성능을 강화하고 GPU 활용률을 대폭 향상해 지역 기업에 제공하는 AI ...
    Date2023.08.17 Bynewsit Views422
    Read More
  10. EDB, 구글 클라우드와 협력 강화…“구글 쿠버네티스 엔진에서 포스트그레스 사용”

    EDB는 오늘 구글 클라우드와 협력 관계를 강화하여 쿠버네티스를 별도로 구축할 필요 없이, 구글의 클라우드 기반 관리형 쿠버네티스 서비스 GKE(Google Kubernetes Engine)에서 EDB의 주요 오픈소스DBMS인 포스트그레SQL(PostgreSQL) 제품들을 사용할 수 있도...
    Date2023.08.17 Bynewsit Views710
    Read More
  11. 인섹시큐리티, 모바일 잠금 해제 및 포렌식 솔루션 ‘그레이키’와 ‘베라키’ 출시

    인섹시큐리티는 오늘, 모바일 잠금 해제 및 데이터 추출 전문 솔루션 기업 ‘그레이시프트(Grayshift)’의 법 집행기관용 iOS/안드로이드 암호 해독 및 증거 수집 솔루션인 ‘그레이키(GrayKey)’, 일반 기업용 iOS/안드로이드 잠금 우회 데이터 추출 솔루션인 ‘베...
    Date2023.08.17 Bynewsit Views207
    Read More
  12. 엔씨소프트, 자체 AI 언어 모델 ‘VARCO’ 공개

    - 국내 게임사 최초로 자체 개발한 AI 언어 모델… 생성 AI 연구 및 사업 본격화 - 이미지, 텍스트, 디지털 휴먼 콘텐츠 생성 가능한 AI 플랫폼 ‘VARCO Studio’ 선보여 - 국내 기업 언어 모델 최초 아마존 세이지메이커 점프스타트 입점…한 달 무료 이용 가능 ...
    Date2023.08.16 Bynewsit Views489
    Read More
  13. 에브넷, AWS 기반 IoTConnect 플랫폼에 새로운 기능 추가

    - 간단하고, 빠르고, 안전하게 IoT를 구현할 수 있도록 OEM 지원 에브넷(Avnet)은 OEM들이 보다 신속하게 지능형 IoT 기기를 구현할 수 있도록 자사의AWS 기반 IoTConnect를 두 번째로 출시했다고 밝혔다. 완벽한 기능을 갖춘 이번 출시는 AWS IoT 그린그래스(...
    Date2023.08.16 Bynewsit Views308
    Read More
  14. 써모스, 네이버 브랜드데이에서 ‘마이 디자인 보틀 원터치 타입 시즌2 250ml’ 최초 공개

    - 써모스의 키즈 카테고리 스테디셀러 제품인 ‘마이 디자인 보틀 원터치 타입 시즌 2 250ml’ 출시 - 기존 용량 대비 더욱 작고 가벼운 무게로 유치원생, 저학년 초등학생에 최적 - 기존 마이 디자인 보틀 원터치 타입 중 베스트 컬러인 핑크오렌지, 옐로우라임...
    Date2023.08.16 Bynewsit Views439
    Read More
  15. MSI, RTX 40 노트북'오버워치2: 침공' 얼티밋 번들 증정

    - RTX 4090/4080/4070/4060 탑재MSI 노트북 구매 고객 대상 이벤트 - '오버워치 2 : 침공' 얼티밋 번들 증정 엠에스아이코리아는 지포스 RTX 4090/ 4080/ 4070/ 4060 그래픽 탑재MSI 노트북 구매 고객을 대상으로 '오버워치 2 :침공(Overwatch 2 Invasion) 얼...
    Date2023.08.16 Bynewsit Views338
    Read More
  16. 아카마이, “아태지역 랜섬웨어 피해자 1년동안 204% 증가”

    - 아카마이, 랜섬웨어 공격 급증 이유로 공격방식 변화 꼽아 … 피싱 위주의 공격에서 취약점 악용 수법으로 전환하고 금전 갈취 수단으로 삼아 - 제조업, 비즈니스 서비스, 건설업 등 필수 인프라 적극적으로 노려… 파일 백업 솔루션, 더 이상 충분한 방어 전...
    Date2023.08.16 Bynewsit Views324
    Read More
  17. 포티넷, 차세대방화벽 ‘포티게이트 90G’ 발표… “5세대 ASIC 기술 SP5 ASIC 탑재”

    - SP5 ASIC 및 포티가드AI 기반 보안서비스로 가속화 된 성능 제공 포티넷 코리아는 오늘, 자사의 5세대ASIC 기술인 새로운 SPU(SP5) ASIC을 탑재한SD-WAN 어플라이언스 및 차세대 방화벽 ‘포티게이트90G(FortiGate 90G)’를 발표했다. 이 제품은 업계 최고의 A...
    Date2023.08.16 Bynewsit Views328
    Read More
  18. 서비스나우, 박혜경 한국 신임 대표 선임

    디지털 비즈니스 플랫폼 서비스나우(ServiceNow)가 지역 부사장 겸 한국 대표로 박혜경 신임 대표를 선임했다. 박혜경 신임 한국 대표는 성장을 주도하고 고객에게 혁신적인 솔루션을 제공하기 위한 회사의 전략적 사업들을 포함해 한국 사업 전반을 이끌게 된...
    Date2023.08.14 Bynewsit Views645
    Read More
  19. ASUS, 지포스 RTX 40시리즈 그래픽카드 구매 이벤트…“‘오버워치 2 인베이전’ 게임 코드 증정”

    ASUS 코리아가 지포스 RTX 40 시리즈 그래픽 카드 ‘오버워치 2 인베이전’ 게임 코드 증정 이벤트를 진행한다고 밝혔다. 엔비디아(NVIDIA)와 함께 진행하는 이번 이벤트는 8월 11일 밤 10시부터 9월 9일까지 에이수스의 지포스 RTX 40 그래픽 카드를 구매한 고...
    Date2023.08.14 Bynewsit Views268
    Read More
  20. 한국오키시스템즈, 'K-PRINT 2023’ 참가..."A3기반 라벨프린터와 오키 컬러 디지털 제품군 출시"

    한국오키시스템즈는 오는 8월 23일(수)부터 26(토)일까지 킨텍스에서 열리는 ‘K-PRINT 2023’에 참가한다고 밝혔다. K-PRINT는 인쇄, 레이블, 패키지, 텍스타일, 사인 및 광고 산업을 통합하는 전시회로서, 인쇄산업의 미래비전과 전망을 한눈에 살펴볼 수 있다...
    Date2023.08.14 Bynewsit Views308
    Read More
Board Pagination Prev 1 ... 181 182 183 184 185 186 187 188 189 190 ... 270 Next
/ 270
CLOSE