- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

 

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

 

 

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다. 

 

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

 

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

 

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

 

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

 

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다. 

 

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

 

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

 

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다. 

 

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

 

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

 

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

 

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

 

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

 

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다. 

 

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고  밝히고,  "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

 

#엔비디아#네모#라이터#인셉션#트리톤#추론#

 

 

?

  1. 엔비디아 젠슨 황, 시그래프 기조연설서 '생성형 AI' 소개

    - LA에서 열린 시그래프에서 수천 명의 개발자, 그래픽 전문가 대상 특별 연설 - 업데이트된 GH200 그레이스 호퍼 슈퍼칩, 엔비디아 AI 워크벤치, 생성형 AI로 강화된 엔비디아 옴니버스 발표 엔비디아는 CEO 젠슨 황(Jensen Huang)이 로스앤젤레스에서 열린 ...
    Date2023.08.10 Bynewsit Views497
    Read More
  2. SK텔레콤, 국내 통신사 최초 6G 백서 단독 발간..."미래 네트워크 청사진 제시"

    - 6G 표준화 및 초기 생태계가 나아갈 이정표 제시 SK텔레콤이 6G 표준화를 위해 필요한 핵심 요구사항과 미래 네트워크 진화 방향성을 제시하는 ‘6G 백서’를 10일 SKT 뉴스룸을 통해 공개했다. 2030년 상용화가 예상되는 6G는 6월 ITU-R 산하 이동통신 표준화...
    Date2023.08.10 Bynewsit Views169
    Read More
  3. Moxa, 사우디 아람코 테크놀로지스와 ‘지능형 통합 노드 솔루션’의 전 세계 상용화 협약 체결  

    Moxa는 사우디 아람코 테크놀로지스 컴퍼니(Saudi Aramco Technologies Company)와 지능형 통합 노드(IIN) 기술의 추가 개발 및 전 세계 상용화를 위한 협약을 체결했다고 밝혔다. 양사가 공동으로 개발한 지능형 통합 노드 기술은 일체형의 단일 결함 내성 장...
    Date2023.08.10 Bynewsit Views183
    Read More
  4. 스틸시리즈, 전국 고교생 게임아트∙웹툰 공모전’ 3년 연속 후원

    - 게임산업 인재 육성과 발굴을 위해 지속적인 노력 기울여 - 3년 연속 공식 후원사로 참여…스틸시리즈상 수여 스틸시리즈가 3년 연속으로 '2023 구미대학교 전국 고교생 게임아트∙웹툰 공모전'을 공식 후원한다. 해당 공모전은 게임• 웹툰 산업 분야 인재 발...
    Date2023.08.10 Bynewsit Views152
    Read More
  5. MSI, 37주년 기념일 이벤트 개최…“게이밍 모니터등 다양한 경품 증정”

    - MSI 게이밍 모니터, 게이밍 기어, 게임 코드 등 다양한 경품 증정 엠에스아이코리아는 자사 홈페이지에서 ‘MSI 37주년 기념 이벤트’를 진행한다고 밝혔다. 이번 이벤트는 2023년 8월 1일부터 2023년 8월 31일까지 MSI를 사랑하는 모든 분들을 대상으로 진행...
    Date2023.08.10 Bynewsit Views218
    Read More
  6. 엔비디아, 가속 컴퓨팅과 생성형 AI 위한 차세대 ‘GH200 그레이스 호퍼 슈퍼칩’ 공개

    - 세계 최초 HBM3e 프로세서로 혁신적인 메모리와 대역폭 제공 - 쉽게 확장 가능한 서버 디자인과 뛰어난 성능 발휘 위한 다중 GPU 연결 기능 탑재 엔비디아가 가속 컴퓨팅과 생성형 AI를 위한 차세대 엔비디아 GH200 그레이스 호퍼 플랫폼(NVIDIA GH200 Grace...
    Date2023.08.10 Bynewsit Views553
    Read More
  7. MSI, ‘MSI 노트북 서비스 센터’ 확장 이전···“차별화된 서비스 제공“

    - 고객 서비스 강화 위해 ‘MSI 노트북 고객 센터’ 확장 이전 - 편안한 휴식 돕는 라운지 스타일 대기실 운영 - 게이밍 · 비즈니스 · 크리에이터 등 다양한 최신 MSI 노트북 체험 - 유연한 서비스 제공을 위한 워런티씰 정책 완화 및 온라인 접근성 높여 엠에스...
    Date2023.08.10 Bynewsit Views233
    Read More
  8. VMware NSX, 국가정보원 보안기능 확인서 취득

    - 국가정보원 보안적합성 검증을 위한 보안기능 확인서 취득 - 국내 공공기관에 신뢰할 수 있고 안전한 네트워크 및 보안 가상화 솔루션 공급 계획 VMware는 네트워킹 및 보안 가상화 솔루션인 ‘VMware NSX’가 한국정보통신기술협회(TTA)로부터 국가정보원 보...
    Date2023.08.10 Bynewsit Views587
    Read More
  9. 엑스리얼, AR 허브 빔(BEAM) 정식 판매 시작!

    - 스마트폰, 태블릿 등 다양한 스마트 기기 지원가능한 AR 허브로 시공간의 제약 없는 AR 경험 - 8월 10일(목)부터 엑스리얼 공식 네이버 스마트 스토어에서 판매 AR글래스 제조사 ‘엑스리얼(XREAL)’이 다양한 스마트 기기와 연결 가능한 AR 허브 ‘엑스리얼 빔...
    Date2023.08.10 Bynewsit Views131
    Read More
  10. 키오시아, 엔터프라이즈 및 데이터 센터 인프라용 PCIe 5.0 CD8P SSD 시리즈 출시

    - 키오시아 CD8P 시리즈 데이터 센터 NVMe 드라이브는 E3.S 및 2.5인치(U.2) 폼팩터에서 성능, 지연 시간 및 서비스 품질에 최적화 키오시아는 CD8P 시리즈를 데이터 센터급 SSD 라인업에 추가한다고 발표했다. 키오시아 CD8P 시리즈는 PCIe 5.0(32GT/s x4) 성...
    Date2023.08.09 Bynewsit Views305
    Read More
  11. 리틀휴즈, 6년 연속 올해의 유통기업으로 ‘마우저’ 선정

    마우저 일렉트로닉스는 지속 가능하며 모든 것이 연결된, 보다 안전한 세상을 만드는 리틀휴즈(Littelfuse)로부터 2022년 올해의 글로벌 우수 서비스 유통기업으로 선정됐다고 밝혔다. 리틀휴즈는 미국 라스베이거스에서 개최된 2023 EDS(전자유통쇼) 리더십 ...
    Date2023.08.09 Bynewsit Views405
    Read More
  12. 엔비디아 AI 워크벤치, 전 세계 기업 맞춤형 생성형 AI 채택 가속화

    - 새로운 개발자 툴킷으로 엔비디아 AI 플랫폼에서 간소화된 모델 튜닝과 배포 도입 - PC, 워크스테이션, 엔터프라이즈 데이터센터, 공용 클라우드, 엔비디아 DGX 등 다양한 엔비디아 플랫폼 지원 엔비디아가 간편한 통합 툴킷인 엔비디아 AI 워크벤치(NVIDIA ...
    Date2023.08.09 Bynewsit Views478
    Read More
  13. 엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화

    - '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발 - 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여 엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 ...
    Date2023.08.09 Bynewsit Views464
    Read More
  14. 엔비디아, 셔터스톡과 협력 확대…”3D 장면 배경에 생성형 AI 도입”

    - 엔비디아 피카소로 3D 장면과 콘텐츠 제작 - 엔비디아 피카소 최신 기능 통해 사실적인 8K, 360 HDRi 환경 맵 생성 엔비디아가 셔터스톡(Shutterstock)과 협력을 확대한다고 발표했다. 이 협력으로 셔터스톡은 엔비디아 피카소(NVIDIA Picasso)로 3D 장면 배...
    Date2023.08.09 Bynewsit Views366
    Read More
  15. 엔비디아, 생성형 AI와 산업 디지털화 가속화 위한 엔비디아 OVX 서버 공개

    - 엔비디아 OVX, 트레이닝과 추론, 그래픽 집약적 워크로드 가속화 위해 새로운 GPU 지원 엔비디아가 엔비디아 L40S GPU를 탑재한 엔비디아 OVX 서버를 공개했다고 밝혔다. 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse) 플랫폼을 통해 AI 트레이닝과...
    Date2023.08.09 Bynewsit Views556
    Read More
  16. 벤큐, 여름방학 맞이 ‘아이케어 LED 스탠드’ 구매 이벤트

    - 벤큐 위트 스탠드, 마인드듀오 구매 고객 ‘위트 데스크 클램프’ 증정(8.9~9.10) 벤큐는 여름방학을 맞이하여, 벤큐 시력보호 LED 스탠드 구매 고객 대상으로 다양한 경품을 증정하는 행사를 진행한다고 밝혔다. 이번 행사는 여름방학의 마지막 달을 맞이하여...
    Date2023.08.09 Bynewsit Views254
    Read More
  17. SS&C 블루프리즘, 지능형 자동화 솔루션 조달청 나라장터 등록  

    - 글로벌 RPA 기업 최초 RPA 개발∙실행∙운영 도구 모두 포함한 ‘올인원 패키지’ 등록 - SS&C 블루프리즘, 한국토지주택공사∙한국가스공사∙한국인삼공사 등 주요 공공 기관에서 도입 가속화 SS&C 블루프리즘이 지능형 자동화(IA) 플랫폼 ‘SS&C 블루프리즘 엔터...
    Date2023.08.09 Bynewsit Views580
    Read More
  18. 엔비디아, '텍사스 전기톱 학살' DLSS 2 성능 업그레이드 지원

    - '고드’, '스프럴', ’데디링크’에 DLSS 2 지원 엔비디아가 8월 18일에 출시되는 스모 디지털(Sumo Digital)과 건 인터랙티브(Gun Interactive)의 텍사스 전기톱 학살(The Texas Chain Saw Massacre)에 DLSS 2를 지원한다고 밝혔다. 텍사스 전기톱 학살은 1974...
    Date2023.08.09 Bynewsit Views191
    Read More
  19. 사이냅소프트, ‘사이냅 문서뷰어 2022’에 TTS 기능 추가

    - 사이냅 문서뷰어 2022, TTS 기능 탑재로 정보 접근성, 사용자 편의성 강화 - 재생 및 정지, 일시 정지의 기본 기능 외 키보드로 조작 가능한 이전/다음 문단 듣기와 페이지별 또는 전체 문서 듣기 기능까지 제공 사이냅소프트는 오늘 전자문서를 다운로드 없...
    Date2023.08.08 Bynewsit Views455
    Read More
  20. 삼성전자, 갤럭시 Z 플립5·폴드5 국내 사전 판매 100만대 돌파!

    삼성전자의 갤럭시 Z 플립5·폴드5의 국내 사전 판매가 100만대를 넘어서며 폴더블 역대 최고 기록을 달성했다. 삼성전자는 이달 1일부터 7일까지 일주일간 진행한 갤럭시 Z 플립5·폴드5 국내 사전 판매가 최종 102만대로 집계됐다고 8일 밝혔다. 이는 역대 폴...
    Date2023.08.08 Bynewsit Views299
    Read More
Board Pagination Prev 1 ... 178 179 180 181 182 183 184 185 186 187 ... 266 Next
/ 266
CLOSE