- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

 

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

 

 

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다. 

 

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

 

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

 

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

 

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

 

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다. 

 

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

 

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

 

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다. 

 

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

 

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

 

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

 

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

 

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

 

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다. 

 

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고  밝히고,  "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

 

#엔비디아#네모#라이터#인셉션#트리톤#추론#

 

 

?

  1. 노르딕 세미컨덕터, nRF9160 SiP 및 nRF5340 SoC PSA 인증 레벨 2 획득…“향상된 IoT 보안 기능 검증”

    - 셀룰러 IoT SiP와 주력 제품인 멀티 프로토콜 SoC에 대한 PSA 인증 레벨 2를 획득함으로써 확장 가능한 원격 소프트웨어 공격에 대한 보호 기능 검증 노르딕 세미컨덕터는 LTE-M/NB-IoT 모뎀 및 GNSS가 통합된 nRF9160 저전력 SiP와 첨단 멀티 프로토콜 SoC...
    Date2023.08.22 Bynewsit Views477
    Read More
  2. MSI, 노트북 서포터즈 12기 모집

    - 2023년 9월 6일(수)까지 MSI 노트북 서포터즈 12기 모집 - MSI 노트북 및 콘텐츠 제작에 관심 있는 지원자 누구나 지원 가능 엠에스아이코리아는 오는 9월 6일까지 노트북 콘텐츠 제작 및 온라인 마케팅 활동을 수행하는 'MSI 노트북 서포터즈 12기'를 모집...
    Date2023.08.22 Bynewsit Views325
    Read More
  3. 버티브, ‘2023 아시아 채널 서밋’ 개최

    - 연례 파트너 서밋에서 버티브의 ESG 목표에 대한 의지 강조 - 새로운 데이터센터 기술에서 에너지 효율적인 인프라의 역할 부각 버티브(Vertiv)는 최근 인도네시아 발리의 그랜드 하얏트 누사두아에서 아시아 채널 서밋 2023(Asia Channel Summit 2023)을 개...
    Date2023.08.22 Bynewsit Views462
    Read More
  4. 딥엑스, 중국 심천 최대 전자전시회 ‘일렉스콘(ELEXCON) 2023’ 참가…“동아시아 AI 반도체 시장 선점”

    - IDC에서 2026년 중국 시장에 판매될 IT기기의 56%에 AI 엔진 탑재 전망, 딥엑스는 다중의 IT기기 양산 일정에 맞춰 제품을 적기에 출시할 것 - 딥엑스는 AI 반도체 원천기술 기반 토탈 솔루션 4종과 함께 오픈 임베디드 플랫폼인 오렌지파이에 자사의 M.2 모...
    Date2023.08.22 Bynewsit Views417
    Read More
  5. ASUS, 전 제품 구매 고객 대상 ‘라이브 온 에이수스’ 리뷰 이벤트

    - 오는 9월 30일까지 ROG Ally, 노트북, 데스크탑 등 전 제품 대상 구매 고객 리뷰 이벤트 진행 - 리뷰 이벤트 참여자 전원에게 음료 기프티콘 증정…SNS에 리뷰 업로드 시 상품권 등 경품 제공 ASUS가 오는 9월 30일까지 ‘ROG Ally(로그 엘라이)’를 포함해 노...
    Date2023.08.22 Bynewsit Views235
    Read More
  6. AMD, AI 전망 설문조사 보고서 발표…“AI 기술을 통한 비즈니스 성장 가속화 및 투자 확대 기대”

    – IT 리더 10명 중 7명, AI 기반 기술이 조직 생산성 향상에 도움준다고 응답, 52%는 AI 기술 도입을 위한 필수 IT 인프라가 부족하다고 밝혀 AMD가 글로벌 IT 리더 대상으로 진행한 AI 전망 설문조사 보고서를 발표했다. 이번 조사에 따르면 응답자 75%는 업...
    Date2023.08.22 Bynewsit Views461
    Read More
  7. EDB, 자동차 전장 기업 ‘유라’에 기술지원 서비스 ‘TAM‘ 공급…“오픈소스 DBMS 포스트그레SQL의 안정적 운영“

    - EDB 전문 기술자가 기업고객의 IT 조직과 긴밀히 협력하여 포스트그레SQL(PostgreSQL)를 최대한 활용할 수 있는 맞춤형 지침 제공 - SQL 부하 발생을 기존 60%에서 20% 미만으로 감소시켜 SQL 성능 안정화 - 타사 DBMS 대비 50%이상 절감된 비용을 신규 솔루...
    Date2023.08.22 Bynewsit Views455
    Read More
  8. MSI, 창작자들의 축제 '2023 크리에이터 어워드' 성료

    - 2023 MSI 크리에이터 어워드 성료 - 수상자 공식 발표 : 총 70,000달러 상당의 경품 증정 - 그래픽 디자인·영화·애니메이션 3개 분야, 총 12개 작품 수상 엠에스아이코리아는 전 세계 크리에이터를 대상으로 한 '2023 MSI 크리에이터 어워드디자인 공모전을 ...
    Date2023.08.22 Bynewsit Views323
    Read More
  9. 벤큐 조위, 게이밍 마우스패드 신제품 2종 출시…“내구·내습성 높인 e스포츠용”

    - 안정적인 컨트롤이 가능한 브레이킹 타입 G-SR 개선작 - 매끄러운 글라이딩의 슬라이딩 타입 G-SR SE 그리스 - 내구·내습성을 강화한 특수 천 소재를 적용하여 습도에 강한 건조성 유지 벤큐는 자사의 e스포츠 기어 전문 브랜드 조위(ZOWIE)에서 게이밍 마우...
    Date2023.08.22 Bynewsit Views236
    Read More
  10. 엔비디아-서울대병원, ‘HCLS 서밋 코리아 2023’ 개최

    - 8월 25일부터 이틀간 헬스케어 분야 최신 AI 연구 발표와 실습 워크숍 진행 - 의료 개발자와 임상 연구자 위한 의료 이미지 딥 러닝 커뮤니티 함께 열려 엔비디아는 오는 8월 25일부터 이틀간 서울대학교병원(SNUH)과 공동으로 ‘HCLS 서밋 코리아 2023’를 개...
    Date2023.08.22 Bynewsit Views645
    Read More
  11. 마우저, 실리콘랩스의 광범위한 제품 공급

    마우저 일렉트로닉스는 실리콘랩스(Silicon Labs)의 공인 글로벌 유통기업으로 광범위한 제품을 공급해오고 있다고 밝혔다. 2006년부터 지속된 마우저와 실리콘랩스의 파트너십은 사물 인터넷 (IoT), 조명, AI/ML 애플리케이션 분야에서 전 세계 마우저 고객을...
    Date2023.08.21 Bynewsit Views524
    Read More
  12. 슈나이더 일렉트릭 코리아-한국산업기술시험원, 소프트웨어 중심의 범용자동화 확산 위한 협력 강화

    - 유니버셜 오토메이션 회원사로써 범용 자동화 시장 확장에 힘써 - KTL, 유니버셜 오토메이션 회원사 대상 범용자동화 교육 및 테스트 인증 부문 협력 슈나이더 일렉트릭 코리아는 한국산업기술시험원(KTL)가 범용자동화 확산을 위해 협력을 강화한다고 밝혔...
    Date2023.08.21 Bynewsit Views519
    Read More
  13. 어플라이드 머티어리얼즈, 2023년 3분기 실적 발표…“전년 대비 1% 감소한 64억 3000만 달러” 기록

    어플라이드 머티어리얼즈가 7월 30일 마감한 회계연도 2023년 3분기 실적을 발표했다. 어플라이드 머티어리얼즈 회계연도 2023년 3분기 매출은 미국 회계기준으로 64억3000만 달러, 매출총이익률 46.3%를 기록했다. 영업이익과 영업이익률은 각각 18억 달러와 ...
    Date2023.08.21 Bynewsit Views568
    Read More
  14. ASUS, 올인원 PC ‘M3 시리즈’ 2종 출시 …“비즈니스 공간 활용도 높여줘”

    - M3 시리즈, 우수한 성능에 더해 미니멀하고 세련된 바디로 높은 공간 활용도를 갖춘 올인원 PC - M3402 및 M3702, 각각 24인치, 27인치의 FHD NTSC 72% IPS 디스플레이로 선명한 화질 구현 - AMD 라이젠 5 7520U CPU 탑재 ··· 원활한 비즈니스 업무, 엔터테...
    Date2023.08.21 Bynewsit Views274
    Read More
  15. 캐논코리아, 실시간 ‘R Live 세미나’ 개최…“EOS R 시스템의 모든 것 공개”

    - R Live, ▲언박싱 ▲오픈클래스 ▲작가와의 만남 등 EOS R 시스템의 진수를 알리는 다채로운 세미나 구성 - 캐논 아카데미 이휘영·윤우석 강사, 영상 전문제작 업체 ‘피버즈’ 대표 신재호 PD 등 전문 강사진 섭외 - 사전 신청 및 질문 신청자 대상으로 푸짐한 ...
    Date2023.08.21 Bynewsit Views296
    Read More
  16. 슈퍼마이크로, E3.S 올플래시 스토리지 제품군 대량 공급 확대

    - 다양한 플래시 공급업체의 E3.S 드라이브가 탑재된 E3.S 올플래시 솔루션 및 E3.S CXL 메모리 모듈(CMM) 확장 솔루션 지원을 위한 신규 시스템 세트, 고객 유연성 및 선택권 확대 슈퍼마이크로컴퓨터는 업계 첫 PCIe Gen5 드라이브 및 CXL 모듈을 지원하는 ...
    Date2023.08.21 Bynewsit Views500
    Read More
  17. 로지텍, 무신사에서 ‘2023 가을 신학기 프로모션’ 진행

    - 27일까지 무신사 홈페이지에서 주변기기 제품군 최대 61% 할인 이벤트 - 주요 온라인 쇼핑몰에서 ‘백 투 스쿨 프로모션’ 또한 함께 진행 로지텍은 국내 대표 패션 버티컬 플랫폼 무신사에서 ‘2023 가을 신학기 프로모션’을 진행한다고 21일 밝혔다. 이번에 ...
    Date2023.08.21 Bynewsit Views214
    Read More
  18. 마우저, 인피니언의 고정밀 저전력  DPS368/DPS310 Kit2Go 센서 개발 키트 제품 공급

    마우저 일렉트로닉스는 인피니언(Infineon Technologies)의 DPS368 및 DPS310 Kit2Go 센서 개발 키트 제품을 공급한다고 밝혔다. 두 키트 제품은 사물 인터넷 (IoT) 과 임베디드 시스템용으로 설계된 온도 센서가 통합된 XENSIV 기압 센서를 갖추었다. 낮은 전...
    Date2023.08.19 Bynewsit Views455
    Read More
  19. MSI, AMD·엔비디아 조합의 게이밍 노트북 3종 출시

    - AMD 라이젠 7000 시리즈 및 RTX 40 그래픽 탑재 - 최신 Zen4 아키텍처 드래곤 레인지 및 피닉스 적용 - 출시 기념 구매자에게 MSI 정품 게이밍 마우스 증정 엠에스아이코리아는 AMD 라이젠 7000 시리즈 프로세서 및 엔비디아 지포스 RTX 40 그래픽 조합의 고...
    Date2023.08.19 Bynewsit Views320
    Read More
  20. 로지텍, 화상회의 올인원 도킹 스테이션 ‘로지 독 플렉스’ 출시

    - 협업 공간 분석 및 화상회의용 제품군 운영 서비스 제공하는 도킹 스테이션 - 핫 데스킹 기능, 폭넓은 호환성으로 간편한 스케줄 관리와 뛰어난 디바이스 연결성 로지텍은 화상회의 올인원 도킹 스테이션 ‘로지 독 플렉스’(Logi Dock Flex)’를 출시했다고17...
    Date2023.08.17 Bynewsit Views326
    Read More
Board Pagination Prev 1 ... 180 181 182 183 184 185 186 187 188 189 ... 270 Next
/ 270
CLOSE