- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

 

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

 

 

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다. 

 

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

 

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

 

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

 

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

 

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다. 

 

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

 

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

 

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다. 

 

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

 

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

 

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

 

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

 

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

 

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다. 

 

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고  밝히고,  "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

 

#엔비디아#네모#라이터#인셉션#트리톤#추론#

 

 

?

  1. 사이냅소프트, 국내 최초 ‘동시 편집’ 에디터 연내 출시…“실시간 스마트 협업 가능“

    사이냅소프트는 오늘 AI 기반 웹콘텐츠 저작·편집 솔루션인 ‘사이냅 에디터’의 신규 버전을 연내 출시할 계획이라고 밝혔다. 사이냅 에디터 신규 버전의 공동 편집 기능은 여러 사용자가 동일한 웹 콘텐츠를 함께 보며 동시에 편집하고 작업할 수 있도록 지원...
    Date2023.09.20 Bynewsit Views609
    Read More
  2. 한국레노버, ‘이음 5G를 위한 레노버 테크데이’ 성료…“이음 5G 전용 디바이스, 기술 및 도입 사례 공유”

    - 이음5G 전용 레노버 제품 및 퀄컴 기술, 주요 구축 사례 소개 - 퀄컴∙CJ 올리브네트웍스∙세종텔레콤∙LG유플러스 세션 발표 한국레노버가 퀄컴코리아와 함께 ‘이음 5G(5G 특화망)를 위한 레노버 테크데이’를 성공적으로 마쳤다고 밝혔다. 이번 행사는 업계 최...
    Date2023.09.20 Bynewsit Views345
    Read More
  3. ASUS, 360㎜ 수랭 쿨러 장착한 「ROG Matrix GeForce RTX 4090」 그래픽 카드 출시

    - 2700㎒ 부스트 클럭 제공, 컴퓨텍스서 공개 이후 8개의 오버클럭 기록 보유 - GPU 다이에 액체 금속 화합물을 탑재, 최저 온도 및 최저 소음 달성 - 이전 모델보다 더 큰 냉각판과 강력한 펌프, 360㎜ 라디에이터 및 최적화된 열 방출 위한 데이지 체인 방식...
    Date2023.09.20 Bynewsit Views454
    Read More
  4. 샥즈, ‘오픈핏’에 멀티 포인트 페어링 기능 지원

    - 샥즈 앱에서 최신 펌웨어 업데이트 통해 오픈핏에 멀티 포인트 페어링 기능 사용 가능 - 오픈핏, 혁신적인 디바이스로 인정받으며 ‘KITAS 2023 TOP 10’에 선정 - 9월 30일까지 한가위 맞이 이벤트 진행, 제품 구매자 대상으로 다양한 혜택 제공 글로벌 오픈...
    Date2023.09.20 Bynewsit Views463
    Read More
  5. 팔로알토 네트웍스, 공격 표면 관리 분석 2023 보고서 공개

    - 매달 새롭게 식별되는 노출의 50%는 클라우드의 역동적인 특성에서 기인 팔로알토 네트웍스는 <2023 유닛42 공격 표면 위협 리포트(2023 Unit 42 Attack Surface Threat Report)> 통해 클라우드 환경의 역동적인 특성과 공격 해위자들이 새로운 취약점을 악...
    Date2023.09.20 Bynewsit Views355
    Read More
  6. 블루투스SIG, 네트워크 조명 제어를 위한 풀스택 표준 완성

    - 시장 잠재력이 높은 조명제어 분야에서의 성장을 모색하기 위한 포석 블루투스 SIG는 무선 조명 제어를 위한 최초의 풀스택 표준인 블루투스 네트워크 조명 제어(NLC)가 완성됐다고 발표했다. 블루투스 NLC는 무선 전파에서 디바이스 레이어에 이르기까지 제...
    Date2023.09.20 Bynewsit Views581
    Read More
  7. 슈나이더 일렉트릭, 대화형 AI 도구 통해 지속가능한 디지털 미래 구축

    - 대화형 인공지능 서비스 ‘코파일럿’을 에코스트럭처 리소스 어드바이저에 적용 - 데이터 분석 및 시각화, 의사 결정 지원 및 성능 최적화 기능 제공 슈나이더 일렉트릭이 대화형 AI도구 ‘에코스트럭처 리소스 어드바이저 코파일럿(Resource Advisor Copilot)...
    Date2023.09.20 Bynewsit Views612
    Read More
  8. 싸이타임, 새로운 에포크 플랫폼 출시…“정밀 타이밍 기술 혁신”  

    - 향후 10년간 20억 달러 규모의 시장 개척 - 탁월한 성능과 신뢰성으로 정밀 타이밍 분야 새로운 기준 제시 고정밀 타이밍 솔루션 전문기업 싸이타임(SiTime)은 전자기기의 가장 복잡한 타이밍 문제를 해결하고 100년 된 쿼츠(Quartz) 기반 기술을 혁신하기 ...
    Date2023.09.20 Bynewsit Views452
    Read More
  9. 코드마인드, 오픈소스 관리도구 ‘Hatter SCA’ GS인증 획득

    코드마인드는 오픈소스 관리도구 해터 에스씨에이(Hatter SCA)가 한국정보통신기술협회(TTA) 소프트웨어 시험인증연구소로부터 GS인증 1등급을 획득했다고 20일 밝혔다. GS 인증은 ISO국제 표준을 기반으로 하여 기능적합성, 성능효율성, 사용성, 신뢰성, 보안...
    Date2023.09.20 Bynewsit Views517
    Read More
  10. 캐논코리아, 2023년 상반기 국내 잉크젯 프린터 전체 시장 점유율 34.2%로 1위 달성

    - 스테디셀러인 잉크젯 프린터 PIXMA G 시리즈, MAXIFY GX시리즈 라인업 완성으로 하기 시장 적극 공략 캐논코리아가 2023년 상반기 국내 잉크젯 프린터 전체 시장 점유율 1위를 달성했다고 밝혔다. IT 시장분석 및 컨설팅 기관인 IDC가 발표한 분기별 프린터·...
    Date2023.09.20 Bynewsit Views356
    Read More
  11. AMD, 크리아 K24 SOM 및 스타터 키트 출시…“산업 및 상업용 애플리케이션의 엣지 혁신 가속화”

    - 모터 제어 및 디지털 신호 처리 애플리케이션을 위한 전력 효율적인 프로덕션-레디 솔루션을 보다 신속하게 설계할 수 있도록 지원하는 K24 SOM 및 KD240 키트 AMD는 자사의 크리아(Kria) 적응형 SOM 및 개발자 키트 포트폴리오에 새롭게 추가된 최신 AMD 크...
    Date2023.09.20 Bynewsit Views586
    Read More
  12. SAP 코리아, 하나은행과 상호협력 관계 구축 MOU 체결

    - SAP 코리아, 하나은행과 SAP BTP 기반 애플리케이션 개발 및 구축에 협력 - 잠재 성장 가능성 및 사업 기회 발굴함과 동시에 이를 실행, 확대 위한 상호협력 관계 구축 SAP 코리아는 하나은행과 ‘솔루션 구축 및 금융 사업 협력을 위한 전략적 업무협약’을 ...
    Date2023.09.19 Bynewsit Views580
    Read More
  13. SK텔레콤, AI로 실내·외 유동인구 정밀 분석하는 ‘AI유동인구’ 개발

    SK텔레콤은 자사의 AI 기반 위치 분석 플랫폼 ‘리트머스(LITMUS)’에 실내 측위 기술을 결합해 실내 유동인구를 정밀하게 파악할 수 있는 ‘AI유동인구’ 기술을 개발했다고 19일 밝혔다. 기존 유동인구 분석 기술은 특정 지역 내 기지국 접속 정보를 기반으로 해...
    Date2023.09.19 Bynewsit Views298
    Read More
  14. NH농협캐피탈, 뉴타닉스 클라우드 플랫폼 도입…“백업 복구 역량 강화”

    - 서버 백업 소요시간 67% 단축, 민첩한 백업 및 데이터 복구로 중단 없는 온라인 서비스 제공 - NH농협캐피탈, 확장성과 유연성을 갖춘 IT 인프라 구축으로 미래 경쟁력 제고 뉴타닉스는 국내 대표 금융그룹 NH농협금융의 자회사 NH농협캐피탈이 뉴타닉스 클...
    Date2023.09.19 Bynewsit Views577
    Read More
  15. 퓨어스토리지, 아시아 태평양 및 일본 지역 부사장에 네이슨 홀 선임

    - 퓨어스토리지의 풍부한 경험 갖춘 베테랑 임원, 아태지역 성장 가속화 및 고객들의 혁신적 성과 달성 지원 퓨어스토리지는 아시아 태평양 및 일본(APJ) 지역 부사장에 네이슨 홀(Nathan Hall)을 선임했다고 밝혔다. 네이슨 홀 부사장은 APJ 지역 비즈니스를 ...
    Date2023.09.19 Bynewsit Views402
    Read More
  16. ST, STM32H5 마이크로컨트롤러 디스커버리 키트 출시…“안전하고 스마트한 커넥티드 기기의 신속한 구현”

    - ST가 인증 및 유지관리하는 핵심 보안 서비스를 통합한 턴키 SoC인 보안 매니저(Secure Manager) 지원하는 첫 번째 키트 ST마이크로일렉트로닉스 STM32H5 마이크로컨트롤러(MCU)로 다양한 애플리케이션을 구현할 수 있는 풍성한 기능의 개발 보드를 출시했다...
    Date2023.09.19 Bynewsit Views518
    Read More
  17. 퀀텀, 오브젝트 스토리지 ‘액티브스케일 콜드 스토리지 번들’ 발표…“손쉽게 온프레미스 클라우드 환경으로 전환”

    - 기업이 자체 온프레미스 클라우드 리소스를 사용하여 아카이브 데이터의 가치 극대화 - 유연한 하이브리드 클라우드 워크플로우를 지원하는 퀀텀의 엔드투엔드 데이터 플랫폼의 핵심 - 모든 구성 요소가 포함된 10PB에서 최대 100PB에 이르는 4가지 표준 용...
    Date2023.09.19 Bynewsit Views302
    Read More
  18. 플로우, ‘국내 100대 기업’ 점유율 20% 돌파…“망분리 규제 강화 속 쾌거”

    - 금융권 망분리 업무 환경에 딱 맞춘 온프레미스형 수요 급증 - 포스코, 한국투자증권, 한국가스공사 등 대기업, 금융/공공기관 러브콜 확대 협업툴 플로우 개발사 마드라스체크가 국내 100대 기업 내 사내 서버 설치(온프레미스)형 협업툴 공급 점유율 20%를...
    Date2023.09.19 Bynewsit Views609
    Read More
  19. 마우저, 몰렉스 ‘올해의 아태지역 e-카탈로그 유통업체상’ 5년 연속 수상

    마우저 일렉트로닉스는 몰렉스(Molex)로부터 ‘올해의 APS e-카탈로그(e-Catalogue) 유통기업상’을 수상했다고 밝혔다. 마우저는 2022년에 아태지역에서 고객 수 증가, 가장 빠른 POS 성장, 재고관리, 그리고 전반적인 운영 우수성을 인정받아 몰렉스로부터 이 ...
    Date2023.09.18 Bynewsit Views520
    Read More
  20. MSI, ‘2023 다나와 아카데미 페스티벌’ 참가

    - 서강대학교 청년광장에서 MSI 노트북 전시 및 체험, 현장 이벤트 엠에스아이코리아는 서강대학교에서 열리는 ‘2023 다나와 아카데미 페스티벌’에서 참여해 MSI 노트북 전시 및 다채로운 이벤트를 진행한다고 밝혔다. 2023 다나와 아카데미 페스티벌은 2023년...
    Date2023.09.18 Bynewsit Views391
    Read More
Board Pagination Prev 1 ... 192 193 194 195 196 197 198 199 200 201 ... 289 Next
/ 289
CLOSE