소프트웨어·컴퓨팅

2023.08.09 12:34

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화

newsit

https://hwlab.com/SW_Computing/5809 조회 수 601 추천 수 0 댓글 0

Extra Form
참조#1	https://blogs.nvidia.com/blog/2022/03/25...mer-model/
참조#2	https://developer.nvidia.com/nemo-framework-open-beta
참조#3	https://developer.nvidia.com/nemo

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- '라이터', 네모 도입 후 올해 상반기만 10개 모델 개발

- 트리톤 추론 서버 활용으로 지연 시간 줄이고 처리량 높여

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg

엔비디아가 대규모 언어 모델 구축을 지원하는 엔비디아 네모(NVIDIA NeMo)를 통해 스타트업 ‘라이터(Writer)’의 성장 가속화에 핵심적인 역할을 하고 있다고 밝혔다.

라이터(Writer)의 공동 창립자이자 최고기술책임자(CTO)인 와심 알시크(Waseem Alshikh)는 대학시절 머신 러닝을 통해 교과서를 공부했지만, 이제 생성형 AI를 활용해 수백 개의 회사를 위한 콘텐츠를 제작하고 있다.

시리아에서 태어나고 자란 와심 알시크는 영어를 전혀 할 줄 몰랐다. 그러나 그는 소프트웨어에 뛰어난 재능을 가지고 있었고, 그 재능은 레바논의 대학에 입학했을 때 빛을 발했다.

알시크는 "첫날 학교에서 천 페이지에 달하는 두꺼운 교과서 다발을 받았고, 모두 영어로 쓰여 있었다"고 회상했다. 당시 그는 교과서를 요약하는 어설프지만 효과적인 통계 분류 프로그램을 만들었고 그 요약본을 공부했다.

아이디어가 하나의 기업이 되기까지

2014년, 그는 두바이에서 근무하던 중 만난 기업가 메이 하빕(May Habib)에게 자신의 이야기를 들려주었다. 두 사람은 제한된 자원으로 높은 성과를 내야 하는 마케팅 부서가 머신 러닝을 사용해 웹 페이지, 블로그, 광고 등의 콘텐츠를 빠르게 제작할 수 있도록 지원하는 스타트업을 만들기로 결심했다.

와심 알시크는 "트랜스포머(Transformer) 모델이 발표되기 전까지만 해도 이러한 기술은 존재하지 않았고, 우리는 이 기술을 기반으로 사업을 시작할 수 있었다"고 밝혔다.

"엔지니어 몇 명을 고용해 약 6개월에 걸쳐 첫 번째 모델을 개발했는데, 약 1억 2,800만 개의 파라미터를 가진 신경망은 거의 작동하지 않았다." 그 과정에서 그들은 몇 가지 사업을 수주하고 회사 이름을 라이터(Writer)로 변경한 후 엔비디아와 인연을 이어가게 됐다.

엔비디아 네모로 성장 가속화

엔비디아 네모는 기업이 훈련 데이터세트를 선별하고, 대규모 언어 모델(LLM)을 개발, 맞춤화한 후 이를 운영 환경에서 대규모로 실행할 수 있도록 지원하는 애플리케이션 프레임워크이다. 한국에서 스웨덴에 이르기까지 다양한 국가에서 현지 언어와 산업에 맞게 LLM을 맞춤형으로 구축하는 데 사용하고 있다.

와심 알시크는 "네모를 도입한 후 3억 개, 20억 개 그리고 현재 400억 개의 파라미터로 산업용 수준의 모델을 구축할 수 있었고, 지금도 계속 확장하고 있다. 네모를 사용하기 전에는 10억 개의 매개변수 모델을 새로 구축하는 데 4개월 반이 걸렸는데, 현재는 16일 만에 완료할 수 있으니 정말 놀랍다"고 밝혔다.

네모 모델을 통한 기회 창출

20명 미만의 AI 엔지니어로 구성된 라이터는 올해 상반기 동안 네모를 사용해 각각 300억 개 이상의 매개변수가 포함된 10개의 모델을 개발했다. 이로써 현재 수백 개의 기업이 라이터 모델을 사용하고 있다. 이 모델은 네모를 이용해 금융, 의료, 소매, 기타 수직 시장에 맞게 맞춤형으로 개발된 것이다.

라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg

라이터의 고객 중에는 딜로이트(Deloitte), 로레알(L’Oreal), 인튜이트(Intuit), 우버(Uber), 포춘 500대 기업 등 유명 기업들이 포함된다. 라이터 외에도 수십 개의 다른 회사에서 네모를 활용하고 있다.

네모는 엔비디아 AI 엔터프라이즈(AI Enterprise)의 일부로, 곧 누구나 사용할 수 있도록 공개될 예정이다. 엔비디아 AI 엔터프라이즈는 생성형 AI 워크로드의 가속화를 위해 최적화되고, 엔터프라이즈급 지원, 보안, 애플리케이션 프로그래밍 인터페이스를 통해 유지되는 풀스택 소프트웨어이다.

라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg

한 달에 1조 건의 API 호출

고객들은 자체 시스템이나 클라우드 서비스에서 라이터의 모델을 실행하거나, 라이터에 모델의 호스팅을 요청하거나 라이터의 API를 사용한다.

와심 알시크는 "기본적으로 두 사람이 관리하는 당사의 클라우드 인프라는 한 달에 1조 건의 API 호출을 호스팅하며, 초당 9만 개의 단어를 생성하고 있다. 우리는 보다 큰 팀과 대규모 예산을 가진 회사의 제품과 경쟁할 수 있는 고품질 모델을 제공하고 있다"고 말했다.

엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg

라이터는 네모와 함께 패키징된 트리톤 추론 서버(Triton Inference Server)를 사용해 고객을 위해 프로덕션 환경에서 모델을 실행한다. 와심 알시크는 LLM을 실행하는 많은 기업에서 사용하는 트리톤은 다른 프로그램보다 지연 시간이 짧고 처리량이 많다고 전했다.

알시크는 “10만 달러가 아닌 2만 달러로 서비스를 실행할 수 있으므로 의미 있는 기능을 구축하는 데 더 많은 투자를 할 수 있다"고 설명했다.

새로운 가능성의 지평

라이터는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션(Inception)의 멤버이기도 하다. 와심 알시크는 "인셉션 덕분에 네모를 미리 사용해 볼 수 있었고, 필요한 툴을 찾고 사용하는 과정을 안내해 준 훌륭한 사람들도 만날 수 있었다”고 밝히고, "현재 라이터의 텍스트 제품이 주목을 받고 있는 가운데, 와심 알시크는 플로리다와 캘리포니아에 있는 집을 오가며 다음 단계로 나아가기 위한 가능성을 모색하고 있다. 오늘날 생성형 AI의 광범위한 영역에서 그는 이미지, 오디오, 비디오, 3D, 어쩌면 이 모든 것에서 기회를 찾고 있다. 또한, 우리는 멀티 모달리티를 미래로 보고 있다”고 덧붙였다.

#엔비디아#네모#라이터#인셉션#트리톤#추론#

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '5'	엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화.jpg, 라이트의 공동 창립자인 메이 하빕(왼)과 와심 알시크(오).jpg, 라이터의 요약 기능, 인터뷰 또는 행사의 음성 녹취록을 텍스트 요약본으로 제공.jpg, 라이터, 기업 사용자 위한 풀스택 플랫폼 제공.jpg, 엔비디아 네모, 데이터 선별에서 추론에 이르는 생성형 AI를 위한 엔드 투 엔드 흐름 지원.jpg,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

소프트웨어·컴퓨팅

사이냅소프트, “문서 재활용 쉬운 AI 협업 웹 에디터로 세대교체 가속화“

- 그룹웨어부터 콜센터시스템까지 광범위하게 적용 - 공동편집 및 PPT 임포트 기능, AI기반 자동생성 등으로 독보적 우위 - 상담지식시스템 및 규정관리시스템 등으로 확장 기대 사이냅소프트는 자사의 ‘사이냅 에디터’가 한화시스템, 호반건설의 그룹웨어, 삼...

Date2024.03.07 Bynewsit Views349

Read More
슈나이더 일렉트릭 코리아, ‘인터배터리 2024’서 배터리 생태계 순환성 지원을 위한 인사이트 공유

- ‘인터배터리 2024’ 미디어 컨퍼런스 성료… 배터리 생태계 순환성 높이는 디지털 플랫폼 구축 필요 - ‘제로 임팩트 스마트 기가 팩토리’를 컨셉으로 4개의 존으로 구성된 부스 전시 슈나이더 일렉트릭 코리아가 지능형 디지털 플랫폼 구축을 통한 배터리 생태...

Date2024.03.06 Bynewsit Views459

Read More
지멘스, ‘아이온 모빌리티’ 개발 지원…“동남아 전기 바이크 시장 확대”

- Siemens Xcelerator 산업용 소프트웨어로 아이온 M1-S 전기 바이크의 스타일링, 메커니컬 엔지니어링, 전기 배터리 팩 개발에 활용 - 전세계 분산된 설계 및 엔지니어링 팀 간 유기적 작업으로 아이온 M1-S 탄생 지멘스 디지털 인더스트리 소프트웨어는 아이...

Date2024.03.06 Bynewsit Views423

Read More
다쏘시스템, BMW 그룹에 ‘3D익스피리언스’ 플랫폼 제공…"모빌리티와 버추얼트윈의 만남"

- 다쏘시스템 – BWM, 전략적 파트너십 통해 다쏘시스템 3D익스피리언스 플랫폼 중심의 BMW 그룹 미래 엔지니어링 플랫폼 개발 예정 - 전 세계 17,000명 구성원, 버추얼 트윈에서 각 모델의 변수를 실시간 데이터를 통해 작업 가능 - 버추얼 트윈이 가져다준 모...

Date2024.03.05 Bynewsit Views383

Read More
오라클, ‘글로벌 분산형 자율운영 데이터베이스’ 출시…“업계 최고 수준의 확장성, 가용성 및 데이터 주권 요구 사항 지원”

- 인공지능(AI) 및 머신러닝(ML) 구동 기반으로 운영 복잡성과 비용 대폭 절감 오라클은 오라클 글로벌 분산형 자율운영 데이터베이스(Oracle Globally Distributed Autonomous Database)를 정식 출시한다고 발표했다. 오라클의 입증된 샤딩(sharding) 기술을 ...

Date2024.03.05 Bynewsit Views352

Read More
리미니스트리트, 리미니 커스텀(Rimini Custom) 출시…“광범위한 엔터프라이즈 소프트웨어 제품 유지보수 서비스 제공”

- 모든 엔터프라이즈 소프트웨어 제품 및 릴리스의 수명을 연장하고, 조직이 혁신과 변혁에 IT 리소스를 집중할 수 있도록 지원 - 신뢰할 수 있는 검증된 단일 파트너가 통합 IT 서비스 제공 리미니스트리트는 오늘, 자사의 선도적인 지원과 서비스를 더 광범...

Date2024.03.04 Bynewsit Views362

Read More
가트너, “2027년 데이터 분석 거버넌스 이니셔티브 80% 위기 대응 못해 실패” 전망

- 비즈니스 성과 달성 우선시하지 않는 D&A 거버넌스 프로그램은 실패 불가피 … CDAO, 위기 파악과 신속한 D&A 전환으로 비즈니스 성과 지원해야 - 생성형 AI, 2027년까지 D&A 거버넌스 프로그램의 가치 실현 시간 40% 단축 가능 … 생산성 향상 등 비즈니스 과...

Date2024.02.29 Bynewsit Views640

Read More
레드햇, KDDI에 5G 서비스 위한 개방형 플랫폼 구축 지원

- 레드햇의 개방형 하이브리드 클라우드 기술로 5G 및 기타 서비스를 위한 표준화된 플랫폼 형성 - 새로운 서비스를 보다 빠르고 유연하게 배포 가능 레드햇(Red Hat)은 일본 통신 사업자 KDDI가 5G 코어 등 모바일 네트워크 서비스를 위한 개방형 표준 플랫폼...

Date2024.02.28 Bynewsit Views473

Read More
[MWC 2024] 세일즈포스, 통신사 대상 AI기반 청구 지원 서비스 공개

- 커뮤니케이션 클라우드 신기능 ‘청구 조회 관리자’ 발표 - 통신 사업 분야에 생성형 AI를 결합, 개인화된 고객경험 제공 지원 세일즈포스가 스페인 바르셀로나에서 열리는 MWC 2024에서 AI 기반의 통신 서비스 경험 향상을 위한 커뮤니케이션 클라우드의 신...

Date2024.02.28 Bynewsit Views531

Read More
티맥스소프트,'저전력·고효율 암페어 Arm 기반 어플라이언스' 세미나 개최…“지속 가능한 클라우드 혁신 제시”

- 내달 7일, 서울 강남 삼정호텔에서 행사 열어... 비용절감 및 ESG에 관심 있는 고객 초청 - SK텔레콤, HPE코리아, 암페어 컴퓨팅과 함께 공동 주관...암페어 Arm 기반 클라우드 제품의 혁신성, 비전 제시 예정 - 티맥스소프트, SKT의 Arm 서버 가상화 SW 탑...

Date2024.02.28 Bynewsit Views510

Read More

태그 쓰기

데이터브릭스, 레이크하우스 기반 엔터프라이즈 AI 확...	04-01
엑시스, 통합 안전·운영 플랫폼 전략 공개… AI 엣지 기...	04-01
티맥스소프트, 제우스 11 국내 최초 자카르타 EE 11 인...	04-01
온세미, SiC 하이브리드 전력 모듈로 시능전기 태양광·...	04-01
레노버, 데이비드 베컴과 글로벌 파트너십 체결… AI 스...	04-01
카스퍼스키, 2025년 글로벌 보안 테스트 최다 1위 기록...	04-01
데이터이쿠, APJ 총괄에 앤드류 보이드 선임…기업 AI ...	03-31
ST, 중국서 STM32 양산… 40nm eNVM 기반 이중 공급망 구축	03-31
F5, ADSP에 통합 가시성·Agentic AI·양자내성암호 적용...	03-31
스틸시리즈, 붉은사막 스팀 코드 번들…아크티스·에이펙...	03-31

소프트웨어·컴퓨팅

소프트웨어·컴퓨팅

엔비디아 네모, LLM 구축 지원으로 스타트업 ’라이터’ 성장 가속화

단축키

단축키

소프트웨어·컴퓨팅

사이냅소프트, “문서 재활용 쉬운 AI 협업 웹 에디터로 세대교체 가속화“

슈나이더 일렉트릭 코리아, ‘인터배터리 2024’서 배터리 생태계 순환성 지원을 위한 인사이트 공유

지멘스, ‘아이온 모빌리티’ 개발 지원…“동남아 전기 바이크 시장 확대”

다쏘시스템, BMW 그룹에 ‘3D익스피리언스’ 플랫폼 제공…"모빌리티와 버추얼트윈의 만남"

오라클, ‘글로벌 분산형 자율운영 데이터베이스’ 출시…“업계 최고 수준의 확장성, 가용성 및 데이터 주권 요구 사항 지원”

리미니스트리트, 리미니 커스텀(Rimini Custom) 출시…“광범위한 엔터프라이즈 소프트웨어 제품 유지보수 서비스 제공”

가트너, “2027년 데이터 분석 거버넌스 이니셔티브 80% 위기 대응 못해 실패” 전망

레드햇, KDDI에 5G 서비스 위한 개방형 플랫폼 구축 지원

[MWC 2024] 세일즈포스, 통신사 대상 AI기반 청구 지원 서비스 공개

티맥스소프트,'저전력·고효율 암페어 Arm 기반 어플라이언스' 세미나 개최…“지속 가능한 클라우드 혁신 제시”