- KT, 엔비디아 DGX 슈퍼POD 플랫폼 및 네모 메가트론 프레임워크로 훈련된 10억 매개변수의 대규모 언어 모델(LLM) 구축 

 

엔비디아 AI, KT 스마트 스피커와 고객 콜센터 훈련 지원.jpg

엔비디아는 한국 통신사 KT가 엔비디아(NVIDIA) AI로 스마트 스피커와 고객 콜센터를 훈련했다고 밝혔다국내 인기 AI 음성비서 기가지니는 매일 800만 명의 사용자와 대화한다


KT AI 기반 스피커는 TV를 제어하고, 실시간 교통 정보를 제공하고 기타 집안에서의 다양한 업무를 수행한다. 대형의 텍스트 데이터 세트를 기반으로 인간 언어를 인식, 이해, 예측 및 생성할 수 있는 머신러닝 알고리즘인 대형언어 모델(LLM) 덕분에 매우 복잡한 한국어 대화 기술을 숙달했다

KT의 모델은 엔비디아 DGX 슈퍼(Super)POD 데이터 센터 인프라 플랫폼과 네모메가트론(NeMo Megatron) 프레임워크를 사용해 수십억 개의 매개변수를 가진 LLM을 훈련하고 배포한다

한글로 알려진 한국어는 세계에서 가장 어려운 언어 목록에 꾸준히 포함돼 왔다. 한국어에는 네 가지 유형의 복합동사가 존재하며, 한국어 단어는 종종 두 개 이상의 어근으로 구성된다

2,200만 명이 넘는 가입자를 보유한 한국의 선도적인 통신사 KT자체 LLM을 개발해 스마트 스피커의 단어에 대한 이해도를 높였다. 또한 2,000억 개 이상의 매개변수를 가진, 적용 분야 별 최적화된 다양한 버전의 LLM들을 사업에 적용하고 있다. 더불어 기가지니는 아마존 알렉사(Alexa)와의 통합을 통해 사용자와 영어로 대화할 수 있다


KT LLM 개발팀 류휘정 팀장은 “트랜스포머기반 모델을 통해 기가지니 스마트 스피커와 고객 서비스 플랫폼 AI 컨택센터(AICC)의 품질이 크게 향상됐다”라고 말했다

AICC AI 음성 에이전트 및 기타 고객 서비스 관련 애플리케이션을 제공하는 올인원 클라우드 기반 플랫폼이다AICC는 전화를 받고 요청된 정보를 제공하거나 고객을 상담원과 빠르게 연결해 보다 자세한 문의에 대한 답변을 제공할 수 있다. 류팀장에 따르면 인간의 개입이 없이 AICC는 매일 전국적으로 10만 건 이상의 전화를 관리하고 있다

류휘정 팀장은 “기가지니는 LLM을 통해 언어 이해도를 높이고 인간과 유사한 문장을 더 많이 생성할 수 있으며, AICC는 문의 유형을 더 빠르게 요약하고 분류해 상담 시간을 15초 단축할 수 있다”고 밝혔다.

대규모 언어 모델 훈련 
LLM을 개발하는 것은 심도 있는 기술 전문 지식과 전체 스택 기술 투자가 필요한 값비싸고, 시간 소모적인 과정일 수 있다엔비디아 AI 플랫폼은 KT를 위해 이 과정을 간소화하고 가속화했다

류 팀장은 "엔비디아 DGX 슈퍼POD의 강력한 성능과 네모 메가트론의 최적화된 알고리즘 및 3D 병렬 처리 기술을 통해 LLM 모델을 보다 효과적으로 훈련했다. 네모 메가트론은 지속적으로 새로운 기능을 채택하고 있으며, 이는 모델 정확도를 개선하는 데 있어 가장 큰 장점이라고 생각한다"고 밝히고, "대규모 딥 러닝 모델을 여러 장치에 분할하는 분산 학습 방법인 3D 병렬 처리는 KT LLM 학습에 중요한 포인트였다. 네모 메가트론을 통해 팀은 가장 높은 처리량으로 작업을 쉽게 수행할 수 있었다다른 플랫폼을 사용하는 것도 고려했지만 하드웨어 수준에서 추론 수준까지 풀스택 환경을 제공하는 대안을 찾기가 어려웠다. 또한 엔비디아는 제품, 엔지니어링 팀 등으로부터 탁월한 전문 지식을 제공하므로 기술 문제를 쉽게 해결할 수 있었다"고 덧붙였다. 

KT는 네모 메가트론의 하이퍼파라미터 최적화 도구를 사용해 다른 프레임워크보다 LLM을 두배 더 빠르게 훈련했다. 이러한 도구를 통해 사용자는 LLM 훈련 및 추론을 위한 최상의 구성을 자동으로 찾아 개발 및 배포 과정을 쉽고 빠르게 할 수 있다
KT엔비디아트리톤 추론서버(Triton Inference Server)를 사용해 최적화된 실시간 추론 서비스를 제공하고, 엔비디아베이스 커맨드매니저(Base Command Manager)를 통해 AI 클러스터에서 수백 개의 노드를 쉽게 모니터링하고 관리할 계획이다

 

류 팀장은 “LLM 덕분에 KT는 경쟁력 있는 제품을 그 어느 때보다 빠르게 출시할 수 있게 됐다. 또한 우리 기술이 타사의 가치를 높이고 혁신적인 제품을 만드는 데 사용될 수 있기 때문에 타사의 혁신을 주도할 수 있다고 믿는다"라고 밝혔다


KT는 오는 11월 개발자를 대상으로 20여종의 자연어 이해와 자연어 생성 API를 출시할 예정이다. 애플리케이션 프로그래밍 인터페이스는 문서 요약 및 분류, 감정 인식 및 잠재적으로 부적절한 내용의 필터링을 포함한 작업에 사용할 수 있다

#엔비디아#KT#LLM# DGX#  

?

  1. 엔비디아, 미디어텍과 협력…”AI 및 가속 컴퓨팅 통한 자동차 혁신”

    - 보급형 차량부터 고급 차량까지 소프트웨어 정의, 커넥티드, 지능형 캐빈 솔루션 제공 엔비디아는 운전자와 탑승자에게 새로운 차량 내부 경험을 선사하기 위해 연결성 멀티미디어 분야의 선도적인 혁신 기업인 미디어텍(MediaTek)과 협력한다고 발표했다. ...
    Date2023.05.31 Bynewsit Views621
    Read More
  2. 가트너, “2023년 세계 IT 지출 전년 대비 2.4% 성장 전망”

    - 소비자 구매력 억제하는 인플레이션 속에서도 기업 IT 지출 강세 지속 가트너(Gartner)는 올해 전 세계 IT 지출이 2022년보다 2.4% 증가한 총 4조 5천억 달러에 이를 것이라고 전망하고, 이전 분기 성장률 예측치인 5.1%보다 낮아진 수치다. 가트너는 인플레...
    Date2023.01.20 Bynewsit Views621
    Read More
  3. 아스펜테크, aspenONE V14 출시..."고객의 지속가능성 향상"

    - 최신 버전 aspenONE으로 고객이 새로운 수준의 효율성을 달성하는 동시에 탄소 중립목표 달성을 가속화하도록 지원 아스펜테크는 aspenONE 소프트웨어의 최신 버전인 V14를 출시한다고 발표했다. 이 새로운 aspenONE V14는 첨단 인텔리전스와 가이던스 기능...
    Date2022.11.23 Bynewsit Views621
    Read More
  4. 테스토코리아, ‘연말맞이 특별 프로모션’ 이벤트

    - 테스토 온/습도계, 풍속 및 압력 측정기, 실내환경측정기 3개 제품군 구매 고객에게 테스토 전용 가방과 서비스 쿠폰팩 증정 - 인증 후기 이벤트도 함께 진행해 커피 쿠폰 및 주유상품권 등 푸짐한 경품 제공 테스토코리아는 오늘, 연말을 맞아 고객들의 성...
    Date2024.11.25 Bynewsit Views620
    Read More
  5. 티맥스메타버스-아트토큰, 슈퍼앱 기반 NFT ‘아트 메타플랫폼’ 구축 MOU 체결

    - 티맥스메타버스-아트토큰, 슈퍼앱 기반 NFT 아트 메타플랫폼 개발 위해 맞손 - 슈퍼앱 기반 NFT 아트 메타플랫폼 구축부터 신규 사업모델 발굴 위한 협업 이어나갈 예정 티맥스메타버스와 아트토큰이 슈퍼앱 기반 NFT 아트 메타플랫폼 구축을 위해 두손을 맞...
    Date2023.09.18 Bynewsit Views620
    Read More
  6. 슈나이더 일렉트릭, 2022년 지속가능성 영향(SSI) 성과 발표

    - 2022년 지속가능성 영향 목표 점수 4.70점을 넘어 4.91점 초과 달성 - SBTi에 의해 검증된 전체 가치 사슬에 대해 넷제로 목표를 달성한 최초 기업 중 하나 슈나이더 일렉트릭은 2022년 지속가능성 영향(SSI) 프로그램의 성과를 발표했다. 슈나이더 일렉트릭...
    Date2023.03.14 Bynewsit Views620
    Read More
  7. 윈드리버, 일본 NTT도코모 5G vRAN 기지국 상용화에 ‘윈드리버 스튜디오’ 공급

    윈드리버는 NTT 도코모(NTT DOCOMO)가 일본에서 지난 9월부터 상용 구축을 시작한 5G 가상화 네트워크에 ‘윈드리버 스튜디오(Wind River Studio)’를 공급했다고 발표했다. 윈드리버 스튜디오 클라우드 플랫폼은 NTT 도코모의 첫 번째 vRAN 상용 서비스를 위해 ...
    Date2023.10.10 Bynewsit Views619
    Read More
  8. 한국화웨이, ‘코리아 씨드 포 더 퓨처 2023’ 참가자 모집

    국내 ICT 인재를 대상으로 하는 ‘코리아 씨드 포 더 퓨처 2023’은 8월 18일부터 28일까지 온오프라인 병행으로 진행된다. 참가 학생에게는 ▲화웨이의 새로운 E-러닝 플랫폼인 ‘씨드아카데미(Seeds Academy)’에서 제공하는 5G, 클라우드 컴퓨팅, AI, 디지털 파...
    Date2023.07.25 Bynewsit Views619
    Read More
  9. SAS, 2024년 인공지능(AI) 시장 12가지 전망 발표…“2024년 AI가 기업의 현명한 의사결정 지원할 것”

    인공지능(AI) 및 분석 선두 기업 SAS가 2024년 AI 시장 전망을 발표했다. 이번 발표는 AI의 주요 트렌드, 비즈니스 및 기술 발전을 예측하고, 각 산업에서 AI의 활용과 사회적, 경제적 영향에 대한 깊이 있는 인사이트를 제공한다. 생성형 AI, 산업별 AI 전략 ...
    Date2023.12.12 Bynewsit Views618
    Read More
  10. 유아이패스, 자동화 워크플로우에 아마존 ‘세이지메이커’ 통합 · · ·“머신 러닝 모델 효용가치 극대화”

    - 유아이패스 비즈니스 오토메이션 플랫폼 신규 기능, - 비즈니스 프로세스 내 머신 러닝 모델 배포에 필요한 시간 및 비용 절감 유아이패스는 엔드 투 엔드 머신 러닝(ML) 서비스인 아마존 세이지메이커(Amazon SageMaker)를 유아이패스 솔루션에 통합해 복잡...
    Date2023.03.22 Bynewsit Views618
    Read More
목록
Board Pagination Prev 1 ... 69 70 71 72 73 74 75 76 77 78 ... 238 Next
/ 238
CLOSE