- 베트남, 인도네시아, 태국 등 현지 관심, 스타일, 법적 규정에 부합하는 LLM 출시로 다양한 언어 및 문화 환경 반영

- 동남아시아의 문화적 맥락을 반영한 LLM 출시로 포용적인 디지털 미래 선두

 

다양한 작업과 언어에 대한 SeaLLM-13b 모델과 다른 LLM의 성능 비교.png

 

알리바바그룹의 글로벌 연구 이니셔티브인 다모 아카데미(DAMO Academy)130억 개 매개변수와 70억 개 매개변수 버전으로 제공되는 선구적인 거대 언어 모델 ‘SeaLLM(Southeast Asia LLM)’을 출시한다고 밝혔다. 동남아시아의 언어적 다양성을 충족하기 위해 특별히 설계된 SeaLLM은 기술의 포용성 측면에서 압도적인 도약을 이뤘다.

 

SeaLLM의 두 모델은 베트남어, 인도네시아어, 태국어, 말레이어, 크메르어, 라오스어, 타갈로그어, 버마어 등 해당 지역에서 실제로 사용되는 현지 언어와 호환되어 최적화된 지원을 제공한다. 대화형 모델인 SeaLLM-쳇은 동남아시아의 각 시장 고유의 문화적 구조에 대한 적응성을 토대로 현지 관습, 스타일, 법적 프레임워크에 부합하는 맞춤형 조정이 가능해 동남아시아 시장에 진출하는 기업에게 매우 유용한 챗봇 지원 도구로 부상하고 있다.

 

현재 허깅 페이스에서 오픈소스로 제공되는 SeaLLM은 체크포인트가 공개되어 연구 및 상업적 용도로 사용할 수 있다.

 

알리바바 다모 아카데미 언어 기술 연구소 리동 빙(Lidong Bing) 소장은 "기술 격차를 해소하기 위한 지속적인 노력을 통해 개발한 AI모델 ‘SeaLLM’을 소개하게 되어 기쁘며, 현지 언어뿐만 아니라 동남아시아의 풍부한 문화를 수용하는 SeaLLMAI의 민주화를 앞당겨 디지털 영역에서 소외되어 온 커뮤니티에 힘을 실어줄 것이라고 밝혔다.

 

알리바바의 다국어 AI 연구 분야 장기 파트너인 난양공과대학교의 루안 투안(Luu Anh Tuan) 컴퓨터과학 및 공학부(SCSE) 조교수는 "포용적인 기술발전을 위한 알리바바의 인상적인 행보는 다국어 LLMSeaLLM의 출시로 이정표에 도달했다. 이 이니셔티브는 영어, 중국어 이외의 언어를 사용하는 수백만 명의 사람들에게 새로운 기회를 제공할 수 있는 잠재력을 갖는다고 덧붙였다.

 

SeaLLM의 기본 모델은 동남아시아의 언어를 포함한 다양한 고품질 데이터 세트에 대한 사전 교육을 거쳐 현지 상황과 모국어 커뮤니케이션에 대한 미묘한 이해를 보장한다. 이 작업은 정교한 미세 조정 기술과 맞춤형 다국어 데이터 세트를 활용하는 SeaLLM 채팅 모델의 기초를 마련해 해당 모델을 기반으로 하는 챗봇 어시스턴트는 사회적 규범과 관습, 문체 선호도, 법적 고려 사항 등 해당 언어의 문화적 맥락을 이해하고 존중함에 따라 정확히 반영할 수 있다.

 

특히 SeaLLM의 주목할 만한 기술적 장점은 비라틴계 언어에 대한 효율성이 높다는 점이다. 버마어, 크메르어, 라오스어, 태국어 등 비라틴계 언어에 대해 ChatGPT 등의 모델보다 최대 9배 더 긴 텍스트를 해석하고 처리하거나, 동일한 길이의 텍스트에 대해 더 적은 수의 토큰을 사용하여 복잡한 작업을 실행하고, 운영 및 컴퓨팅 비용을 절감하고 환경 발자국을 감소시킨다.

 

한편, 130억 개의 파라미터를 갖춘 SeaLLM-13B는 광범위한 언어, 지식 관련 및 안전 작업에서 동급의 오픈 소스 모델을 능가해 LLM 성능에 대한 새로운 기준을 제시한다. SeaLLM은 초등학교부터 대학 입시까지 시험지로 구성된 벤치마크인 M3Exam에서 동남아시아 언어로 된 과학, 화학, 물리학, 경제학 등의 다양한 과목을 심도 있게 이해해 동급 모델보다 뛰어난 성능을 보였다.

 

또한, 라오스어와 크메르어 등 대화형 AI 시스템 학습을 위한 데이터가 제한적인 저자원 언어와 영어 간의 기계 번역 능력을 평가하는 플로레스(FLORES) 벤치마크에서도 SeaLLM은 기존 모델을 능가했으며, 베트남어, 인도네시아어 등 대부분의 고자원 언어에서는 최첨단(SOTA) 모델과 동등한 수준의 성능을 제공한다.

 

알리바바 다모 아카데미의 SeaLLM 시리즈는 일차원적인 AI의 발전이 아닌 보다 포용적인 디지털 미래를 향한 발걸음으로, 보다 자세한 기능과 영향력은 허깅 페이스(Hugging Face)프로젝트 페이지 혹은 기술 보고서에서 확인할 수 있다.

 

#알리바바#SeaLLM

 
?

  1. 화웨이, 2024년 데이터센터 시설 10대 트랜드 발표

    화웨이가 올해 주목해야 할 10대 데이터 센터 트렌드에 대한 컨퍼런스를 개최하고 이와 관련된 백서를 발표했다. 이 자리에서 야오 콴(Yao Quan) 화웨이 데이터센터 시설 도메인 사장은 미래 데이터센터가 갖춰야 할 세 가지 특징을 신뢰성과 단순성, 지속가능...
    Date2024.01.22 Bynewsit Views481
    Read More
  2. 샵백코리아, 누적 앱 다운로드 100만 돌파… 4가지 ‘2024 설프라이즈’ 이벤트 실시

    - 샵백 전체 스토어에서 누적 10만원 이상 구매 시 최대 240만원의 랜덤 보너스 캐시백 제공하는 ‘2024년 복돈을 드려용’ 이벤트 - 샵백 친구 초대 시 GS25 5000원권 100% 지급하는 ‘친구와 함께 해용’ 이벤트 - 샵백 패션 추천 스토어에서 누적 10만원 이상 ...
    Date2024.01.22 Bynewsit Views449
    Read More
  3. 티맥스소프트, AWS에 ‘오픈프레임 리팩터’ SaaS 론칭… “글로벌 SaaS 기업 도약 할 것”

    - 클라우드 서비스 비즈니스 본격화 위한 AWS와 글로벌 전략 제품으로써 첫선 - 오픈프레임 리팩터, 메인프레임 현대화 시 기존 데이터와 자산을 자동 분석·전환하는 종합 SaaS 티맥스소프트는 메인프레임 현대화 SaaS ‘오픈프레임 리팩터’를 아마존웹서비스(A...
    Date2024.01.22 Bynewsit Views341
    Read More
  4. 와탭, SaaS 모니터링 서비스 가격 최대 35% 인하…“서버 모니터링 5대 무료는 현행 유지”

    - 서버 모니터링 최대 35% 가격 인하 적용 - 와탭만의 데이터 경량화 기술로 고객 데이터 보관 비용 부담 줄여 서비스형(SaaS) 모니터링 기업 와탭랩스가 자사 모니터링 서비스 ‘와탭’ 요금 체계를 2024년 1월부터 개편했다고 18일 발표했다. 이번 요금 개편은...
    Date2024.01.19 Bynewsit Views428
    Read More
  5. 뉴렐릭, ‘2023 가트너 피어 인사이트’ APM 및 옵저버빌리티 부문 ‘고객의 선택’ 기업으로 선정

    - 응답자 90%의 뉴렐릭 플랫폼 추천 및 평점 평균 4.5점 달성 뉴렐릭이 <2023 가트너 피어 인사이트 고객의 소리: 애플리케이션 성능 모니터링(APM) 및 옵저버빌리티 부문(2023 Gartner Peer Insights Voice of the Customer for Application Performance Moni...
    Date2024.01.18 Bynewsit Views529
    Read More
  6. 레드햇, DGB대구은행 ‘레드햇 오픈시프트’로 하이브리드 클라우드 인프라 기반 마련

    - 레드햇 오픈시프트 플랫폼으로 지방은행 최초 PaaS 시스템 구축 - IT 운영 인프라 혁신 통해 하이브리드 클라우드 확대 기반 마련 레드햇이 DGB대구은행의 프라이빗 클라우드 시스템 인프라 구축과 클라우드 전환 로드맵을 지원한다고 발표했다. 대구은행은 ...
    Date2024.01.18 Bynewsit Views633
    Read More
  7. 오라클, ‘2023 가트너 매직 쿼드런트 클라우드 데이터베이스 관리 시스템 부문’ 리더로 6년 연속 선정

    - 오라클 자율운영 데이터베이스, 2023 가트너 운영 사용사례를 위한 클라우드 데이터베이스 관리시스템 핵심역량의 모든 사용사례 부문에서 6년 연속 최고 점수 획득 오라클은 가트너가 최근 발표한 3개의 클라우드 데이터베이스 보고서를 통해 제품의 우수성...
    Date2024.01.18 Bynewsit Views545
    Read More
  8. EDB, 2024 DB 시장 동향 발표…“레거시/상용 데이터베이스에서 오픈소스 이동 가속화“

    오픈소스 PostgreSQL의 최대 지원 기업 EDB는 오늘, 2024년 DB 분야 주요 기술 트렌드를 발표했다. EDB는 ▲레거시/상용 데이터베이스에서 오픈소스로의 이동 가속화 ▲인공지능(AI)과 머신러닝(ML) 기술의 도입 확대 ▲클라우드 데이터베이스의 부상 ▲DB 보안 강...
    Date2024.01.17 Bynewsit Views605
    Read More
  9. 월터스클루어, 기업성과관리 솔루션 ‘CCH 타게틱’ 발표…“최적의 전사적 경영계획 및 예측 정보 제공”

    - AI 활용 고급 분석을 적용하여 기존 재무에만 국한된 FP&A을 넘어 다양한 운영 조직을 통합해 조직 간 사일로를 없애고 최적의 전사적 경영계획 및 예측 정보를 제공 월터스클루어 코리아는 오늘 급변하는 글로벌 비즈니스 환경에서 기업 고객들에게 AI 활용...
    Date2024.01.17 Bynewsit Views476
    Read More
  10. 세일즈포스, ‘NRF 2024’에서 차세대 쇼핑경험 AI 커머스 및 마케팅 솔루션 공개

    세일즈포스가 14일(일)부터 16일(화)까지 미국 뉴욕에서 진행된 세계 최대 유통박람회 ‘NRF 2024’에서 차세대 쇼핑경험을 위한 AI 커머스 및 마케팅 솔루션을 발표했다. 이번 NRF 2024에서 세일즈포스는 커머스 클라우드 및 마케팅 클라우드와의 연동을 기반으...
    Date2024.01.16 Bynewsit Views488
    Read More
목록
Board Pagination Prev 1 ... 146 147 148 149 150 151 152 153 154 155 ... 236 Next
/ 236
CLOSE