- 베트남, 인도네시아, 태국 등 현지 관심, 스타일, 법적 규정에 부합하는 LLM 출시로 다양한 언어 및 문화 환경 반영

- 동남아시아의 문화적 맥락을 반영한 LLM 출시로 포용적인 디지털 미래 선두

 

다양한 작업과 언어에 대한 SeaLLM-13b 모델과 다른 LLM의 성능 비교.png

 

알리바바그룹의 글로벌 연구 이니셔티브인 다모 아카데미(DAMO Academy)130억 개 매개변수와 70억 개 매개변수 버전으로 제공되는 선구적인 거대 언어 모델 ‘SeaLLM(Southeast Asia LLM)’을 출시한다고 밝혔다. 동남아시아의 언어적 다양성을 충족하기 위해 특별히 설계된 SeaLLM은 기술의 포용성 측면에서 압도적인 도약을 이뤘다.

 

SeaLLM의 두 모델은 베트남어, 인도네시아어, 태국어, 말레이어, 크메르어, 라오스어, 타갈로그어, 버마어 등 해당 지역에서 실제로 사용되는 현지 언어와 호환되어 최적화된 지원을 제공한다. 대화형 모델인 SeaLLM-쳇은 동남아시아의 각 시장 고유의 문화적 구조에 대한 적응성을 토대로 현지 관습, 스타일, 법적 프레임워크에 부합하는 맞춤형 조정이 가능해 동남아시아 시장에 진출하는 기업에게 매우 유용한 챗봇 지원 도구로 부상하고 있다.

 

현재 허깅 페이스에서 오픈소스로 제공되는 SeaLLM은 체크포인트가 공개되어 연구 및 상업적 용도로 사용할 수 있다.

 

알리바바 다모 아카데미 언어 기술 연구소 리동 빙(Lidong Bing) 소장은 "기술 격차를 해소하기 위한 지속적인 노력을 통해 개발한 AI모델 ‘SeaLLM’을 소개하게 되어 기쁘며, 현지 언어뿐만 아니라 동남아시아의 풍부한 문화를 수용하는 SeaLLMAI의 민주화를 앞당겨 디지털 영역에서 소외되어 온 커뮤니티에 힘을 실어줄 것이라고 밝혔다.

 

알리바바의 다국어 AI 연구 분야 장기 파트너인 난양공과대학교의 루안 투안(Luu Anh Tuan) 컴퓨터과학 및 공학부(SCSE) 조교수는 "포용적인 기술발전을 위한 알리바바의 인상적인 행보는 다국어 LLMSeaLLM의 출시로 이정표에 도달했다. 이 이니셔티브는 영어, 중국어 이외의 언어를 사용하는 수백만 명의 사람들에게 새로운 기회를 제공할 수 있는 잠재력을 갖는다고 덧붙였다.

 

SeaLLM의 기본 모델은 동남아시아의 언어를 포함한 다양한 고품질 데이터 세트에 대한 사전 교육을 거쳐 현지 상황과 모국어 커뮤니케이션에 대한 미묘한 이해를 보장한다. 이 작업은 정교한 미세 조정 기술과 맞춤형 다국어 데이터 세트를 활용하는 SeaLLM 채팅 모델의 기초를 마련해 해당 모델을 기반으로 하는 챗봇 어시스턴트는 사회적 규범과 관습, 문체 선호도, 법적 고려 사항 등 해당 언어의 문화적 맥락을 이해하고 존중함에 따라 정확히 반영할 수 있다.

 

특히 SeaLLM의 주목할 만한 기술적 장점은 비라틴계 언어에 대한 효율성이 높다는 점이다. 버마어, 크메르어, 라오스어, 태국어 등 비라틴계 언어에 대해 ChatGPT 등의 모델보다 최대 9배 더 긴 텍스트를 해석하고 처리하거나, 동일한 길이의 텍스트에 대해 더 적은 수의 토큰을 사용하여 복잡한 작업을 실행하고, 운영 및 컴퓨팅 비용을 절감하고 환경 발자국을 감소시킨다.

 

한편, 130억 개의 파라미터를 갖춘 SeaLLM-13B는 광범위한 언어, 지식 관련 및 안전 작업에서 동급의 오픈 소스 모델을 능가해 LLM 성능에 대한 새로운 기준을 제시한다. SeaLLM은 초등학교부터 대학 입시까지 시험지로 구성된 벤치마크인 M3Exam에서 동남아시아 언어로 된 과학, 화학, 물리학, 경제학 등의 다양한 과목을 심도 있게 이해해 동급 모델보다 뛰어난 성능을 보였다.

 

또한, 라오스어와 크메르어 등 대화형 AI 시스템 학습을 위한 데이터가 제한적인 저자원 언어와 영어 간의 기계 번역 능력을 평가하는 플로레스(FLORES) 벤치마크에서도 SeaLLM은 기존 모델을 능가했으며, 베트남어, 인도네시아어 등 대부분의 고자원 언어에서는 최첨단(SOTA) 모델과 동등한 수준의 성능을 제공한다.

 

알리바바 다모 아카데미의 SeaLLM 시리즈는 일차원적인 AI의 발전이 아닌 보다 포용적인 디지털 미래를 향한 발걸음으로, 보다 자세한 기능과 영향력은 허깅 페이스(Hugging Face)프로젝트 페이지 혹은 기술 보고서에서 확인할 수 있다.

 

#알리바바#SeaLLM

 
?

  1. [SC24] 엔비디아, ‘cu파이뉴메릭' 가속 컴퓨팅 라이브러리로 혁신적인 데이터 처리 지원

    - 코드 변경 없이 단일 GPU에서 전체 슈퍼컴퓨터로 확장 가능 - 미국, 호주, 인도 등 다양한 국가 대학과 연구소서 워크플로우 개선 엔비디아는 미국 애틀랜타에서 개최되는 '슈퍼컴퓨팅 2024(SC24) 콘퍼런스에서 엔비디아 cu파이뉴메릭(NVIDIA cuPyNumeric) ...
    Date2024.11.20 Bynewsit Views273
    Read More
  2. 다쏘시스템, ‘솔리드웍스 이노베이션 데이 2025’ 개최…“혁신의 중심에서 차세대 디지털 기반 업무 환경 구축”

    다쏘시스템이 다음달 5일(화) 그랜드 인터컨티넨탈 서울 파르나스에서 ‘솔리드웍스 이노베이션 데이 2025(SOLIDWORKS Innovation Day 2025)'를 개최하고 3D 설계 및 엔지니어링 애플리케이션 ‘솔리드웍스 2025(SOLIDWORKS 2025)’의 신규 기능 및 고객 사례를 ...
    Date2024.10.22 Bynewsit Views273
    Read More
  3. 티맥스소프트, ‘전기·전자 미래 전략 컨퍼런스’ 웨비나 개최

    - 이달 13일 오후 2시 ‘티맥스소프트 가상홍보관’서 웨비나로 진행 - 전기·전자 산업계 최신 클라우드 동향과 전략을 알아볼 수 있는 시간 - 디지털 혁신 사례와 이를 지원하는 클라우드 인프라·주요 솔루션의 핵심 역할 중점 소개 티맥스소프트는 오는 6월 13...
    Date2024.06.11 Bynewsit Views273
    Read More
  4. SAP 석세스팩터스, ‘SAP HR 커넥트 2024’ 성료

    - 온프레미스 HCM 솔루션을 클라우드로 이전해 기업 민첩성, 운영 효율성, 혁신성 확보 - LG CNS, LG 이노텍, 한독, 두산디지털이노베이션 등 국내 고객 사례 공개 SAP는 클라우드 HCM(인적자본관리) 솔루션 SAP 석세스팩터스(SAP SuccessFactors)가 국내 기업...
    Date2024.03.27 Bynewsit Views273
    Read More
  5. 슈나이더 일렉트릭, 공급망 탈탄소화 지원 디지털 플랫폼 ‘자이고 허브’ 출시

    - 스코프3 감축 목표 달성 및 글로벌 넷제로 이행 가속화 위한 통합 솔루션 - 공급업체의 규모나 지속가능성 수준과는 무관하게 누구나 쉽게 참여 가능한 직관적인 플랫폼 슈나이더 일렉트릭은 기업의 공급망 전반에 걸친 탄소 배출 감축을 지원하는 디지털 플...
    Date2025.07.29 Bynewsit Views272
    Read More
  6. 인텔코리아, ‘2025 인텔 AI 서밋 서울’ 행사 성료…“AI 기술의 최신 트렌드와 혁신적인 적용 사례 공유”

    - 280여 기업 및 기관에서 약 900명 참석해 AI 기술의 최신 트렌드와 혁신적인 적용 사례 공유, AI 발전 방향 논의 - kt cloud, 포스코DX 등 국내 주요 협력사들과 인텔 AI 기술 기반 협력 확대 인텔은 국내 협력사들과 함께 인텔의 AI 기술 동향과 최신 전략,...
    Date2025.07.02 Bynewsit Views272
    Read More
  7. 사이냅소프트, 이노티움 문서중앙화에 '사이냅 문서뷰어' 공급…“모바일 보안 강화”

    - 이노ECM에 ‘문서뷰어’ 공급! 국내 1위 기술력 입증 - 이노티움, 모바일 문서중앙화 시스템 보안 강화 도큐먼트 AI 기업 사이냅소프트는 데이터 보안 솔루션 기업 이노티움의 문서중앙화 시스템 '이노ECM'에 자사의 ‘사이냅 문서뷰어’를 공급했다고 밝혔다. ...
    Date2025.05.13 Bynewsit Views272
    Read More
  8. LSK 글로벌 PS, 안전성 사례 관리 위해 오라클 아거스 도입

    - 오라클 아거스 도입으로 전체 개발 라이프사이클 전반에 걸쳐 작업흐름 자동화와 규제 요구사항 해결 및 비용 절감 지원 효과 기대 LSK 글로벌 PS가 제약회사의 안전성 데이터베이스 관리를 포함한 자사의 글로벌 약물감시 운영의 관리 및 확장을 위해 오라...
    Date2025.03.20 Bynewsit Views272
    Read More
  9. 슈나이더 일렉트릭 ‘에코스트럭처 IT’, 영국 데이터센터 매거진 선정 선도적인 DCIM 1위

    - 데이터센터 관리 효율성과 지속 가능성을 극대화하는 선도적인 DCIM 솔루션으로 선정 - 클라우드 기반의 에코스트럭처 IT를 통해 데이터센터 인프라 실시간 분석 및 최적화 설계 가능 슈나이더 일렉트릭이 영국의 권위 있는 IT 및 데이터센터 전문 매체인 데...
    Date2025.03.18 Bynewsit Views272
    Read More
  10. 델-LG CNS, “AI 인프라 비즈니스 활성화 맞손”

    - 델-LG CNS, 전략적 MOU 체결하고 상호 협력 기반의 엔터프라이즈 AI 사업을 위한 협의체 구성 한국 델 테크놀로지스와 LG CNS가 AI 인프라 비즈니스 활성화를 위해 협력에 나선다고 밝혔다. 양사는 이를 위해 지난달 22일에 마곡 LG CNS 본사에서 MOU를 체결...
    Date2025.02.13 Bynewsit Views272
    Read More
목록
Board Pagination Prev 1 ... 134 135 136 137 138 139 140 141 142 143 ... 202 Next
/ 202
CLOSE