- 베트남, 인도네시아, 태국 등 현지 관심, 스타일, 법적 규정에 부합하는 LLM 출시로 다양한 언어 및 문화 환경 반영

- 동남아시아의 문화적 맥락을 반영한 LLM 출시로 포용적인 디지털 미래 선두

 

다양한 작업과 언어에 대한 SeaLLM-13b 모델과 다른 LLM의 성능 비교.png

 

알리바바그룹의 글로벌 연구 이니셔티브인 다모 아카데미(DAMO Academy)130억 개 매개변수와 70억 개 매개변수 버전으로 제공되는 선구적인 거대 언어 모델 ‘SeaLLM(Southeast Asia LLM)’을 출시한다고 밝혔다. 동남아시아의 언어적 다양성을 충족하기 위해 특별히 설계된 SeaLLM은 기술의 포용성 측면에서 압도적인 도약을 이뤘다.

 

SeaLLM의 두 모델은 베트남어, 인도네시아어, 태국어, 말레이어, 크메르어, 라오스어, 타갈로그어, 버마어 등 해당 지역에서 실제로 사용되는 현지 언어와 호환되어 최적화된 지원을 제공한다. 대화형 모델인 SeaLLM-쳇은 동남아시아의 각 시장 고유의 문화적 구조에 대한 적응성을 토대로 현지 관습, 스타일, 법적 프레임워크에 부합하는 맞춤형 조정이 가능해 동남아시아 시장에 진출하는 기업에게 매우 유용한 챗봇 지원 도구로 부상하고 있다.

 

현재 허깅 페이스에서 오픈소스로 제공되는 SeaLLM은 체크포인트가 공개되어 연구 및 상업적 용도로 사용할 수 있다.

 

알리바바 다모 아카데미 언어 기술 연구소 리동 빙(Lidong Bing) 소장은 "기술 격차를 해소하기 위한 지속적인 노력을 통해 개발한 AI모델 ‘SeaLLM’을 소개하게 되어 기쁘며, 현지 언어뿐만 아니라 동남아시아의 풍부한 문화를 수용하는 SeaLLMAI의 민주화를 앞당겨 디지털 영역에서 소외되어 온 커뮤니티에 힘을 실어줄 것이라고 밝혔다.

 

알리바바의 다국어 AI 연구 분야 장기 파트너인 난양공과대학교의 루안 투안(Luu Anh Tuan) 컴퓨터과학 및 공학부(SCSE) 조교수는 "포용적인 기술발전을 위한 알리바바의 인상적인 행보는 다국어 LLMSeaLLM의 출시로 이정표에 도달했다. 이 이니셔티브는 영어, 중국어 이외의 언어를 사용하는 수백만 명의 사람들에게 새로운 기회를 제공할 수 있는 잠재력을 갖는다고 덧붙였다.

 

SeaLLM의 기본 모델은 동남아시아의 언어를 포함한 다양한 고품질 데이터 세트에 대한 사전 교육을 거쳐 현지 상황과 모국어 커뮤니케이션에 대한 미묘한 이해를 보장한다. 이 작업은 정교한 미세 조정 기술과 맞춤형 다국어 데이터 세트를 활용하는 SeaLLM 채팅 모델의 기초를 마련해 해당 모델을 기반으로 하는 챗봇 어시스턴트는 사회적 규범과 관습, 문체 선호도, 법적 고려 사항 등 해당 언어의 문화적 맥락을 이해하고 존중함에 따라 정확히 반영할 수 있다.

 

특히 SeaLLM의 주목할 만한 기술적 장점은 비라틴계 언어에 대한 효율성이 높다는 점이다. 버마어, 크메르어, 라오스어, 태국어 등 비라틴계 언어에 대해 ChatGPT 등의 모델보다 최대 9배 더 긴 텍스트를 해석하고 처리하거나, 동일한 길이의 텍스트에 대해 더 적은 수의 토큰을 사용하여 복잡한 작업을 실행하고, 운영 및 컴퓨팅 비용을 절감하고 환경 발자국을 감소시킨다.

 

한편, 130억 개의 파라미터를 갖춘 SeaLLM-13B는 광범위한 언어, 지식 관련 및 안전 작업에서 동급의 오픈 소스 모델을 능가해 LLM 성능에 대한 새로운 기준을 제시한다. SeaLLM은 초등학교부터 대학 입시까지 시험지로 구성된 벤치마크인 M3Exam에서 동남아시아 언어로 된 과학, 화학, 물리학, 경제학 등의 다양한 과목을 심도 있게 이해해 동급 모델보다 뛰어난 성능을 보였다.

 

또한, 라오스어와 크메르어 등 대화형 AI 시스템 학습을 위한 데이터가 제한적인 저자원 언어와 영어 간의 기계 번역 능력을 평가하는 플로레스(FLORES) 벤치마크에서도 SeaLLM은 기존 모델을 능가했으며, 베트남어, 인도네시아어 등 대부분의 고자원 언어에서는 최첨단(SOTA) 모델과 동등한 수준의 성능을 제공한다.

 

알리바바 다모 아카데미의 SeaLLM 시리즈는 일차원적인 AI의 발전이 아닌 보다 포용적인 디지털 미래를 향한 발걸음으로, 보다 자세한 기능과 영향력은 허깅 페이스(Hugging Face)프로젝트 페이지 혹은 기술 보고서에서 확인할 수 있다.

 

#알리바바#SeaLLM

 
?

  1. 알리바바 클라우드, 기업의 생성용 AI 활용 돕는 ‘서버리스 솔루션’ 공개

    - LLM통해 글로벌 고객의 맞춤형 AI 애플리케이션을 개발 지원 - 알리바바 AI 및 빅데이터 서밋에서 자사 플랫폼의 서버리스 버전 공개 - 자세 데이터웨어하우스, 검색 서비스 등에 벡터 엔진 기술 통합 알리바바 클라우드가 개인과 기업에 모델 구축 및 인퍼...
    Date2024.02.02 Bynewsit Views402
    Read More
  2. 서비스나우-EY, ‘생성형 AI’ 전략적 제휴 확대

    - 조직 내 생성형 AI 거버넌스 개선 지원 및 중요 비즈니스 요구 사항 해결 - EY, 서비스나우 나우 어시스트 생성형 AI 기능으로 EY직원 및 고객 경험 개선 서비스나우(ServiceNow)가 EY와 전략적 제휴를 확대하고 생성형 AI에 대한 컴플라이언스, 거버넌스 및...
    Date2024.02.02 Bynewsit Views409
    Read More
  3. 애드저스트, ‘모바일 앱 어트리뷰션 핵심가이드: 기초부터 심화까지’ 발표

    모바일 마케팅 애널리틱스 플랫폼 애드저스트는 오늘 마케팅에 대해 필요 불가결한 어트리뷰션을 해설한 가이드 「모바일 앱 어트리뷰션 핵심 가이드」를 발표했다. 앱 개발자와 마케터들은 사용자와 광고의 상호작용을 이해해 성공적인 마케팅 의사결정을 내...
    Date2024.02.02 Bynewsit Views266
    Read More
  4. 뉴렐릭, 비즈니스 운영 관리 신규 옵저버빌리티 솔루션 ‘패스포인트’ 출시

    - 비즈니스 메트릭과 기술 메트릭을 동시 활용, 디지털 비즈니스 운영 과정을 한눈에 모니터링 - 비즈니스 운영팀과 기술팀 간 데이터 격차 최소화 뉴렐릭이 IT 기술과 실제 비즈니스 운영 성과 간 데이터 격차를 감소시키는 새로운 옵저버빌리티 솔루션 ‘뉴렐...
    Date2024.02.02 Bynewsit Views476
    Read More
  5. 유니버설 로봇, 고하중 협동로봇 「UR30」 출시…“전 세계 가장 무거운 가반하중 30KG 지원”

    협동로봇 전문 기업 ‘유니버설 로봇(Universal Robots)’이 작년 말에 선보인 30kg의 가반하중 협동로봇 ‘UR30’을 국내에 출시한다고 밝혔다. 유니버설 로봇 코리아는 오늘 국내외 시장점유율 1위 협동로봇 기업으로서의 비전을 설명하고, 2024년도 협동로봇 산...
    Date2024.02.01 Bynewsit Views423
    Read More
  6. 카카오뱅크 AI 센터, ‘디지털 리얼티’ 데이터 센터 선택…“AI와 고집적 워크로드에 최적화”

    - 카카오뱅크, AI 기반의 금융 혁신 지원을 위해 고집적 워크로드에 최적화된 인프라와 연결성을 제공하는 디지털 리얼티 선택 - 디지털 리얼티의 ‘ICN10’ 데이터 센터, AI와 고집적 워크로드에 최적화된 인프라와 연결성 제공, 무중단 운영과 강력한 보안으로...
    Date2024.02.01 Bynewsit Views385
    Read More
  7. 딥엘(DeepL), 글로벌 비즈니스 대상 AI 번역 설문조사 결과 발표…“응답자 98% 업무에 기계 번역 활용”

    - 전 세계 글로벌 기업의 마케터 대상으로 설문조사 진행 딥엘(DeepL)이 글로벌 기업 마케터를 대상으로 한 AI 번역 설문조사 결과를 발표했다. 이번 설문조사는 미국 리서치 회사 레지나 코르소 컨설팅(Regina Corso Consulting)에 의뢰해 진행한 것으로, 미...
    Date2024.01.31 Bynewsit Views348
    Read More
  8. 티맥스소프트, AK플라자에 ‘하이퍼프레임’ 제공… “상용 수준의 오픈소스 기술지원”

    - ‘하이퍼프레임’으로 AK몰의 오픈소스 활용 경쟁력 강화와 시스템 고도화 도울 것 - 컨설팅, 오픈소스 활용, 유지보수, 장애 대응 등 아우른 높은 수준의 체계적인 서비스 제공 - 성공 레퍼런스, 제품력, 종합 밀착 서비스 앞세워 ‘하이퍼프레임’의 확산 이룰...
    Date2024.01.31 Bynewsit Views468
    Read More
  9. LG CNS, 코드 생성형 AI에 최적화된 LLM 개발

    DX전문기업 LG CNS가 코드 생성형 AI에 최적화된 대규모언어모델(LLM)을 공개했다. LG CNS는 2023년 6월 챗GPT 기반의 코드 생성형 AI 서비스 ‘AI 코딩’을 개발해 다수의 사내 시스템 운영뿐만 아니라 고객사 SI·SM 프로젝트에도 활용 중이다. LG CNS는 AI 코...
    Date2024.01.31 Bynewsit Views361
    Read More
  10. 솔트웨어, AWS 마이그레이션 컴피턴시 파트너 인증 획득

    솔트웨어가 ‘AWS 마이그레이션 컴피턴시(AWS Migration Competency)’를 획득했다고 밝혔다. AWS 마이그레이션 컴피턴시는 AWS에서 심층적 기술 지식과 검증된 고객 성공 사례를 보유한 파트너를 대상으로 기업 고객 애플리케이션 및 인프라의 AWS 마이그레이션...
    Date2024.01.31 Bynewsit Views316
    Read More
목록
Board Pagination Prev 1 ... 143 144 145 146 147 148 149 150 151 152 ... 236 Next
/ 236
CLOSE