- 베트남, 인도네시아, 태국 등 현지 관심, 스타일, 법적 규정에 부합하는 LLM 출시로 다양한 언어 및 문화 환경 반영

- 동남아시아의 문화적 맥락을 반영한 LLM 출시로 포용적인 디지털 미래 선두

 

다양한 작업과 언어에 대한 SeaLLM-13b 모델과 다른 LLM의 성능 비교.png

 

알리바바그룹의 글로벌 연구 이니셔티브인 다모 아카데미(DAMO Academy)130억 개 매개변수와 70억 개 매개변수 버전으로 제공되는 선구적인 거대 언어 모델 ‘SeaLLM(Southeast Asia LLM)’을 출시한다고 밝혔다. 동남아시아의 언어적 다양성을 충족하기 위해 특별히 설계된 SeaLLM은 기술의 포용성 측면에서 압도적인 도약을 이뤘다.

 

SeaLLM의 두 모델은 베트남어, 인도네시아어, 태국어, 말레이어, 크메르어, 라오스어, 타갈로그어, 버마어 등 해당 지역에서 실제로 사용되는 현지 언어와 호환되어 최적화된 지원을 제공한다. 대화형 모델인 SeaLLM-쳇은 동남아시아의 각 시장 고유의 문화적 구조에 대한 적응성을 토대로 현지 관습, 스타일, 법적 프레임워크에 부합하는 맞춤형 조정이 가능해 동남아시아 시장에 진출하는 기업에게 매우 유용한 챗봇 지원 도구로 부상하고 있다.

 

현재 허깅 페이스에서 오픈소스로 제공되는 SeaLLM은 체크포인트가 공개되어 연구 및 상업적 용도로 사용할 수 있다.

 

알리바바 다모 아카데미 언어 기술 연구소 리동 빙(Lidong Bing) 소장은 "기술 격차를 해소하기 위한 지속적인 노력을 통해 개발한 AI모델 ‘SeaLLM’을 소개하게 되어 기쁘며, 현지 언어뿐만 아니라 동남아시아의 풍부한 문화를 수용하는 SeaLLMAI의 민주화를 앞당겨 디지털 영역에서 소외되어 온 커뮤니티에 힘을 실어줄 것이라고 밝혔다.

 

알리바바의 다국어 AI 연구 분야 장기 파트너인 난양공과대학교의 루안 투안(Luu Anh Tuan) 컴퓨터과학 및 공학부(SCSE) 조교수는 "포용적인 기술발전을 위한 알리바바의 인상적인 행보는 다국어 LLMSeaLLM의 출시로 이정표에 도달했다. 이 이니셔티브는 영어, 중국어 이외의 언어를 사용하는 수백만 명의 사람들에게 새로운 기회를 제공할 수 있는 잠재력을 갖는다고 덧붙였다.

 

SeaLLM의 기본 모델은 동남아시아의 언어를 포함한 다양한 고품질 데이터 세트에 대한 사전 교육을 거쳐 현지 상황과 모국어 커뮤니케이션에 대한 미묘한 이해를 보장한다. 이 작업은 정교한 미세 조정 기술과 맞춤형 다국어 데이터 세트를 활용하는 SeaLLM 채팅 모델의 기초를 마련해 해당 모델을 기반으로 하는 챗봇 어시스턴트는 사회적 규범과 관습, 문체 선호도, 법적 고려 사항 등 해당 언어의 문화적 맥락을 이해하고 존중함에 따라 정확히 반영할 수 있다.

 

특히 SeaLLM의 주목할 만한 기술적 장점은 비라틴계 언어에 대한 효율성이 높다는 점이다. 버마어, 크메르어, 라오스어, 태국어 등 비라틴계 언어에 대해 ChatGPT 등의 모델보다 최대 9배 더 긴 텍스트를 해석하고 처리하거나, 동일한 길이의 텍스트에 대해 더 적은 수의 토큰을 사용하여 복잡한 작업을 실행하고, 운영 및 컴퓨팅 비용을 절감하고 환경 발자국을 감소시킨다.

 

한편, 130억 개의 파라미터를 갖춘 SeaLLM-13B는 광범위한 언어, 지식 관련 및 안전 작업에서 동급의 오픈 소스 모델을 능가해 LLM 성능에 대한 새로운 기준을 제시한다. SeaLLM은 초등학교부터 대학 입시까지 시험지로 구성된 벤치마크인 M3Exam에서 동남아시아 언어로 된 과학, 화학, 물리학, 경제학 등의 다양한 과목을 심도 있게 이해해 동급 모델보다 뛰어난 성능을 보였다.

 

또한, 라오스어와 크메르어 등 대화형 AI 시스템 학습을 위한 데이터가 제한적인 저자원 언어와 영어 간의 기계 번역 능력을 평가하는 플로레스(FLORES) 벤치마크에서도 SeaLLM은 기존 모델을 능가했으며, 베트남어, 인도네시아어 등 대부분의 고자원 언어에서는 최첨단(SOTA) 모델과 동등한 수준의 성능을 제공한다.

 

알리바바 다모 아카데미의 SeaLLM 시리즈는 일차원적인 AI의 발전이 아닌 보다 포용적인 디지털 미래를 향한 발걸음으로, 보다 자세한 기능과 영향력은 허깅 페이스(Hugging Face)프로젝트 페이지 혹은 기술 보고서에서 확인할 수 있다.

 

#알리바바#SeaLLM

 
?

  1. 헥사곤 ‘스마트 스캔 VR800 3D’ 스캐너, 레드닷 디자인 어워드 제품 디자인 부문 수상

    - 제조 업계 최초의 스마트 줌 지원 광학 3D 스캐너 ‘스마트 스캔 VR800’ - 지속적 R&D영역 투자와 혁신 허브 운영으로 제조 및 품질 검사 작업 방식 개선 헥사곤 매뉴팩처링 인텔리전스는 자사의 구조광 스캐너 ‘스마트 스캔 VR800’이 뛰어난 제품 디자인 품...
    Date2024.06.25 Bynewsit Views459
    Read More
  2. 레노버-크라우드웍스, AI 혁신 MOU 체결…“하드웨어 인프라와 AI솔루션 결합”

    레노버는 크라우드웍스와 오늘 양사 협업 및 양해각서(MOU)를 체결하고, 상호 장점을 극대화하여 AI 솔루션 개발과 혁신적인 기술 도입을 가속화한다고 밝혔다. 레노버의 강력한 하드웨어 인프라와 크라우드웍스의 AI 솔루션을 결합하여, 더 빠르고 신뢰할 수 ...
    Date2024.06.25 Bynewsit Views440
    Read More
  3. 오라클 데이터베이스앳애저, 오라클 자율운영 데이터베이스 정식 지원

    - 오라클 엑사데이터 클라우드 인프라스트럭처에서 실행되는 다양한 오라클 - 데이터베이스 서비스를 마이크로소프트 애저 데이터센터에서 직접 배포 운영 가능 마이크로소프트 애저(Microsoft Azure) 미국 동부 리전에서 제공 중인 오라클 데이터베이스앳애저...
    Date2024.06.24 Bynewsit Views367
    Read More
  4. 피아이이, 한국전자통신연구원(ETRI)과 ‘3D CT 검사’ 기술협력 강화

    - 3D CT 검사 기술 내재화로 2차전지 포함한 첨단산업 검사 역량 강화 - 검사 솔루션 포트폴리오 확장으로 지속 성장 위한 핵심 경쟁력 확보 - 오는 10월부터 상용화 예정, 2025년 양산 적용 거쳐 매출 확대 본격 추진 AI 비전검사 소프트웨어 전문기업 피아이...
    Date2024.06.24 Bynewsit Views443
    Read More
  5. HPE, 가상화 역량 추가 및 하이브리드 클라우드 제품군 포트폴리오 확대

    - IT 환경의 간소화 효과 및 향상된 성능 제공하는 가상화 기능 추가 - 하이브리드 클라우드 기술 스택을 아우르며 종합적인 엔터프라이즈급 기능 및 서비스를 제공하는 최초의 기업 HPE가 HPE 프라이빗 클라우드(HPE Private Cloud) 내 가상화 역량을 추가하...
    Date2024.06.21 Bynewsit Views367
    Read More
  6. 헥사곤, 한국자동차공학회 춘계학술대회 연구 발표…“인공지능 및 머신러닝 활용한 미래 모빌리티 연구 주행성능 가상 개발”

    - 현대자동차 주관 한국자동차공학회 춘계학술대회 전문연구발표에서 미래 모빌리티의 주행 성능 향상에 활용된 아담스, 오딧세이, MSC 나스트란 등 소개 - AI/ML 분야 연구동향과 제품 연구 및 개발 과정 효율성 향상에 활용된 헥사곤 AI/ML 플랫폼 ‘오딧세이...
    Date2024.06.21 Bynewsit Views508
    Read More
  7. 효성인포메이션시스템, 엑세스랩과 ‘그린 데이터센터’ 총판 계약 체결 및 파트너십 강화

    - 효성인포메이션시스템, 저전력 ARM 서버 및 소프트웨어 개발 전문기업 엑세스랩과 총판 계약 - 저전력∙저발열∙ESG 니즈 큰 대규모 데이터센터 및 클라우드 중심으로 시장 확대 효성인포메이션시스템이 국내 유일 ARM 서버 개발 기업 엑세스랩과 총판 계약을 ...
    Date2024.06.20 Bynewsit Views440
    Read More
  8. 다쏘시스템-재규어랜드로버, 전략적 파트너십 5년 연장

    - 재규어랜드로버, 전 세계 모든 차량 프로그램에 다쏘시스템 3D익스피리언스 플랫폼 배포 - 다쏘 자동차 제조업체의 책임감 있는 비즈니스와 혁신을 주도하는 양사의 오랜 협력 의미 - 전 세계 18,000명 이상 사용자, 다쏘시스템 버추얼 트윈 활용해 차량 엔...
    Date2024.06.20 Bynewsit Views515
    Read More
  9. 케이투스, 서울에 ‘케이투스 혁신 센터’ 오픈…“최첨단 컴퓨팅 솔루션 체험”

    - 고객들이 강력한 컴퓨팅 자원을 더 빠르고 효율적으로 이용할 수 있도록 국내에서 최신 서버 및 AI 개발 솔루션 테스트와 문제 해결 지원 케이투스(KAYTUS)가 서울에 국내 고객들이 사전 인프라 투자 없이 최첨단 컴퓨팅 솔루션을 체험할 수 있는 ‘혁신 센터...
    Date2024.06.20 Bynewsit Views438
    Read More
  10. SAP 코리아, AI 기반 재무회계 및 구매 프로세스 혁신 위한 세미나 개최

    - AI로 인한 재무회계 업무 혁신 전망 및 감사에 미치는 영향 공유 - 실제 사례와 현장 체험 세션으로 알아보는 AI가 불러오는 구매 프로세스 혁신 공유 SAP 코리아는 지난 19일과 20일, 양 일에 걸쳐 AI가 비즈니스에 미치는 영향을 파악하고 다양한 사례를 ...
    Date2024.06.20 Bynewsit Views614
    Read More
목록
Board Pagination Prev 1 ... 116 117 118 119 120 121 122 123 124 125 ... 235 Next
/ 235
CLOSE