- 정부 주관 다국어 번역 품질 평가 데이터사업 위한 컨소시엄 참여

- 플리토 플랫폼 기반 초고품질 다국어 데이터 구축으로 초거대 AI 환경 조성 기대

 

플리토AI플러스_베타출시_보도자료.png

인공지능 언어 데이터 기업 플리토가 자연어처리 기업 트위그팜과 함께 인공지능 번역기 품질 평가를 위한 데이터를 공동 구축한다고 7일 밝혔다.

 

트위그팜이 주관사로 플리토를 비롯해 시스트란, 글나무, 에퀴코리아, 푸르모디티 등 총 5개 참여사로 구성된 컨소시엄이 한국지능정보사회진흥원(NIA)다국어 번역 품질 평가 데이터사업 협약을 체결했다.

 

플리토 참여 컨소시엄은 올 연말까지 언어별 저작권 이슈 없는 신규 문서 확보 언어별 번역 말뭉치 데이터 및 번역 품질 평가 데이터 구축 데이터 및 구축 공정 품질관리 및 데이터 품질 검증 수행을 통한 고품질 데이터셋 구축 등을 수행할 계획이다.

 

글로벌 빅테크들의 생성형 AI 서비스 출시와 국내외 대기업들의 초거대 AI 투자가 본격화되는 가운데, 인공지능의 성능과 직결되는 고품질 데이터 구축과 기존 데이터의 품질 평가 시스템의 중요성이 대두되고 있다.

 

특히 언어권별 학습 데이터 수의 큰 격차를 극복하기 위해 기계번역 성능의 고도화는 필수인데, 지금까지는 블루 스코어(BLEU Score)’처럼 사람의 번역과 기계번역 결과 간 단어 유사도측정에 한정된 평가 기준으로 한계가 있었다.

 

이러한 한계를 극복하고 고품질의 대규모 병렬 말뭉치(코퍼스) 데이터를 구축하고자 트위그팜은 통합 크라우드소스 플랫폼을 운영하는 플리토와 손잡았다.

 

전 세계 약 1300만 유저의 플랫폼을 통해 양질의 최신 언어 데이터 확보가 가능하고, 특히 저작권 문제없는 적법성이 확보된 데이터 구축이 가능하다는 점에서 최적의 파트너라는 것이 트위그팜측 설명이다.

 

자체 AI 엔진과 플랫폼 번역가, 검증된 링귀스트팀을 모두 운영하면서, ‘국립국어원 한국어-외국어 병렬 말뭉치 구축 사업3년 연속 수주한 플리토의 데이터 사업 경쟁력을 바탕으로 이번 사업의 성공적 완수를 위해 긴밀하게 협업하겠다는 입장이다.

 

이번 컨소시엄을 주관하는 트위그팜의 백선호 대표는 지금까지 정부 주도의 대규모 말뭉치 데이터 구축이 지속되고 있었지만 정작 데이터의 품질을 평가하는 기술에는 다소 한계가 있었다고 설명하고, “초고품질 다국어 데이터 구축 및 품질 평가를 통해 초거대 AI 환경 조성에 기여하겠다고 포부를 밝혔다.

 

플리토의 이정수 대표는 이번 수행 과제에 자사의 글로벌 통합 플랫폼을 활용할 수 있게 돼 기쁘다. 플리토가 저작권 이슈 없는 고품질 다국어 데이터 구축에 차별적 경쟁력을 보유하고 있는 만큼, 사업의 성공적 완수를 위해 최선을 다하겠다고 강조했다.

 

#플리토#트위그팜#시스트란#글나무#에퀴코리아#AI#번역기#

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1730 티맥스소프트, 일본 FWD생명의 보험 계약 관리 시스템 ‘오픈프레임’으로 클라우드 전환 file newsit 2023.08.25 639
1729 ST, 위치 인식 셀룰러 IoT 모듈로 보다폰 NB-IoT 인증 획득 file newsit 2023.08.24 506
1728 와콤, 신제품 ‘와콤 원’ 출시 기념 카카오 라이브커머스 실시 file newsit 2023.08.24 288
1727 에버 인포메이션, 최첨단 환자 모니터링 PTZ카메라 「MD120UI」 출시 file newsit 2023.08.24 291
1726 마우저, 'AI 콘텐츠 허브'로 AI 애플리케이션 엔지니어를 위한 심층 정보 제공 file newsit 2023.08.24 551
1725 MSI, 지포스 RTX 4070 게이밍 X 슬림 화이트 출시…“더 얇고 강력한 슬림 시리즈” file newsit 2023.08.24 271
1724 WD, 신제품 ‘WD 블루 SN580 NVMe SSD’ 출시…“콘텐츠 크리에이터와 전문가용” file newsit 2023.08.23 394
1723 베리타스, 클라우드·SaaS 환경에서 랜섬웨어 방어 및 데이터 보호 성공 사례 공개 file newsit 2023.08.23 648
1722 캐논코리아, 잉크젯 프린터 ‘PIXMA G’ 시리즈 뉴 컬러 라인업 4종 출시 file newsit 2023.08.23 226
1721 스펙트럼 인스트루먼트, LIDAR 시스템 기반 3D 난류 시뮬레이션 모델링 고도화 기여   file newsit 2023.08.23 481
1720 노르딕 세미컨덕터, nRF9160 SiP 및 nRF5340 SoC PSA 인증 레벨 2 획득…“향상된 IoT 보안 기능 검증” file newsit 2023.08.22 493
1719 MSI, 노트북 서포터즈 12기 모집 file newsit 2023.08.22 334
1718 버티브, ‘2023 아시아 채널 서밋’ 개최 file newsit 2023.08.22 497
1717 딥엑스, 중국 심천 최대 전자전시회 ‘일렉스콘(ELEXCON) 2023’ 참가…“동아시아 AI 반도체 시장 선점” file newsit 2023.08.22 456
1716 ASUS, 전 제품 구매 고객 대상 ‘라이브 온 에이수스’ 리뷰 이벤트 file newsit 2023.08.22 243
1715 AMD, AI 전망 설문조사 보고서 발표…“AI 기술을 통한 비즈니스 성장 가속화 및 투자 확대 기대” file newsit 2023.08.22 490
1714 EDB, 자동차 전장 기업 ‘유라’에 기술지원 서비스 ‘TAM‘ 공급…“오픈소스 DBMS 포스트그레SQL의 안정적 운영“ file newsit 2023.08.22 510
1713 MSI, 창작자들의 축제 '2023 크리에이터 어워드' 성료 file newsit 2023.08.22 332
1712 벤큐 조위, 게이밍 마우스패드 신제품 2종 출시…“내구·내습성 높인 e스포츠용” file newsit 2023.08.22 255
1711 엔비디아-서울대병원, ‘HCLS 서밋 코리아 2023’ 개최 file newsit 2023.08.22 672
Board Pagination Prev 1 ... 186 187 188 189 190 191 192 193 194 195 ... 277 Next
/ 277
CLOSE