- 600만 건 합성 데이터 기반 한국 사회·문화 맥락 반영

 

엔비디아, ‘네모트론-페르소나-코리아’ 공개…한국형 AI 데이터셋 활용 확대.jpg

오픈소스 공개·비식별 구조로 소버린 AI 개발 기반 강화

엔비디아가 한국형 합성 데이터셋 네모트론-페르소나-코리아(Nemotron-Personas-Korea)’를 공개하고 글로벌 AI 개발 플랫폼 허깅 페이스(Hugging Face)에서 데이터셋 부문 1위를 기록했다.

 

글로벌 데이터셋 경쟁에서 한국어 데이터 존재감 확대

네모트론-페르소나-코리아는 공개 직후 허깅페이스 데이터셋 순위 상위권에 진입하며 글로벌 AI 개발자 커뮤니티에서 빠르게 확산됐다. 한국어 기반 데이터셋이 글로벌 환경에서 상위권을 기록한 사례는 드물어 언어 특화 데이터의 활용 가치와 완성도를 동시에 보여준 사례로 평가된다.

 

600만 건 규모 합성 데이터로 한국 사회 구조 반영

데이터셋은 약 600만 건 규모로 구성되며 대한민국의 인구통계, 지역 분포, 직업 구조를 반영한다. 국가통계포털, 국민건강보험공단, 네이버 클라우드 등 공공·민간 데이터를 기반으로 실제 통계 분포를 모델링했다. 이름, 성별, 연령, 직업, 거주 지역 등 기본 속성뿐 아니라 존댓말 체계와 지역별 직업 패턴까지 반영해 한국어 맥락을 포함했다.

 

AI 학습·추론 품질 개선 위한 데이터 설계

이 데이터셋은 대규모 언어 모델 학습과 추론 단계에서 한국어 응답 품질을 높이는 데 활용하며 사용자 질문 맥락에 맞는 응답 생성과 문화적 표현 이해, 상황별 언어 선택 정확도를 개선한다. 존댓말 체계와 사회적 관계 표현까지 반영해 실제 사용자 환경에 가까운 응답을 지원한다.

 

합성 데이터 기반 개인정보 규제 대응

데이터셋은 실제 개인 정보를 포함하지 않는 완전 합성 데이터로 구성해 개인정보보호법을 준수하며 실제 데이터를 사용하지 않으면서도 통계적 특성을 유지한다. 이를 통해 데이터 활용성과 규제 대응을 동시에 확보하고 금융·공공 등 민감 데이터 환경에서도 적용 범위를 넓힌다.

 

오픈소스 공개로 개발자 활용 범위 확대

네모트론-페르소나-코리아는 오픈소스 라이선스로 공개돼 개발자가 자유롭게 활용할 수 있으며 데이터 다양성 확보와 모델 편향 완화, 응답 정확도 개선에 활용한다. 한국어 기반 챗봇과 추천 시스템, 자동화 서비스 등 다양한 환경으로 적용 범위를 확장한다.

 

국내 AI 생태계 협력 확대

엔비디아는 ‘Nemotron Developer Days Seoul 2026’을 통해 개발자와 기업 간 협업을 확대하며 데이터와 오픈 모델 기반으로 한국형 AI 개발 환경 구축을 지원하고 실제 서비스 적용 사례도 늘린다.

 

#엔비디아 #네모트론페르소나코리아 #합성데이터 #AI데이터 #소버린AI #허깅페이스 #AI플랫폼 #데이터셋

 
?

  1. NEW

    매스웍스, ‘MATLAB·Simulink R2026a’ 공개…임베디드 시스템 AI 개발 환경 강화

    - 시뮬링크·폴리스페이스 코파일럿 도입, 설계·검증 자동화 지원 - 근거 기반 AI로 추적성·재현성 확보, 엔지니어링 개발 프로세스 고도화 매스웍스가 ‘매트랩(MATLAB)’과 ‘시뮬링크(Simulink)’ 릴리스 2026a를 공개하며 임베디드 시스템 개발에 AI 기반 설계·...
    Date2026.04.28 Bynewsit Views4
    Read More
  2. NEW

    티맥스소프트, AI 플랫폼 개발 인재 채용…컨티뉴엄 AI 기반 제품 개발 확대

    - 5월 10일까지 서류 접수, 10개 직무 두 자릿수 채용 - 에이전틱 AI·클라우드 네이티브 기반 플랫폼 개발 인력 확보 티맥스소프트가 글로벌 AI 비즈니스 플랫폼 확대를 위해 엔터프라이즈 AI 제품 개발 인재 채용을 진행한다. AI 플랫폼 개발 인재 확보 확대 ...
    Date2026.04.28 Bynewsit Views10
    Read More
  3. NEW

    엔비디아, ‘네모트론-페르소나-코리아’ 공개…한국형 AI 데이터셋 활용 확대

    - 600만 건 합성 데이터 기반 한국 사회·문화 맥락 반영 오픈소스 공개·비식별 구조로 소버린 AI 개발 기반 강화 엔비디아가 한국형 합성 데이터셋 ‘네모트론-페르소나-코리아(Nemotron-Personas-Korea)’를 공개하고 글로벌 AI 개발 플랫폼 허깅 페이스(Huggin...
    Date2026.04.28 Bynewsit Views4
    Read More
  4. EDB, ‘데이터 브레이크스루 어워즈’ 수상…Postgres AI 기반 데이터·AI 통합 운영 확대

    - PostgreSQL 20년 기여 기반 AI 데이터 플랫폼 경쟁력 입증 EDB가 ‘EDB Postgres AI’로 ‘2026 데이터 브레이크스루 어워즈’에서 데이터 관리 혁신상을 수상하며 PostgreSQL 기반 데이터·AI 통합 운영 역량을 강화했다. 글로벌 데이터 기술 시상에서 수상 경쟁...
    Date2026.04.27 Bynewsit Views17
    Read More
  5. EDB, 맨텍솔루션과 쿠버네티스 DB 통합…아코디언에 PG4K·PGD4K 등재

    - 컨테이너 기반 데이터베이스까지 확장…오픈소스 전환 범위 확대 EDB가 맨텍솔루션 아코디언(Accordion) 허브에 쿠버네티스(Kubernetes) 기반 엔터프라이즈 데이터베이스 PG4K와 PGD4K를 등록하고 인프라부터 데이터베이스까지 이어지는 클라우드 네이티브(Cl...
    Date2026.04.27 Bynewsit Views15
    Read More
  6. 솔트웨어, AWS 마이그레이션 세미나 개최…TCO 기반 비용 구조 비교

    - 에이전틱 AI·고객 사례 중심 비용·운영 변화 분석 솔트웨어가 AWS와 함께 마이그레이션 세미나를 개최하며 TCO 분석과 실제 사례를 기반으로 클라우드 전환 시 비용 구조 차이를 분석한다. 4월 29일 서울 강남구 AWS 코리아 오피스에서 진행하는 행사는 AWS ...
    Date2026.04.24 Bynewsit Views34
    Read More
  7. 크리테오, ‘크리테오 커머스 포럼 2026’ 개최…AI 커머스 전략 공개

    - 에이전틱 AI·RMN 결합해 전환율·광고 효율 개선 - 데이터·리테일 미디어 기반 매출 확대 크리테오가 ‘크리테오 커머스 포럼 2026’에서 에이전틱 AI가 마케터의 커머스 여정 전반에서 성과 창출을 지원하는 AI 기반 커머스 전략을 공개했다. 행사에는 약 900...
    Date2026.04.24 Bynewsit Views34
    Read More
  8. [하노버메세 2026] 슈나이더 일렉트릭, 애저 AI 기반 에이전틱 제조 솔루션 공개…엔지니어링 시간 최대 50% 절감

    - 설계·시뮬레이션·검증·배포 연결…엔지니어링 시간 최대 50% 절감 슈나이더 일렉트릭이 ‘하노버 메세 2026’에서 MS 애저 기반 에이전틱 제조 솔루션을 공개했다. 마이크로소프트와 협업해 EAE 기반 단일 워크플로로 설계, 시뮬레이션, 검증, 배포, 운영 등 제...
    Date2026.04.24 Bynewsit Views33
    Read More
  9. 교보라이프플래닛, ‘라플레이’ AWS 전환…디지털 보험 플랫폼 해외 확장

    - 생성형 AI·MSA 구조 기반 인슈어테크 솔루션 수출 본격화 교보라이프플래닛생명이 디지털 보험 마케팅 플랫폼 ‘라플레이(Laplay)’를 아마존웹서비스(AWS) 기반으로 전환하고 설계사 없이 운영되는 디지털 보험 모델을 바탕으로 해외 보험사 대상 솔루션 수출...
    Date2026.04.23 Bynewsit Views37
    Read More
  10. AI 엑스포 코리아, ‘Beyond AlphaGo’ 컨퍼런스 개최…AI 주권 전략 제시

    - 5월 7~8일 코엑스 개최…소버린 AI·2036 시나리오 집중 논의 AI EXPO KOREA 2026 메인 컨퍼런스 ‘Beyond AlphaGo: Our way’가 5월 7일부터 8일까지 서울 코엑스에서 개최된다. 알파고 이후 10년을 기점으로 AI 활용 단계를 넘어 설계와 통제 역량을 확보하는 ...
    Date2026.04.23 Bynewsit Views35
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 239 Next
/ 239
CLOSE