- 600만 건 합성 데이터 기반 한국 사회·문화 맥락 반영

 

엔비디아, ‘네모트론-페르소나-코리아’ 공개…한국형 AI 데이터셋 활용 확대.jpg

오픈소스 공개·비식별 구조로 소버린 AI 개발 기반 강화

엔비디아가 한국형 합성 데이터셋 네모트론-페르소나-코리아(Nemotron-Personas-Korea)’를 공개하고 글로벌 AI 개발 플랫폼 허깅 페이스(Hugging Face)에서 데이터셋 부문 1위를 기록했다.

 

글로벌 데이터셋 경쟁에서 한국어 데이터 존재감 확대

네모트론-페르소나-코리아는 공개 직후 허깅페이스 데이터셋 순위 상위권에 진입하며 글로벌 AI 개발자 커뮤니티에서 빠르게 확산됐다. 한국어 기반 데이터셋이 글로벌 환경에서 상위권을 기록한 사례는 드물어 언어 특화 데이터의 활용 가치와 완성도를 동시에 보여준 사례로 평가된다.

 

600만 건 규모 합성 데이터로 한국 사회 구조 반영

데이터셋은 약 600만 건 규모로 구성되며 대한민국의 인구통계, 지역 분포, 직업 구조를 반영한다. 국가통계포털, 국민건강보험공단, 네이버 클라우드 등 공공·민간 데이터를 기반으로 실제 통계 분포를 모델링했다. 이름, 성별, 연령, 직업, 거주 지역 등 기본 속성뿐 아니라 존댓말 체계와 지역별 직업 패턴까지 반영해 한국어 맥락을 포함했다.

 

AI 학습·추론 품질 개선 위한 데이터 설계

이 데이터셋은 대규모 언어 모델 학습과 추론 단계에서 한국어 응답 품질을 높이는 데 활용하며 사용자 질문 맥락에 맞는 응답 생성과 문화적 표현 이해, 상황별 언어 선택 정확도를 개선한다. 존댓말 체계와 사회적 관계 표현까지 반영해 실제 사용자 환경에 가까운 응답을 지원한다.

 

합성 데이터 기반 개인정보 규제 대응

데이터셋은 실제 개인 정보를 포함하지 않는 완전 합성 데이터로 구성해 개인정보보호법을 준수하며 실제 데이터를 사용하지 않으면서도 통계적 특성을 유지한다. 이를 통해 데이터 활용성과 규제 대응을 동시에 확보하고 금융·공공 등 민감 데이터 환경에서도 적용 범위를 넓힌다.

 

오픈소스 공개로 개발자 활용 범위 확대

네모트론-페르소나-코리아는 오픈소스 라이선스로 공개돼 개발자가 자유롭게 활용할 수 있으며 데이터 다양성 확보와 모델 편향 완화, 응답 정확도 개선에 활용한다. 한국어 기반 챗봇과 추천 시스템, 자동화 서비스 등 다양한 환경으로 적용 범위를 확장한다.

 

국내 AI 생태계 협력 확대

엔비디아는 ‘Nemotron Developer Days Seoul 2026’을 통해 개발자와 기업 간 협업을 확대하며 데이터와 오픈 모델 기반으로 한국형 AI 개발 환경 구축을 지원하고 실제 서비스 적용 사례도 늘린다.

 

#엔비디아 #네모트론페르소나코리아 #합성데이터 #AI데이터 #소버린AI #허깅페이스 #AI플랫폼 #데이터셋

 
?

  1. NEW

    매스웍스, ‘MATLAB·Simulink R2026a’ 공개…임베디드 시스템 AI 개발 환경 강화

    - 시뮬링크·폴리스페이스 코파일럿 도입, 설계·검증 자동화 지원 - 근거 기반 AI로 추적성·재현성 확보, 엔지니어링 개발 프로세스 고도화 매스웍스가 ‘매트랩(MATLAB)’과 ‘시뮬링크(Simulink)’ 릴리스 2026a를 공개하며 임베디드 시스템 개발에 AI 기반 설계·...
    Date2026.04.28 Bynewsit Views3
    Read More
  2. NEW

    티맥스소프트, AI 플랫폼 개발 인재 채용…컨티뉴엄 AI 기반 제품 개발 확대

    - 5월 10일까지 서류 접수, 10개 직무 두 자릿수 채용 - 에이전틱 AI·클라우드 네이티브 기반 플랫폼 개발 인력 확보 티맥스소프트가 글로벌 AI 비즈니스 플랫폼 확대를 위해 엔터프라이즈 AI 제품 개발 인재 채용을 진행한다. AI 플랫폼 개발 인재 확보 확대 ...
    Date2026.04.28 Bynewsit Views9
    Read More
  3. NEW

    엔비디아, ‘네모트론-페르소나-코리아’ 공개…한국형 AI 데이터셋 활용 확대

    - 600만 건 합성 데이터 기반 한국 사회·문화 맥락 반영 오픈소스 공개·비식별 구조로 소버린 AI 개발 기반 강화 엔비디아가 한국형 합성 데이터셋 ‘네모트론-페르소나-코리아(Nemotron-Personas-Korea)’를 공개하고 글로벌 AI 개발 플랫폼 허깅 페이스(Huggin...
    Date2026.04.28 Bynewsit Views4
    Read More
  4. NEW

    히타치 밴타라, 2026 기가옴 레이더 오브젝트 스토리지 리더 선정

    - AI 데이터 증가 대응…오브젝트 스토리지 인프라 역할 확대 HS효성인포메이션시스템은 시장 분석기관 기가옴이 발표한 ‘2026 기가옴 레이더 오브젝트 스토리지’ 보고서에서 히타치 밴타라가 리더 및 패스트 무버로 선정됐다고 밝혔다. 이번 평가는 AI 기반 워...
    Date2026.04.28 Bynewsit Views9
    Read More
  5. 티머니, ‘헬로키티 봉제 키링 티머니’ 재출시…사전예약·유통 채널 확대

    - 편의점 앱 사전예약 도입, 키링형 교통카드 재판매 티머니가 ‘산리오캐릭터즈 헬로키티 봉제 키링 티머니’를 재출시하며 사전예약 도입과 유통 채널을 확대한다. 사전예약 채널 확대해 구매 방식 변경 제품은 4월 27일부터 5월 3일까지 편의점 앱을 통해 사...
    Date2026.04.27 Bynewsit Views23
    Read More
  6. 함샤우트 글로벌, AI 브랜드 진단 서비스 ‘AIBA’ 출시…생성형 AI 인식 기반 분석 제공

    - AI 답변 구조 역추적해 브랜드 인식·경쟁 위치 정량화 함샤우트 글로벌이 생성형 AI 기반 브랜드 진단 서비스 ‘AIBA(AI Brand Audit)’를 출시하며 AI 환경에서 형성되는 브랜드 인식을 분석하고 경쟁 위치를 수치로 산출한다. AI 답변 역추적으로 브랜드 인...
    Date2026.04.27 Bynewsit Views22
    Read More
  7. ST, 4V~36V 지원 연산 증폭기 ‘TSB192’ 출시…정밀 아날로그 신호 처리 지원

    - 저오프셋·저드리프트 기반 산업·자동차·의료 측정 환경 대응 ST가 4V~36V 전압 범위에서 동작하는 듀얼 연산 증폭기 ‘TSB192’를 출시하며 다양한 전원 환경에서 고정밀 아날로그 신호 처리를 지원한다. 넓은 전압 범위에서 고정밀 신호 처리 TSB192는 20µV ...
    Date2026.04.27 Bynewsit Views23
    Read More
  8. 스틸시리즈, T1 홈그라운드 참가…게이밍 기어 체험·현장 판매 운영

    - 제품 체험·이벤트·현장 할인 결합해 e스포츠 팬 참여 확대 스틸시리즈가 ‘2026 T1 홈그라운드’에 참가해 게이밍 기어 체험 부스와 현장 이벤트를 운영하며 제품 체험과 현장 구매를 결합한 참여형 오프라인 행사를 진행했다. 게이밍 기어 체험 중심 부스 운...
    Date2026.04.27 Bynewsit Views18
    Read More
  9. EDB, ‘데이터 브레이크스루 어워즈’ 수상…Postgres AI 기반 데이터·AI 통합 운영 확대

    - PostgreSQL 20년 기여 기반 AI 데이터 플랫폼 경쟁력 입증 EDB가 ‘EDB Postgres AI’로 ‘2026 데이터 브레이크스루 어워즈’에서 데이터 관리 혁신상을 수상하며 PostgreSQL 기반 데이터·AI 통합 운영 역량을 강화했다. 글로벌 데이터 기술 시상에서 수상 경쟁...
    Date2026.04.27 Bynewsit Views16
    Read More
  10. 카스퍼스키, ‘스파크캣’ 변종 확인…앱스토어·구글플레이 보안 우회 사례 공개

    - 암호화폐 지갑 복구 문구 노린 모바일 트로이목마, 공식 스토어 유입 확인 카스퍼스키가 앱스토어(App Store)와 구글플레이(Google Play)에서 유포된 암호화폐 탈취 악성코드 ‘스파크캣(SparkCat)’ 변종을 확인해 모바일 애플리케이션 유통 경로에서 보안 우...
    Date2026.04.27 Bynewsit Views16
    Read More
  11. 팔로알토네트웍스, ‘Unit 42 Frontier AI Defense’ 공개…AI 모델·데이터 보안 통합 보호

    - 모델·데이터·운영 환경 전반 보호하는 AI 보안 플랫폼 확대 팔로알토네트웍스가 AI 모델과 데이터, 운영 환경을 통합 보호하는 보안 서비스 ‘Unit 42 Frontier AI Defense’를 공개해 기업의 AI 도입 환경 전반에서 발생하는 보안 위협에 대응한다. AI 확산에...
    Date2026.04.27 Bynewsit Views16
    Read More
  12. SIMTOS 2026, 10만 참관객 기록…제조 비즈니스 성과 확보

    - 계획 기반 방문·해외 바이어 확대 속 실질 비즈니스 전시회 성과 확보 SIMTOS 2026이 35개국 1,315개 기업, 6,059부스 규모로 개최돼 5일간 약 10만 명이 방문했다. 사전등록 기반 방문과 해외 바이어 참여가 늘어나며 구매·도입·협력 중심 상담이 증가해 실...
    Date2026.04.27 Bynewsit Views23
    Read More
  13. DJI, Lito X1·Lito 1 출시…전방위 장애물 감지로 비행 안정성 강화

    - 장애물 감지·추적 기능 결합해 안전한 비행과 촬영 경험 제공 DJI가 입문용 카메라 드론 시리즈 Lito X1과 Lito 1을 출시해 전방위 장애물 감지와 자동 촬영 기능을 결합하고 초보 사용자도 안정적인 항공 촬영을 지원한다 전방위 감지 기반 안전 비행 지원 ...
    Date2026.04.27 Bynewsit Views12
    Read More
  14. 모토로라, 모토 g77 국내 출시…1억 화소 카메라·120Hz AMOLED 적용

    - 카메라·디스플레이·내구성 통합…일상 사용 범위 확대 모토로라코리아가 1억 800만 화소 카메라와 120Hz 디스플레이를 탑재한 스마트폰 ‘모토 g77(moto g77)’을 국내 출시하며 촬영, 콘텐츠 소비, 야외 사용까지 이어지는 일상 활용 범위를 확대했다. 1억 화...
    Date2026.04.27 Bynewsit Views11
    Read More
  15. 안랩, NATO 사이버 방어훈련 ‘락드쉴즈 2026’ 참가…공격 대응 전 과정 수행

    - 탐지·차단·분석·포렌식까지 실전 대응 역량 점검 안랩이 북대서양조약기구(NATO) 산하 사이버방위센터(CCDCOE)가 주관하는 국제 사이버 공격 방어 연합훈련 ‘락드쉴즈(Locked Shields) 2026’에 참가해 침해 대응 전 과정을 수행하며 실전 대응 역량을 점검했...
    Date2026.04.27 Bynewsit Views11
    Read More
  16. EDB, 맨텍솔루션과 쿠버네티스 DB 통합…아코디언에 PG4K·PGD4K 등재

    - 컨테이너 기반 데이터베이스까지 확장…오픈소스 전환 범위 확대 EDB가 맨텍솔루션 아코디언(Accordion) 허브에 쿠버네티스(Kubernetes) 기반 엔터프라이즈 데이터베이스 PG4K와 PGD4K를 등록하고 인프라부터 데이터베이스까지 이어지는 클라우드 네이티브(Cl...
    Date2026.04.27 Bynewsit Views14
    Read More
  17. 솔트웨어, AWS 마이그레이션 세미나 개최…TCO 기반 비용 구조 비교

    - 에이전틱 AI·고객 사례 중심 비용·운영 변화 분석 솔트웨어가 AWS와 함께 마이그레이션 세미나를 개최하며 TCO 분석과 실제 사례를 기반으로 클라우드 전환 시 비용 구조 차이를 분석한다. 4월 29일 서울 강남구 AWS 코리아 오피스에서 진행하는 행사는 AWS ...
    Date2026.04.24 Bynewsit Views34
    Read More
  18. 크리테오, ‘크리테오 커머스 포럼 2026’ 개최…AI 커머스 전략 공개

    - 에이전틱 AI·RMN 결합해 전환율·광고 효율 개선 - 데이터·리테일 미디어 기반 매출 확대 크리테오가 ‘크리테오 커머스 포럼 2026’에서 에이전틱 AI가 마케터의 커머스 여정 전반에서 성과 창출을 지원하는 AI 기반 커머스 전략을 공개했다. 행사에는 약 900...
    Date2026.04.24 Bynewsit Views33
    Read More
  19. [하노버메세 2026] 슈나이더 일렉트릭, 애저 AI 기반 에이전틱 제조 솔루션 공개…엔지니어링 시간 최대 50% 절감

    - 설계·시뮬레이션·검증·배포 연결…엔지니어링 시간 최대 50% 절감 슈나이더 일렉트릭이 ‘하노버 메세 2026’에서 MS 애저 기반 에이전틱 제조 솔루션을 공개했다. 마이크로소프트와 협업해 EAE 기반 단일 워크플로로 설계, 시뮬레이션, 검증, 배포, 운영 등 제...
    Date2026.04.24 Bynewsit Views31
    Read More
  20. 교보라이프플래닛, ‘라플레이’ AWS 전환…디지털 보험 플랫폼 해외 확장

    - 생성형 AI·MSA 구조 기반 인슈어테크 솔루션 수출 본격화 교보라이프플래닛생명이 디지털 보험 마케팅 플랫폼 ‘라플레이(Laplay)’를 아마존웹서비스(AWS) 기반으로 전환하고 설계사 없이 운영되는 디지털 보험 모델을 바탕으로 해외 보험사 대상 솔루션 수출...
    Date2026.04.23 Bynewsit Views37
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 290 Next
/ 290
CLOSE