- 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이

- 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축

- 조기 중단 기법 도입해 추론 시간 획기적으로 단축

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증.jpg

 

엔비디아가 AI 수학 올림피아드(AI Mathematical Olympiad)에 참여해 AI 추론 모델의 뛰어난 일반화 성능을 바탕으로 우승을 차지했다고 밝혔다. AI 수학 올림피아드의 최근 대회 마지막 며칠은 엔비디아 팀에겐 대륙을 넘나드는 릴레이였다.

 

미국 반대편 끝에 있는 두 팀원은 매일 저녁, 데이터 과학과 머신 러닝의 온라인 올림픽인 캐글(Kaggle)에 AI 추론 모델을 제출했다. 이후 복잡한 수학 문제 50개로 구성된 샘플 세트에 모델이 얼마나 잘 대응했는지를 확인하기까지 약 5시간의 긴장감 넘치는 기다림이 이어졌다. 결과를 확인한 미국 팀은 아르메니아, 핀란드, 독일, 북아일랜드에 있는 팀원들에게 바통을 넘겼다. 이 팀원들은 다양한 모델 버전을 테스트하고 수정하며 최적화하는 데 하루를 보냈다.

 

선임 응용 과학자인 이고르 깃먼(Igor Gitman)은 “매일 밤 점수를 보고 실망했다. 그러나 다음날 일어나 유럽 팀원들이 밤사이 보내온 메시지를 보면 다시 희망이 생겼다. 그리고 다시 도전했다”고 밝혔다. 

 

대회 마지막 며칠 동안 엔비디아 팀은 공개 데이터세트 기준으로는 개선이 부족한 상황에 낙담했다. 그러나 AI 모델의 진정한 시험대는 보이지 않는 데이터에 대한 일반화 성능이며, 이는 엔비디아 추론 모델이 순위표의 최상위로 도약할 수 있었던 이유였다. 엔비디아 L4 GPU 4개로 구성된 클러스터를 사용해 제한 시간 5시간 내에 올림피아드 문제 50개 중 34개를 정확히 풀어낸 것이다.

 

북아일랜드 팀원이자 캐글 그랜드마스터(Grandmaster)이며 수석 거대 언어 모델(LLM) 기술자인 다라 핸리(Darragh Hanley)는 “결국 우리가 마법을 부렸다”고 설명했다. 

 

승리의 방정식 만들기

엔비디아 팀은 네모스킬즈(NemoSkills)라는 이름으로 대회에 참가했다. 이는 가속화된 LLM 훈련, 평가, 추론을 위한 파이프라인 모음인 네모-스킬즈를 활용한 데서 따온 이름이다. 7인의 구성원은 LLM 훈련, 모델 증류, 추론 최적화에 걸쳐 각기 다른 전문 분야에 기여했다.

 

캐글 챌린지에는 2,200개 이상의 팀이 참가했으며, 이들은 AI 모델을 제출해 수학 문제 50개를 5시간 내에 풀어야 했다. 이는 대수학, 기하학, 조합론, 정수론에 걸친 국가 올림피아드 수준의 고난도 문제로 구성돼 있었다.

엔비디아 팀의 우승 모델은 자연어 추론과 파이썬(Python) 코드 실행의 조합을 사용한다.jpg​​​​​​​

캐글을 통해 제공되는 소규모 엔비디아 L4 GPU 클러스터에서 이 추론 과제를 완료하기 위해 네모스킬즈 팀은 창의력을 발휘해야 했다.  이들의 우승 모델은 연쇄 추론 기능을 갖춘 파운데이션 모델인 큐원2.5-14B-베이스(Qwen2.5-14B-Base)를 사용했다. 팀은 수학 문제에 대해 합성적으로 생성된 수백만 개의 솔루션을 미세 조정했다.

 

이 합성 솔루션은 주로 딥시크-R1(DeepSeek-R1)과 QwQ-32B라는 두 개의 대형 추론 모델이 생성한 결과로, 이를 지식 증류 방식으로 파운데이션 모델에 학습시켰다. 그 결과 자연어 추론과 파이썬 코드 실행을 결합해 복잡한 문제를 해결할 수 있는 더 작고, 더 빠른, 사고(long-thinking) 모델이 탄생했다.

 

성능을 더욱 향상시키기 위해, 팀은 긴 추론 결과들을 병렬로 처리한 뒤 최종 답을 결정하는 방식을 채택했다. 이 과정을 최적화하고 대회의 제한 시간을 맞추기 위해 혁신적인 조기 중단(early-stopping) 기법도 사용했다.

 

예를 들어, 하나의 수학 문제를 모델이 12번 반복해서 풀이하고 가장 빈번하게 나온 답변을 선택하도록 설정할 수 있다. 이때 네모-스킬즈와 엔비디아 텐서RT(TensorRT)-LLM의 비동기 처리 기능을 사용해 모델이 이미 4회 이상 정답에 수렴한 경우 추론을 조기에 종료할 수 있도록 했다. 또한, 텐서RT-LLM을 통해 FP8 양자화 압축 방법을 활용해 더 일반적으로 사용되는 FP16 포맷보다 1.5배 빠른 속도를 달성할 수 있었다. 여기에 애플(Apple)에서 개발한 추측 디코딩 기술인 리드래프터(ReDrafter)를 사용해 속도를 1.8배 더 향상시켰다.

 

최종 모델은 공개 데이터세트보다 대회에서 공개되지 않은 최종 데이터세트에서 더 나은 성능을 보였다. 이는 팀이 일반화 가능한 모델을 성공적으로 구축하고, 샘플 데이터에 LLM을 과하게 맞추지 않았음을 보여줬다.

 

깃먼은 “캐글 대회가 아니더라도 우리는 수학용 AI 추론 모델을 개선하기 위해 계속 노력했을 것이다. 하지만 캐글은 우리 모델이 다른 데이터세트에 얼마나 잘 일반화되는지 벤치마킹하고 발견할 수 있는 기회가 됐다”고 설명했다. 

 

승리 솔루션 공유

엔비디아 팀은 곧 우승 솔루션에 사용된 기술을 자세히 설명하는 기술 보고서를 발표할 예정이다. 또한 데이터세트와 일련의 모델을 허깅페이스(Hugging Face)에서 공유할 계획이다. 아울러 대회 기간 동안 이들이 이룬 발전과 최적화한 기술은 네모-스킬즈 파이프라인에 통합돼 깃허브(GitHub)에서도 확인할 수 있다.

 

이 파이프라인의 주요 데이터, 기술, 인사이트는 최근 출시된 엔비디아 라마 네모트론 울트라(Llama Nemotron Ultra) 모델을 훈련하는 데도 사용됐다.

 

엔비디아의 캐글 그랜드마스터(Kaggle Grandmasters of NVIDIA, KGMoN) 구성원 크리스토프 헨켈(Christof Henkel)은 “이 협업을 진행하는 동안 우리는 엔비디아 소프트웨어 스택 전반의 툴을 사용했다. LLM 연구 개발 팀과 긴밀히 협력해 대회에서 배운 내용을 일상적으로 활용하고 이러한 최적화를 엔비디아의 오픈소스 라이브러리에 적용할 수 있었다”고 밝혔다. 

 

이번 대회 우승 후, 헨켈은 2,300만 명이 넘는 플랫폼 사용자 중 1위를 차지하며 캐글 월드 챔피언(World Champion) 타이틀을 되찾았다. 또 다른 팀원인 핀란드 출신의 이반 소로킨(Ivan Sorokin)은 전 세계 350여 명만이 보유한 캐글 그랜드마스터 타이틀을 획득했다.

 

엔비디아 팀은 우승 상금으로 262,144달러를 받았으며 이를 엔비디아 재단(NVIDIA Foundation)에 기부해 다양한 자선 단체를 지원할 예정이다. 이번 대회에 참여한 전체 팀원은 이고르 깃만, 다라 핸리, 크리스토프 헨켈, 이반 모슈코프(Ivan Moshkov), 베네틱트 시퍼러(Benedikt Schifferer), 이반 소로킨, 슈밤 토슈니왈(Shubham Toshniwal)이다.

 

#엔비디아#수학올림피아드#라마#네모트론#헨켈#

?

  1. 마우저, 마이크로칩 테크놀로지 「PIC16F13145」 마이크로컨트롤러 공급…“설정 가능한 로직 블록 탑재” 

    마우저 일렉트로닉스(Mouser Electronics)는 마이크로칩 테크놀로지(Microchip Technology)의 PIC16F13145 마이크로컨트롤러(MCU) 제품군을 공급한다고 밝혔다. PIC16F13145 마이크로컨트롤러 제품군은 설정 가능한 로직 블록(CLB) 주변장치를 통해 사용자가 ...
    Date2025.04.15 Bynewsit Views366
    Read More
  2. 사이냅소프트 '구글 워크스페이스용 사이냅 문서뷰어' 전 세계 100만 사용자 돌파

    - 문서 열람의 혁신, 한글 표준 문서 포맷까지 브라우저에서 바로 확인 가능 사이냅소프트는 자사의 '구글 워크스페이스용 사이냅 문서뷰어(Synap Document Viewer for Google Workspace)'가 출시 이후 빠른 성장세를 보이며 글로벌 누적 사용자 100만 명을 돌...
    Date2025.04.15 Bynewsit Views393
    Read More
  3. 피아이이, 토모큐브와 MOU 체결…홀로토모그래피 기반 검사 사업 본격 확대

    - 양사 핵심 기술 융합으로 고객 맞춤형 기술 개발, 프로젝트 공동 수행 등 다각적 협력 추진 - AI 기반 3D 이미징 기술 ‘홀로토모그래피’ …반도체, 디스플레이 등 산업 정밀 검사 분야로 확대 AI 전문기업 피아이는 3차원 비표지(label-free) 세포 이미징 전...
    Date2025.04.15 Bynewsit Views435
    Read More
  4. 온세미, 한국 신임 대표 겸 부천 팹 운영담당 부사장으로 이태종 대표이사 선임

    - 반도체 팹, 글로벌 IDM, 파운드리 등 다양한 현업에서 30년 이상의 풍부한 경험 보유 - 이태종 신임 대표, 키파운드리와 삼성반도체 거친 한국 반도체 ‘베테랑’ 온세미는 경기도 부천에 위치한 온세미코리아의 신임 대표이사로 이태종 전 키파운드리 대표이...
    Date2025.04.15 Bynewsit Views249
    Read More
  5. 로지텍, ‘유나이트 서울 2025’ 공식 스폰서 참여…MX 마스터 시리즈로 AI 활용 스마트한 개발 환경 제시

    - AI 활용한 스마트 액션 기능으로 개발 효율 극대화 및 브랜드 체험 기회 확대 - 게임 개발 유튜버 ‘오늘코딩’과 로지텍 스마트 액션을 활용해 게임 개발 효율을 높일 수 있는 개발 과정 실시간 시연 진행 - 최고급 기계식 키보드 ‘MX Mechanical’과 고성능 ...
    Date2025.04.15 Bynewsit Views99
    Read More
  6. 안랩, 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI PLUS)’ 런칭

    -‘안랩 AI 플러스(AhnLab AI PLUS)’: 안랩이 30년간 축적한 위협 분석 데이터, 악성코드 및 침해 사고 대응 경험 등 방대한 보안 정보를 기반으로 개발한 자체 AI 플랫폼 안랩이 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI Plus)’를 런칭했다고 밝혔다. ‘...
    Date2025.04.15 Bynewsit Views111
    Read More
  7. 캐논코리아, 캐논갤러리에서 스위스의 대자연 담은 ‘Wonder of Valais’ 전시 개최

    - 5월 6일(화)까지 캐논갤러리에서 EOS R 시스템으로 담아낸 11가지 색, ‘Wonder of Valais’ 전시회 개최 - EOS R 시스템의 뛰어난 화질과 정교한 표현력으로 담아낸 스위스 알프스 대자연의 광활함 - EOS R 시스템, 캐논의 독자적인 광학 기술을 기반으로 폭...
    Date2025.04.15 Bynewsit Views109
    Read More
  8. 마에스트로 포렌식, macOS 포렌식 솔루션 ‘마에스트로 위즈덤(MAESTRO WISDOM)’ 출시

    - 원격 환경에서도 macOS 기기의 디스크 이미징, 라이브 증거 데이터 수집, 디지털포렌식 조사와 악성코드 탐지 및 분석, 침해사고 대응과 분석 기능 수행 마에스트로 포렌식은 오늘, macOS 시스템 라이브 증거 데이터 추출, 원격 이미징, 침해사고 조사, 악성...
    Date2025.04.15 Bynewsit Views120
    Read More
  9. 히타치 스토리지, 국내 하이엔드 스토리지 시장 11년 연속 1위

    - 매출액 기준 2024년 국내 하이엔드 스토리지 시장 점유율 41.2%로 독보적 입지 - ‘VSP One’ 전략 통해 AI·하이브리드 클라우드 시대 선도하는 미래형 스토리지 아키텍처 제시 HS효성인포메이션시스템은 IDC의 분기별 외장형 스토리지 시스템 시장조사 자료(I...
    Date2025.04.16 Bynewsit Views112
    Read More
  10. 듀폰, 분사 예정 전자사업 신설법인 CEO로 존 켐프 선임

    - 전자사업 부문 분사, 오는 11월 1일 완료 목표 듀폰은 최근 전자&산업 부문 사장인 존 켐프(Jon Kemp)를 전자사업 분사 이후 설립될 독립 상장회사의 최고경영자(CEO) 및 이사회 구성원으로 내정했다고 발표했다. 신설 전자회사는 반도체 및 전자 산업을 위...
    Date2025.04.16 Bynewsit Views434
    Read More
  11. 슈나이더 일렉트릭, 전력 인프라의 효율성과 안정성 높이는 DC 전력 솔루션 공개

    - 2025 국제 전기전력 전시회서 직류 배전 인프라 구축에 최적화된 DC 전력기기 제품군 선보여 - 배터리 에너지 저장 시스템(BESS) 수요에 최적화된 고신뢰성 직류 전력 솔루션 보유 슈나이더 일렉트릭이 오는 5월 14일(수) 개최되는 ‘국제 전기전력 전시회(EP...
    Date2025.04.16 Bynewsit Views368
    Read More
  12. 다쏘시스템코리아-울산대 SW중심대학사업단, 이끌 소프트웨어 인재 양성 MOU 체결…“산학협력 통해 주요산업 및 지역인재 육성”

    - 다쏘시스템코리아 – 울산대학교, 산학협력 통해 울산지역 주력산업 소프트웨어 및 AX 혁신 제고, 실무형 소프트웨어 인재 양성 - 다쏘시스템 3D익스피리언스 플랫폼 기반 실습 중심 교육, 산학 프로젝트, 인턴십 등 다양한 협력 프로그램 공동 추진 - 다쏘시...
    Date2025.04.16 Bynewsit Views358
    Read More
  13. KG ICT, 카스퍼스키와 총판 계약 체결

    - Kaspersky Threat Intelligence·OT 보안 시장 본격 진출 정보통신기술 전문기업 KG ICT가 글로벌 사이버 보안 기업 카스퍼스키와 손잡고 국내 기업용 보안 시장 확대에 나선다. KG ICT는 최근 카스퍼스키와 국내 총판 계약을 체결하고, 산업 전반에 걸친 차...
    Date2025.04.17 Bynewsit Views133
    Read More
  14. 마우저-ADI-암페놀, '전기 모빌리티 및 항공의 미래 조명' 전자책 발간

    마우저 일렉트로닉스(Mouser Electronics)는 아나로그디바이스(ADI) 및 암페놀(Amphenol)과 협력하여 항공 분야의 발전을 지원하는 첨단 연결 기술 및 반도체 디바이스의 핵심 역할을 조명한 새로운 전자책을 발간했다고 밝혔다. 항공 산업은 전례 없는 혁신을...
    Date2025.04.17 Bynewsit Views455
    Read More
  15. 이튼, ‘데이터센터 테크데이 2025’ 개최 … AI 시대의 지속가능한 데이터센터 전력 혁신 전략 제시

    - AI 수요에 대응하는 ‘고신뢰·고효율’ 전력 솔루션, 국내 시장에서 입지 확대 - 차세대 AI 데이터센터를 위한 통합 전력 관리 솔루션 전시 … 모듈러 설계·리퀴드 쿨링 등 국내 첫 공개 이튼(Eaton)은 오늘 서울에서 ‘데이터센터 테크데이 2025(Eaton Datacent...
    Date2025.04.17 Bynewsit Views447
    Read More
  16. ST, 디지털 키 애플리케이션용 차세대 자동차용 NFC 리더기 출시…“고성능 ST25R 포트폴리오 확장”

    - CCC 디지털 자동차 키 및 차량 내 무선 충전을 지원 - 소형 사이즈의 새로운 ST25R500/501 디바이스로 최대 70% 향상된 저전력 카드 감지 범위 ST마이크로일렉트로닉스가 새로운 자동차용 NFC 리더기 2가지 제품을 출시해 ST25R 포트폴리오를 확장하고, 탁월...
    Date2025.04.17 Bynewsit Views247
    Read More
  17. 케이엘정보통신-SAS코리아, 공공 부문 대상 데이터 및 AI 솔루션 공급 위해 파트너십 체결

    - 데이터 및 AI 기술 중심의 공공 부문 혁신 및 생산성 향상 위한 포괄적 협력 - 케이엘정보통신의 풍부한 고객층을 기반으로 SAS의 검증된 공공 특화 글로벌 솔루션 제공 공공 전문 정보기술 서비스를 제공하는 케이엘정보통신은 세계적인 데이터 및 AI 선두 ...
    Date2025.04.17 Bynewsit Views401
    Read More
  18. 태블로, 차세대 데이터 분석 플랫폼 ‘태블로 넥스트’ 공개…"AI 에이전트가 실무까지 주도하는 데이터 분석 자동화 시대"

    - ‘태블로 컨퍼런스 2025’서 차세대 데이터 분석 플랫폼 ‘태블로 넥스트’ 공개 - 비즈니스 리더 76%, “데이터 기반 업무 수행 부담 커졌다”… 90%는 즉시 데이터 접근 환경 기대 - 태블로 넥스트, 복잡한 분석 과정 자동화해 데이터 해석 및 활용 진입 장벽 해...
    Date2025.04.17 Bynewsit Views441
    Read More
  19. 엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증

    - 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이 - 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축 - 조기 중단 기법 도입해 추론 시간 획기적으로 단축 엔비디아가 AI 수학 올림피아드(AI Mathematic...
    Date2025.04.17 Bynewsit Views296
    Read More
  20. 매스웍스-포어텔릭스, 혁신적 툴체인 파트너십 체결…“마쯔다 차세대 자율주행 개발 가속화”

    - 가상 시뮬레이션 기술 통합으로 안전성 향상 및 개발 시간 단축 실현 매스웍스가 데이터 기반 자율주행 개발 툴체인 기업 포어텔릭스(Foretellix)와 전략적 기술 통합을 통해 자동차 기업 마쯔다(Mazda)의 차세대 자율주행 및 운전자 보조 시스템(AD/ADAS) ...
    Date2025.04.17 Bynewsit Views342
    Read More
Board Pagination Prev 1 ... 198 199 200 201 202 203 204 205 206 207 ... 249 Next
/ 249
CLOSE