- 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이

- 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축

- 조기 중단 기법 도입해 추론 시간 획기적으로 단축

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증.jpg

 

엔비디아가 AI 수학 올림피아드(AI Mathematical Olympiad)에 참여해 AI 추론 모델의 뛰어난 일반화 성능을 바탕으로 우승을 차지했다고 밝혔다. AI 수학 올림피아드의 최근 대회 마지막 며칠은 엔비디아 팀에겐 대륙을 넘나드는 릴레이였다.

 

미국 반대편 끝에 있는 두 팀원은 매일 저녁, 데이터 과학과 머신 러닝의 온라인 올림픽인 캐글(Kaggle)에 AI 추론 모델을 제출했다. 이후 복잡한 수학 문제 50개로 구성된 샘플 세트에 모델이 얼마나 잘 대응했는지를 확인하기까지 약 5시간의 긴장감 넘치는 기다림이 이어졌다. 결과를 확인한 미국 팀은 아르메니아, 핀란드, 독일, 북아일랜드에 있는 팀원들에게 바통을 넘겼다. 이 팀원들은 다양한 모델 버전을 테스트하고 수정하며 최적화하는 데 하루를 보냈다.

 

선임 응용 과학자인 이고르 깃먼(Igor Gitman)은 “매일 밤 점수를 보고 실망했다. 그러나 다음날 일어나 유럽 팀원들이 밤사이 보내온 메시지를 보면 다시 희망이 생겼다. 그리고 다시 도전했다”고 밝혔다. 

 

대회 마지막 며칠 동안 엔비디아 팀은 공개 데이터세트 기준으로는 개선이 부족한 상황에 낙담했다. 그러나 AI 모델의 진정한 시험대는 보이지 않는 데이터에 대한 일반화 성능이며, 이는 엔비디아 추론 모델이 순위표의 최상위로 도약할 수 있었던 이유였다. 엔비디아 L4 GPU 4개로 구성된 클러스터를 사용해 제한 시간 5시간 내에 올림피아드 문제 50개 중 34개를 정확히 풀어낸 것이다.

 

북아일랜드 팀원이자 캐글 그랜드마스터(Grandmaster)이며 수석 거대 언어 모델(LLM) 기술자인 다라 핸리(Darragh Hanley)는 “결국 우리가 마법을 부렸다”고 설명했다. 

 

승리의 방정식 만들기

엔비디아 팀은 네모스킬즈(NemoSkills)라는 이름으로 대회에 참가했다. 이는 가속화된 LLM 훈련, 평가, 추론을 위한 파이프라인 모음인 네모-스킬즈를 활용한 데서 따온 이름이다. 7인의 구성원은 LLM 훈련, 모델 증류, 추론 최적화에 걸쳐 각기 다른 전문 분야에 기여했다.

 

캐글 챌린지에는 2,200개 이상의 팀이 참가했으며, 이들은 AI 모델을 제출해 수학 문제 50개를 5시간 내에 풀어야 했다. 이는 대수학, 기하학, 조합론, 정수론에 걸친 국가 올림피아드 수준의 고난도 문제로 구성돼 있었다.

엔비디아 팀의 우승 모델은 자연어 추론과 파이썬(Python) 코드 실행의 조합을 사용한다.jpg​​​​​​​

캐글을 통해 제공되는 소규모 엔비디아 L4 GPU 클러스터에서 이 추론 과제를 완료하기 위해 네모스킬즈 팀은 창의력을 발휘해야 했다.  이들의 우승 모델은 연쇄 추론 기능을 갖춘 파운데이션 모델인 큐원2.5-14B-베이스(Qwen2.5-14B-Base)를 사용했다. 팀은 수학 문제에 대해 합성적으로 생성된 수백만 개의 솔루션을 미세 조정했다.

 

이 합성 솔루션은 주로 딥시크-R1(DeepSeek-R1)과 QwQ-32B라는 두 개의 대형 추론 모델이 생성한 결과로, 이를 지식 증류 방식으로 파운데이션 모델에 학습시켰다. 그 결과 자연어 추론과 파이썬 코드 실행을 결합해 복잡한 문제를 해결할 수 있는 더 작고, 더 빠른, 사고(long-thinking) 모델이 탄생했다.

 

성능을 더욱 향상시키기 위해, 팀은 긴 추론 결과들을 병렬로 처리한 뒤 최종 답을 결정하는 방식을 채택했다. 이 과정을 최적화하고 대회의 제한 시간을 맞추기 위해 혁신적인 조기 중단(early-stopping) 기법도 사용했다.

 

예를 들어, 하나의 수학 문제를 모델이 12번 반복해서 풀이하고 가장 빈번하게 나온 답변을 선택하도록 설정할 수 있다. 이때 네모-스킬즈와 엔비디아 텐서RT(TensorRT)-LLM의 비동기 처리 기능을 사용해 모델이 이미 4회 이상 정답에 수렴한 경우 추론을 조기에 종료할 수 있도록 했다. 또한, 텐서RT-LLM을 통해 FP8 양자화 압축 방법을 활용해 더 일반적으로 사용되는 FP16 포맷보다 1.5배 빠른 속도를 달성할 수 있었다. 여기에 애플(Apple)에서 개발한 추측 디코딩 기술인 리드래프터(ReDrafter)를 사용해 속도를 1.8배 더 향상시켰다.

 

최종 모델은 공개 데이터세트보다 대회에서 공개되지 않은 최종 데이터세트에서 더 나은 성능을 보였다. 이는 팀이 일반화 가능한 모델을 성공적으로 구축하고, 샘플 데이터에 LLM을 과하게 맞추지 않았음을 보여줬다.

 

깃먼은 “캐글 대회가 아니더라도 우리는 수학용 AI 추론 모델을 개선하기 위해 계속 노력했을 것이다. 하지만 캐글은 우리 모델이 다른 데이터세트에 얼마나 잘 일반화되는지 벤치마킹하고 발견할 수 있는 기회가 됐다”고 설명했다. 

 

승리 솔루션 공유

엔비디아 팀은 곧 우승 솔루션에 사용된 기술을 자세히 설명하는 기술 보고서를 발표할 예정이다. 또한 데이터세트와 일련의 모델을 허깅페이스(Hugging Face)에서 공유할 계획이다. 아울러 대회 기간 동안 이들이 이룬 발전과 최적화한 기술은 네모-스킬즈 파이프라인에 통합돼 깃허브(GitHub)에서도 확인할 수 있다.

 

이 파이프라인의 주요 데이터, 기술, 인사이트는 최근 출시된 엔비디아 라마 네모트론 울트라(Llama Nemotron Ultra) 모델을 훈련하는 데도 사용됐다.

 

엔비디아의 캐글 그랜드마스터(Kaggle Grandmasters of NVIDIA, KGMoN) 구성원 크리스토프 헨켈(Christof Henkel)은 “이 협업을 진행하는 동안 우리는 엔비디아 소프트웨어 스택 전반의 툴을 사용했다. LLM 연구 개발 팀과 긴밀히 협력해 대회에서 배운 내용을 일상적으로 활용하고 이러한 최적화를 엔비디아의 오픈소스 라이브러리에 적용할 수 있었다”고 밝혔다. 

 

이번 대회 우승 후, 헨켈은 2,300만 명이 넘는 플랫폼 사용자 중 1위를 차지하며 캐글 월드 챔피언(World Champion) 타이틀을 되찾았다. 또 다른 팀원인 핀란드 출신의 이반 소로킨(Ivan Sorokin)은 전 세계 350여 명만이 보유한 캐글 그랜드마스터 타이틀을 획득했다.

 

엔비디아 팀은 우승 상금으로 262,144달러를 받았으며 이를 엔비디아 재단(NVIDIA Foundation)에 기부해 다양한 자선 단체를 지원할 예정이다. 이번 대회에 참여한 전체 팀원은 이고르 깃만, 다라 핸리, 크리스토프 헨켈, 이반 모슈코프(Ivan Moshkov), 베네틱트 시퍼러(Benedikt Schifferer), 이반 소로킨, 슈밤 토슈니왈(Shubham Toshniwal)이다.

 

#엔비디아#수학올림피아드#라마#네모트론#헨켈#

?

  1. 코보, 美 방산기업 노스롭그루먼 ‘우수 공급업체’ 선정

    - 코보, 글로벌 톱5 방산기업 노스롭그루먼과 긴밀 협력… ‘공급업체 퍼포먼스 우수상’ 수상 - 혁신적이고 비용 효율적인 방위 레이더 및 통신 솔루션으로 기술력과 성과 인정받아 - 차세대 무기, 항공기, 미사일 방어, 항공우주 분야에서 군 전력 우위 확보에 ...
    Date2025.05.13 Bynewsit Views410
    Read More
  2. 사이냅소프트, 이노티움 문서중앙화에 '사이냅 문서뷰어' 공급…“모바일 보안 강화”

    - 이노ECM에 ‘문서뷰어’ 공급! 국내 1위 기술력 입증 - 이노티움, 모바일 문서중앙화 시스템 보안 강화 도큐먼트 AI 기업 사이냅소프트는 데이터 보안 솔루션 기업 이노티움의 문서중앙화 시스템 '이노ECM'에 자사의 ‘사이냅 문서뷰어’를 공급했다고 밝혔다. ...
    Date2025.05.13 Bynewsit Views422
    Read More
  3. 트림블코리아, ‘테클라 유저 데이 2025’ 개최

    - 트림블 테클라 소프트웨어 고객 성공 사례와 최신 기술 공유 - 신제품 ‘테클라 파워팹 2025’ 발표… 철골 생산성 최대 두 배 향상 - AI 도면·모델링 자동화 등 실무 적용 기술 대거 소개 건설 3D BIM 기술의 글로벌 선두주자 트림블 코리아는 5월 15일(목) 서...
    Date2025.05.13 Bynewsit Views542
    Read More
  4. SAP 코리아-서울시, 클라우드 기반 소프트웨어 인력 양성 프로그램 실시

    - 서울시와 서울경제진흥원이 주관하는 청년취업사관학교 ‘새싹(SeSAC)’ 과정 참가자 40명 모집 - 이전 과정 수료율 100%, 취업률 94%, 만족도 97% 달성 - 서울시 소프트웨어 분야 인재 양성을 위한 교육과정 무료 제공 SAP 코리아는 ‘SAP 클라우드 애플리케이...
    Date2025.05.12 Bynewsit Views516
    Read More
  5. ST, 자동차용 인버터 드라이버 「STGAP4S」 출시…“고성능 전기차 파워 트레인 설계 지원”

    - 고집적화, 갈바닉 절연, 진단 기능 갖춘 STGAP4S ST마이크로일렉트로닉스가 SiC MOSFET 및 IGBT를 지원하는 갈바닉 절연 자동차 게이트 드라이버인 STGAP4S를 출시했다고 밝혔다. STGAP4S는 다양한 정격 전력의 인버터를 제어하는 유연성을 제공하며, 풍부한...
    Date2025.05.12 Bynewsit Views436
    Read More
  6. 마우저, <9인의 전문가가 제시하는 산업 애플리케이션에서 로보틱스, AI, 머신러닝의 역할> 전자책 발간

    - 로보틱스와 AI, 머신러닝 조명 마우저 일렉트로닉스는 아나로그디바이스(ADI) 및 삼텍(Samtec)과 협력해 로보틱스, 인공지능(AI) 및 머신러닝(ML) 기술이 제조 및 물류 등의 산업 환경을 어떻게 변화시키고 있는지를 조명한 새로운 전자책을 발간했다고 밝혔...
    Date2025.05.12 Bynewsit Views287
    Read More
  7. 스틸시리즈, 아레테 아카데미와 스폰서십 체결…“에이펙스 프로 Gen 3 게이밍 키보드 등 다양한 게이밍 기어 지원”

    - 발로란트 코칭에 특화된 e스포츠 육성 기관 아레테 아카데미 스폰서십 게이밍 기어 브랜드 스틸시리즈(SteelSeries)는 e스포츠 아카데미 아레테 컨설팅(areteconsulting.kr)과 공식 후원 스폰서십을 체결했다고 밝혔다. 아레테 아카데미는 발로란트 프로게이...
    Date2025.05.12 Bynewsit Views175
    Read More
  8. 와탭랩스, ‘AWS 서밋 서울 2025’ 참가···“클라우드 혁신을 위한 주요 옵저버빌리티 솔루션 공개”

    - 데브옵스 및 옵저버빌리티 최신 트렌드 및 도입 성공 사례 발표 - 네트워크 성능 모니터링(NPM), 리얼 유저 모니터링(RUM) 등 와탭 주요 솔루션 데모 시연 진행 국내 옵저버빌리티 전문 기업 와탭랩스가 아마존웹서비스(AWS)가 주최하는 ‘AWS 서밋 서울 2025...
    Date2025.05.12 Bynewsit Views431
    Read More
  9. 안랩, NATO 주관 국제 사이버 공격 방어 연합훈련 ‘락드 쉴즈(Locked Shields) 2025’ 참가

    - 안랩의 위협 대응∙분석 전문 인력, 대한민국∙캐나다 국가연합팀 소속 블루팀(방어팀)으로 참가, ‘기술 훈련’ 분야 악성코드 확산 차단, 공격 배후 분석, 침해 원인 규명 및 증거 확보 등 수행 - ‘안랩 EDR’, ‘안랩 V3’, ‘안랩 EPP’ 등 엔드포인트 솔루션 제...
    Date2025.05.12 Bynewsit Views173
    Read More
  10. Tapo, 국내 최대 반려동물 박람회 ‘2025메가주 일산’ 첫 참가

    글로벌 스마트홈 브랜드 ‘타포(Tapo)’가 오는 5월 16일(금)부터 18일(일)까지 일산 킨텍스 제2전시장에서 열리는 국내 최대 규모의 반려동물 박람회 ‘2025메가주 일산’에 첫 참가한다고 밝혔다. ‘메가주(Megazoo)’는 반려동물 산업의 최신 트렌드를 한눈에 볼 ...
    Date2025.05.12 Bynewsit Views197
    Read More
  11. 탈레스, ‘2025년 임퍼바 악성 봇 보고서’ 발표…“AI 발전으로 탐지 어려운 봇 증가”

    - 전 세계 인터넷 트래픽의 절반 이상 차지 - 접근 가능한 AI 도구의 증가로 사이버 공격자의 진입 장벽이 크게 낮아져 사이버 공격자들이 대규모로 악성 봇을 생성하고 배포 - 10년 만에 처음으로 자동화된 트래픽이 인간 활동을 능가하여 전체 웹 트래픽의 5...
    Date2025.05.09 Bynewsit Views189
    Read More
  12. Asus, ‘게이밍 위크 - 둠: 다크 에이지스’ 번들 이벤트

    에이수스 코리아는 게이밍 위크(Gaming Week)를 맞아, 자사의 ROG 및 TUF 게이밍 제품 구매 고객 대상으로 FPS 장르를 연 둠 시리즈의 최신 차기작 ‘둠: 다크 에이지스(DOOM: The Dark Ages)’ 게임을 증정하는 번들 이벤트를 6월 30일까지 진행한다고 밝혔다. ...
    Date2025.05.09 Bynewsit Views194
    Read More
  13. 더존비즈온, “1분기 매출 986억원·영업이익 216억원” 달성

    - 연결기준 전년 대비 매출 4.4%, 영업이익 19.2% 증가 더존비즈온은 1분기 실적 공시를 통해 연결기준 매출 986억원, 영업이익 216억원을 달성했다고 9일 발표했다. 지난해 같은 기간과 비교해 매출액은 4.4%, 영업이익은 19.2% 증가한 실적이다. 영업이익률...
    Date2025.05.09 Bynewsit Views485
    Read More
  14. 안랩, 컨테이너형 보안 라인업 출시… 클라우드 워크로드 보안 플랫폼 강화

    - 쿠버네티스 환경에 최적화된 배포 및 검사 방식과 서버리스 환경에 대한 보안 커버리지 확대 - 하나의 관리 서버에서 다양한 인프라 환경을 일관된 방식으로 보호·운영할 수 있는 통합 보호 체계 제공 최근 클라우드 네이티브 환경의 확산으로 보안 운영의 ...
    Date2025.05.09 Bynewsit Views200
    Read More
  15. NXP, 새로운 「S32R47」 이미징 레이더 프로세서 공개

    - 3세대 최고 성능 레이더 프로세서 S32R47 제품군으로 까다로운 자율주행 문제 해결 - 더 높은 해상도 감지로 도로 위 교통약자(VRU)·분실 화물 감지 등 고급 사용 사례 지원 - 더 많은 컴퓨팅 성능으로 OEM의 오토파일럿 내비게이션 등 고급 애플리케이션 개...
    Date2025.05.09 Bynewsit Views461
    Read More
  16. 쿤텍-dSPACE 코리아, SIL 기반 소프트웨어 검증 환경 구축 및 시장 발굴 MOU 체결

    - 소프트웨어 안정성 및 신뢰성 향상을 위한 기술 협력 - SIL 기반 가상 검증 플랫폼 공동 개발, 국내외 시장 발굴 목표 임베디드 가상화 전문기업 쿤텍은 오늘 글로벌 시뮬레이션 전문기업 dSPACE 코리아와 소프트웨어 검증 환경 구축 및 신규 시장 발굴을 위...
    Date2025.05.09 Bynewsit Views502
    Read More
  17. 마우저, 2025년 1분기에 8,000종 이상의 신제품 추가

    마우저 일렉트로닉스는 최신 제품과 신기술을 신속하게 제공하여 고객이 제품 출시 기간을 단축하고, 경쟁 우위를 유지할 수 있도록 지원하고 있다. 현재 1,200개 이상의 반도체 및 전자부품 제조사 브랜드가 마우저를 통해 자사 제품을 글로벌 시장에 공급한...
    Date2025.05.08 Bynewsit Views377
    Read More
  18. 슈나이더 일렉트릭, AI 데이터센터용 전력 관리 솔루션으로 스마트 에너지 관리 실현

    - AI 데이터센터의 안정적인 전력 공급과 효율적인 에너지 관리 가능한 스마트 전력 솔루션 보유 - 엔비디아 및 SKT와 MOU 체결 통해 AI 데이터센터 생태계의 안정성과 지속 가능성 확대 슈나이더 일렉트릭이 AI 기반 데이터센터 수요 증가에 대응하여 고도화...
    Date2025.05.08 Bynewsit Views589
    Read More
  19. 라바웨이브-법무법인 이유, ‘몸캠피싱 대처법·주의사항’ 유튜브 공개

    디지털 범죄 대응 전문기업 라바웨이브는 법무법인 이유와 협력하여 몸캠피싱 범죄에 대한 기술적·법률적 대응법을 담은 영상을 공식 유튜브 채널에 공개했다고 8일 밝혔다. 기존 콘텐츠가 홍보 목적이나 단편적 정보 제공에 그친 것과 달리, 이번 영상은 피해...
    Date2025.05.08 Bynewsit Views193
    Read More
  20. 큐브리드, 오픈소스 DBMS CUBRID 11.4 버전 출시

    큐브리드가 자사의 오픈소스 DBMS ‘큐브리드(CUBRID)’의 대용량 처리 지원을 강화하고, 성능을 개선하는 한편 오라클 호환성을 향상시킨 CUBRID 11.4 버전을 출시했다고 밝혔다. 새롭게 출시된 CUBRID 11.4 버전에는 오라클 호환성 지원을 위한 PL/CSQL이 추가...
    Date2025.05.08 Bynewsit Views582
    Read More
Board Pagination Prev 1 ... 64 65 66 67 68 69 70 71 72 73 ... 276 Next
/ 276
CLOSE