소프트웨어·컴퓨팅

2025.04.17 15:23

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증

newsit

https://hwlab.com/SW_Computing/14096 조회 수 264 추천 수 0 댓글 0

Extra Form
참조#1	https://www.kaggle.com/competitions/ai-m...eaderboard
참조#2	https://www.nvidia.com/ko-kr/data-center/l4/
참조#3	https://nvidia.github.io/NeMo-Skills/

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이

- 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축

- 조기 중단 기법 도입해 추론 시간 획기적으로 단축

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증.jpg

엔비디아가 AI 수학 올림피아드(AI Mathematical Olympiad)에 참여해 AI 추론 모델의 뛰어난 일반화 성능을 바탕으로 우승을 차지했다고 밝혔다. AI 수학 올림피아드의 최근 대회 마지막 며칠은 엔비디아 팀에겐 대륙을 넘나드는 릴레이였다.

미국 반대편 끝에 있는 두 팀원은 매일 저녁, 데이터 과학과 머신 러닝의 온라인 올림픽인 캐글(Kaggle)에 AI 추론 모델을 제출했다. 이후 복잡한 수학 문제 50개로 구성된 샘플 세트에 모델이 얼마나 잘 대응했는지를 확인하기까지 약 5시간의 긴장감 넘치는 기다림이 이어졌다. 결과를 확인한 미국 팀은 아르메니아, 핀란드, 독일, 북아일랜드에 있는 팀원들에게 바통을 넘겼다. 이 팀원들은 다양한 모델 버전을 테스트하고 수정하며 최적화하는 데 하루를 보냈다.

선임 응용 과학자인 이고르 깃먼(Igor Gitman)은 “매일 밤 점수를 보고 실망했다. 그러나 다음날 일어나 유럽 팀원들이 밤사이 보내온 메시지를 보면 다시 희망이 생겼다. 그리고 다시 도전했다”고 밝혔다.

대회 마지막 며칠 동안 엔비디아 팀은 공개 데이터세트 기준으로는 개선이 부족한 상황에 낙담했다. 그러나 AI 모델의 진정한 시험대는 보이지 않는 데이터에 대한 일반화 성능이며, 이는 엔비디아 추론 모델이 순위표의 최상위로 도약할 수 있었던 이유였다. 엔비디아 L4 GPU 4개로 구성된 클러스터를 사용해 제한 시간 5시간 내에 올림피아드 문제 50개 중 34개를 정확히 풀어낸 것이다.

북아일랜드 팀원이자 캐글 그랜드마스터(Grandmaster)이며 수석 거대 언어 모델(LLM) 기술자인 다라 핸리(Darragh Hanley)는 “결국 우리가 마법을 부렸다”고 설명했다.

승리의 방정식 만들기

엔비디아 팀은 네모스킬즈(NemoSkills)라는 이름으로 대회에 참가했다. 이는 가속화된 LLM 훈련, 평가, 추론을 위한 파이프라인 모음인 네모-스킬즈를 활용한 데서 따온 이름이다. 7인의 구성원은 LLM 훈련, 모델 증류, 추론 최적화에 걸쳐 각기 다른 전문 분야에 기여했다.

캐글 챌린지에는 2,200개 이상의 팀이 참가했으며, 이들은 AI 모델을 제출해 수학 문제 50개를 5시간 내에 풀어야 했다. 이는 대수학, 기하학, 조합론, 정수론에 걸친 국가 올림피아드 수준의 고난도 문제로 구성돼 있었다.

엔비디아 팀의 우승 모델은 자연어 추론과 파이썬(Python) 코드 실행의 조합을 사용한다.jpg

캐글을 통해 제공되는 소규모 엔비디아 L4 GPU 클러스터에서 이 추론 과제를 완료하기 위해 네모스킬즈 팀은 창의력을 발휘해야 했다. 이들의 우승 모델은 연쇄 추론 기능을 갖춘 파운데이션 모델인 큐원2.5-14B-베이스(Qwen2.5-14B-Base)를 사용했다. 팀은 수학 문제에 대해 합성적으로 생성된 수백만 개의 솔루션을 미세 조정했다.

이 합성 솔루션은 주로 딥시크-R1(DeepSeek-R1)과 QwQ-32B라는 두 개의 대형 추론 모델이 생성한 결과로, 이를 지식 증류 방식으로 파운데이션 모델에 학습시켰다. 그 결과 자연어 추론과 파이썬 코드 실행을 결합해 복잡한 문제를 해결할 수 있는 더 작고, 더 빠른, 긴 사고(long-thinking) 모델이 탄생했다.

성능을 더욱 향상시키기 위해, 팀은 긴 추론 결과들을 병렬로 처리한 뒤 최종 답을 결정하는 방식을 채택했다. 이 과정을 최적화하고 대회의 제한 시간을 맞추기 위해 혁신적인 조기 중단(early-stopping) 기법도 사용했다.

예를 들어, 하나의 수학 문제를 모델이 12번 반복해서 풀이하고 가장 빈번하게 나온 답변을 선택하도록 설정할 수 있다. 이때 네모-스킬즈와 엔비디아 텐서RT(TensorRT)-LLM의 비동기 처리 기능을 사용해 모델이 이미 4회 이상 정답에 수렴한 경우 추론을 조기에 종료할 수 있도록 했다. 또한, 텐서RT-LLM을 통해 FP8 양자화 압축 방법을 활용해 더 일반적으로 사용되는 FP16 포맷보다 1.5배 빠른 속도를 달성할 수 있었다. 여기에 애플(Apple)에서 개발한 추측 디코딩 기술인 리드래프터(ReDrafter)를 사용해 속도를 1.8배 더 향상시켰다.

최종 모델은 공개 데이터세트보다 대회에서 공개되지 않은 최종 데이터세트에서 더 나은 성능을 보였다. 이는 팀이 일반화 가능한 모델을 성공적으로 구축하고, 샘플 데이터에 LLM을 과하게 맞추지 않았음을 보여줬다.

깃먼은 “캐글 대회가 아니더라도 우리는 수학용 AI 추론 모델을 개선하기 위해 계속 노력했을 것이다. 하지만 캐글은 우리 모델이 다른 데이터세트에 얼마나 잘 일반화되는지 벤치마킹하고 발견할 수 있는 기회가 됐다”고 설명했다.

승리 솔루션 공유

엔비디아 팀은 곧 우승 솔루션에 사용된 기술을 자세히 설명하는 기술 보고서를 발표할 예정이다. 또한 데이터세트와 일련의 모델을 허깅페이스(Hugging Face)에서 공유할 계획이다. 아울러 대회 기간 동안 이들이 이룬 발전과 최적화한 기술은 네모-스킬즈 파이프라인에 통합돼 깃허브(GitHub)에서도 확인할 수 있다.

이 파이프라인의 주요 데이터, 기술, 인사이트는 최근 출시된 엔비디아 라마 네모트론 울트라(Llama Nemotron Ultra) 모델을 훈련하는 데도 사용됐다.

엔비디아의 캐글 그랜드마스터(Kaggle Grandmasters of NVIDIA, KGMoN) 구성원 크리스토프 헨켈(Christof Henkel)은 “이 협업을 진행하는 동안 우리는 엔비디아 소프트웨어 스택 전반의 툴을 사용했다. LLM 연구 개발 팀과 긴밀히 협력해 대회에서 배운 내용을 일상적으로 활용하고 이러한 최적화를 엔비디아의 오픈소스 라이브러리에 적용할 수 있었다”고 밝혔다.

이번 대회 우승 후, 헨켈은 2,300만 명이 넘는 플랫폼 사용자 중 1위를 차지하며 캐글 월드 챔피언(World Champion) 타이틀을 되찾았다. 또 다른 팀원인 핀란드 출신의 이반 소로킨(Ivan Sorokin)은 전 세계 350여 명만이 보유한 캐글 그랜드마스터 타이틀을 획득했다.

엔비디아 팀은 우승 상금으로 262,144달러를 받았으며 이를 엔비디아 재단(NVIDIA Foundation)에 기부해 다양한 자선 단체를 지원할 예정이다. 이번 대회에 참여한 전체 팀원은 이고르 깃만, 다라 핸리, 크리스토프 헨켈, 이반 모슈코프(Ivan Moshkov), 베네틱트 시퍼러(Benedikt Schifferer), 이반 소로킨, 슈밤 토슈니왈(Shubham Toshniwal)이다.

#엔비디아#수학올림피아드#라마#네모트론#헨켈#

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '2'	엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증.jpg, 엔비디아 팀의 우승 모델은 자연어 추론과 파이썬(Python) 코드 실행의 조합을 사용한다.jpg,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

소프트웨어·컴퓨팅

하이퍼코퍼레이션, 틱톡 모바일 쿠폰 공급사 ‘기프트레터’ 인수

- 450만 MAU '틱톡 라이트' 쿠폰 독점 공급사 인수..."국내 최초 시니어 쿠폰 개발" - 저출산-초고령화 플랫폼 ‘하이퍼라이프케어’ 내 모바일 쿠폰 및 바우처 발행 인프라 구축 하이퍼코퍼레이션이 틱톡의 450만 명이 이용하는 숏폼(짧은 영상) 플랫폼 ‘틱톡 ...

Date2024.09.23 Bynewsit Views261

Read More
오라클, 말레이시아 AI 및 클라우드 컴퓨팅에 65억 달러 이상 투자

- 오라클, 신규 클라우드 리전 개소… 150개 이상의 인프라와 SaaS 서비스 제공해 말레이시아의 디지털 경제 및 AI 기반 혁신 지원 - 해당 지역 기업들, OCI의 뛰어난 성능과 내장형 보안, 강력한 데이터, 분산형 클라우드 기능 바탕으로 AI 혁신 가속화 가능 -...

Date2024.10.16 Bynewsit Views261

Read More
HS효성인포메이션시스템, AI 시대 위한 ‘클라우드 네이티브 인프라’ 최적화 전략 소개

- 11월 19일, 히타치 밴타라∙레드햇∙빔(Veeam)과 함께 ‘쿠버네티스 판타스틱4’ 행사 개최 - 클라우드 네이티브 환경 위한 인프라 구현부터 데이터 보호 전략까지 다양한 인사이트 제시 HS효성인포메이션시스템이 11월 19일 본사에서 히타치 밴타라, 레드햇, 빔...

Date2024.11.07 Bynewsit Views261

Read More
엠클라우드브리지, 기업 맞춤 AI비서 ‘Ai 365 코파일럿 AI 에이전트 템플릿’ 출시

- 코파일럿 스튜디오와 파워 오토메이트로 사전 개발된 업무 맞춤 AI 에이전트 템플릿 - 마이크로소프트 365 코파일럿 20 사용자 이상 구독시 템플릿 무상 제공 AI 통합 업무 플랫폼 전문기업 엠클라우드브리지가 마이크로소프트 코파일럿 적용 가속화를 지원...

Date2025.01.09 Bynewsit Views261

Read More
카테노이드 ‘찰나’, 출시 2년만에 숏폼 로드 수 40억 뷰 돌파

- 출시 2년 350% 성장… 4만500여 영상 업로드, 누적 시청 1,840만 시간 - 누적 가입 쇼핑몰 브랜드 1,000곳 돌파, 전년 동기 대비 81% 성장 - 의료, 세무·회계 등 전문 서비스 분야에서도 찰나 활용 - 샵플레이어 재생목록 위젯 강화, 검색 엔진 최적화 등 서...

Date2025.05.27 Bynewsit Views261

Read More
테스트웍스, '전국 도로시설물 영상정보 데이터' 구축 성공 수행…“AI 학습용 데이터 구축사업 우수 평가”

테스트웍스는 오늘, '인공지능(AI) 학습용 데이터 구축 사업'에서 '전국 도로시설물 영상정보 데이터' 구축을 성공적으로 수행했다고 밝혔다. 테스트웍스가 주관기업으로 참여한 '전국 도로시설물 영상정보 데이터' 과제는 다양한 도로 환경에서의 도로시설물 ...

Date2024.03.26 Bynewsit Views262

Read More
큐브리드, 경기도 경제과학진흥원 클라우드 컴퓨팅서비스 활용 모델 사업에 오픈소스 DBMS ‘CUBRID’ 공급

큐브리드는 경기도경제과학진흥원 클라우드 컴퓨팅서비스 활용 모델 사업에 자사의 오픈소스 DBMS ‘CUBRID(큐브리드)’를 공급했다고 밝혔다. 진인프라가 수주한 이번 사업에서 큐브리드는 경과원 홈페이지, 맞춤형 기업지원사업공고 플랫폼인 ‘이지비즈’, 도내...

Date2024.09.23 Bynewsit Views262

Read More
라바웨이브-법무법인 이유, 디지털 범죄 피해자 법률지원 강화 업무협약 체결

디지털 범죄 대응 전문기업 라바웨이브는 법무법인 이유와 몸캠피싱, 딥페이크 등 디지털 범죄 피해자 법률 지원 강화를 위한 전략적 업무협약(MOU)를 체결했다고 14일 밝혔다. 양사의 업무협약식은 라바웨이브 김준엽 대표와 법무법인 이유 변민혁 대표변호사...

Date2025.02.14 Bynewsit Views262

Read More
트림블코리아, 국내 철골 제작사 대상 ‘테클라 파워팹 런칭 세미나’ 개최

- 철골 제작 전 과정 통합 관리 소프트웨어 ‘테클라 파워팹’ 소개 - 제작사 중심 실무 기능과 적용 사례 위주 세미나 진행 트림블(Trimble) 코리아가 오는 7월 17일(목) 서울 구로구 롯데시티호텔 구로에서 철골 제작사를 위한 테클라 파워팹(Tekla PowerFab) ...

Date2025.07.17 Bynewsit Views262

Read More
델, AI 교육 솔루션 기업 ‘엘리스그룹’에 AI 인프라 솔루션 공급

- AI 교육 및 연구개발을 위한 클라우드 플랫폼 ‘엘리스클라우드’에 고성능 GPU와 친환경 요소 갖춘 델 파워엣지 XE9680 서버 도입 - 손쉬운 확장, 상면 공간 최소화 가능한 ‘이동식 모듈러 데이터센터(PMDC)’ 방식으로 구축해 에너지 효율은 높이고 비용은 절...

Date2024.06.04 Bynewsit Views263

Read More

태그 쓰기

샥즈 ‘오픈런 프로 2’, 美 타임지 ‘2025 올해 최고의 ...	11-06
레노버, 차세대 데이터 센터 인프라 전략 제시…AMD 기...	11-06
타포, 전력 사용 한눈에 확인 가능한 미니 스마트 플러...	11-06
텐센트, 고려대학교 세종 캠퍼스 특강 성료…“한국은 글...	11-06
ST, 산업 자동화·보안·리테일 애플리케이션용 신규 5MP...	11-06
딥엘, 차세대 언어 AI ‘딥엘 에이전트’와 ‘커스터마이...	11-06
마우저, 온세미의 광범위한 반도체 및 전자부품 포트폴...	11-06
티피링크, 포브스 선정 ‘2025 고객신뢰도 1위 브랜드’ ...	11-05
엔비디아, 지포스 RTX GPU로 현대적 크리에이티브 워크...	11-05
델, ‘델 테크놀로지스 2025 서베이’ 발표…“AI 혁신에 ...	11-05

소프트웨어·컴퓨팅

소프트웨어·컴퓨팅

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증

단축키

단축키

소프트웨어·컴퓨팅

하이퍼코퍼레이션, 틱톡 모바일 쿠폰 공급사 ‘기프트레터’ 인수

오라클, 말레이시아 AI 및 클라우드 컴퓨팅에 65억 달러 이상 투자

HS효성인포메이션시스템, AI 시대 위한 ‘클라우드 네이티브 인프라’ 최적화 전략 소개

엠클라우드브리지, 기업 맞춤 AI비서 ‘Ai 365 코파일럿 AI 에이전트 템플릿’ 출시

카테노이드 ‘찰나’, 출시 2년만에 숏폼 로드 수 40억 뷰 돌파

테스트웍스, '전국 도로시설물 영상정보 데이터' 구축 성공 수행…“AI 학습용 데이터 구축사업 우수 평가”

큐브리드, 경기도 경제과학진흥원 클라우드 컴퓨팅서비스 활용 모델 사업에 오픈소스 DBMS ‘CUBRID’ 공급

라바웨이브-법무법인 이유, 디지털 범죄 피해자 법률지원 강화 업무협약 체결

트림블코리아, 국내 철골 제작사 대상 ‘테클라 파워팹 런칭 세미나’ 개최

델, AI 교육 솔루션 기업 ‘엘리스그룹’에 AI 인프라 솔루션 공급