
◆ 국제 수학 올림피아드 금메달의 주인공, 알고 보니?

올해 호주 선샤인코스트에서 열린 국제 수학 올림피아드(International Mathematical Olympiad/IMO)에서 금메달에 해당하는 점수를 공식적으로 인정받는 참가자의 정체가 드러나며 화제다. 이달 21일, 올림피아드에서 우승한 주인공은 다름 아닌 AI 챗봇임이 밝혀져 놀라움을 자아냈다. 국제 수학 올림피아드, 약자로 IMO는 전 세계의 고등학생들이 국가 대표로서 난이도가 높은 수학 문제를 제한 시간 안에 풀어야 하는 대회로, 특히 올해는 630명의 참가자 중 67명만이 금메달을 획득할 정도로 매우 높은 난이도를 보였다. 출제 영역은 고교 수준의 대수학, 조합론, 기하학, 정수론에 기반하며 정답을 도출하기 위해서는 몇 장 가량의 수학적 증명과 논리가 요구됐다. 이러한 IMO에서의 금메달을 AI가 받게 된 것이다.
이번에 개발된 AI 챗봇은 참가자들과 동일하게 인간 언어로 문제지를 받아 인간 언어로 문제 풀이와 답을 제출했으며, 제한 시간도 이틀 간 4시간 30분씩으로 동일하게 적용되었다. 또 동일한 조건과 채점 기준으로 평가받았다. 그 결과 총 여섯 문제 중 다섯 문제는 완벽하게 풀어냈고, 총점 42점 만점에 35점으로 금메달을 따낸 것이다. 이번 IMO에서 금메달을 딴 AI 챗봇의 정식 명칭은 구글 딥마인드에서 개발된 ‘제미나이 딥 싱크’ 고급 버전이다.
◆ AI의 수학 풀이는 어느 정도 수준을 보여주었나?
이번 올림피아드에 제출된, AI의 수학 풀이 답안을 분석한 결과, 상당히 정확하고 정교하다는 평가를 받았다. 전문가들의 평에 따르면 온라인으로 공개된 AI의 답안은 문제마다 단계별로 보조정리(lemma)와 정리(theorem) 등을 스스로 고안했으며, 체계적이고 일목요연하고 엄밀하게 답안을 서술했다고 평가했다. 수학 올림피아드 위원장인 그레고르 돌리나르 류블라냐 대학교 교수는 Ai의 답안을 보고 놀라웠다며 감탄을 금치 못했다. 대부분의 풀이가 따라가기 쉬웠고 체계적인 논리 전개를 보였으며, 전체적으로 명확한 전개방식을 보였다는 것이다. 채점자들 역시 AI의 답안을 보고 이 답안들은 명확하고 정밀하며 답안 대부분이 체계적이고 전개를 따라가기 용이하다고 평가했다. 결론적으로, 사실상 인간 수준의 사고력과 수학 문제 해결 능력을 입증했다고 평가 받았다.
◆ AI의 수학 풀이 훈련 방식
수학은 증명, 개념화, 추론, 오류 탐지 등 단순한 계산을 넘어 고차원적 사고 능력을 요구하는 학문이다. 따라서 AI가 놀라운 성과를 보이더라도, 정교한 수학 문제 풀이로는 AI가 인간의 사고력을 따라잡기는 아직까지 어렵다고 여겨졌다. 그러나 이번 AI가 보여준 수학 올림피아드 성적이 공식적으로 인정받으면서 AI 개발은 또다른 국면을 맞이했다.
그렇다면 이런 AI의 수학 문제 풀이는 기술적으로 어떤 원리를 바탕으로 하는가? AI는 대형 언어모델인 LLM을 기반한 알고리즘을 통해 수학 문제를 풀게 된다. AI는 단순히 정답을 맞히는 것이 아니라 문제의 의도를 파악하고, 풀이의 흐름과 전개를 구성하며, 스스로 오류를 점검하는 방식으로 문제를 해결한다. 아직까지 밝혀지지 않은 구체적인 구조나 훈련방식이 존재하지만, 지금까지 밝혀진 바에 따르면 수학 문제 풀이가 가능한 AI 모델은 하나의 정답 대신 복수의 접근법과 해결법을 동시에 생성하고 이를 통합하여 최적의 답안을 낼 수 있도록 초점을 맞춘다. 그리고 이를 바탕으로 강화학습 기법을 통해 수많은 수학 문제 풀이 과정을 반복적으로 학습하게 하고, 반복된 피드백에 기반해 정확도를 높여가는 과정을 거친다.
그리고 AI가 수학을 학습하도록 하기 위해 학습 데이터가 필요하다. 학습 데이터는 단순한 정답 해설이 아니라 각 문제를 해결하기 위해 필요한 중간 단계, 접근법에 대한 설명과 응용까지 더 정교하고 자세한 콘텐츠로 구성된다.
◆ AI 사고력 발전은 어디까지… 향후 전망과 앞으로의 대책
AI가 수학올림피아드에서 수학 문제 풀이 시범을 보인 것이 올해가 처음은 아니다. 지난해에도 AI 모델들이 IMO에서 은메달에 해당하는 28점을 받은 사례가 있었다. 그러나 이때는 올해와 달리 인간 언어를 컴퓨터 프로그래밍 언어로 문제를 번역해 AI가 수학문제를 조금 더 수월하게 풀 수 있는 편의를 제공했고 이는 자연어를 수학 언어로 번역하고 되돌려야 하는 복잡한 과정을 거쳐야 했다. 그리고 문제를 해결하는 데 있어서도 더 오랜 시간이 걸렸으며, 최종 정답 도출을 위해서는 반드시 전문가의 개입도 필요했다. 따라서 AI 기술은 기존보다 더욱 비약적으로 진화했고, 획기적인 진전을 보였다고 할 수 있다. 뉴욕 타임스는 “이제 AI는 인간처럼 수학문제를 읽고 사고한 뒤 스스로 해답까지 서술할 수 있는 수준까지 발전했다”고 평가하기도 했다.
학계에서는 AI 기술이 학문적 영역에서 인간의 수준과 견줄 수 있을 만큼 비약적으로 발전하면서 한 분야에만 특화된 AI가 아닌 다양한 분야에서 활용되는 범용 AI 모델(AGI) 시대를 향해 빠르게 진전하고 있다고 말한다. AI의 정밀한 수학 풀이 능력은 곧 인간처럼 논리적사고를 구현할 수 있음을 뜻하며, 이는 다양한 영역에서 창의적인 문제 해결 역량을 갖출 수 있다는 것을 의미하기 때문이다. 반면 아직 이 모델의 구체적이고 체계적인 훈련 방식이 완벽하게 확립되지는 않았고 정보도 부족하므로 AGI시대에 가까워졌다고 판단하기에는 아직 시기상조라는 의견도 존재한다.
[ 출처 ]
구글 AI 챗봇, 국제수학올림피아드 ‘금메달’…”서술형 답안 놀라워” <SBS> 2025.07.22
https://news.sbs.co.kr/news/endPage.do?news_id=N1008187323&plink=ORI&cooper=NAVER
수학 올림피아드 金, 알고 보니 구글 AI 챗봇… “ 서술형 답안 놀라워” <중앙일보> 2025.07.22
https://www.joongang.co.kr/article/25353348
구글 AI 챗봇, 국제수학올림피아드 금메달 수준 도달 <파이낸셜뉴스> 2025.07.22
https://www.fnnews.com/news/202507221030256954
구글 AI 제미나이, 국제수학올림피아드서 ‘금메달 점수’ 획득 <조선비즈> 2025.07.22
https://biz.chosun.com/it-science/ict/2025/07/22/QACQICDK4REC3HM33RAX7XY4Q4/?utm_source=naver&utm_medium=original&utm_campaign=biz
구글 AI, 국제수학올림피아드서 ‘금메달’ 점수 공식 인정… “인간과 동일 조건” <이코노미스트> 2025.07.22\
https://economist.co.kr/article/view/ecn202507220040
이제 수학 올림피아드까지…”구글 AI 챗봇, 금메달 점수 인정 <연합뉴스 TV> 2025.07.22
https://www.yonhapnewstv.co.kr/news/AKR20250722104744980
오픈 AI “미공개 AI 모델로 국제수학올림피아드 금메달 수준 달성” <조선비즈> 2025.07.22
https://biz.chosun.com/it-science/ict/2025/07/20/BHA36LZIUBAUBMTPG23FK42DG4/?utm_source=naver&utm_medium=original&utm_campaign=biz
인간사고력 넘은 AI…. 국제수학대회 첫 金 <매일경제> 2025.07.22
https://www.mk.co.kr/news/it/11374791
구글 AI, 국제 수학올림피아드서 금메달… 오픈 AI보다 엄격한 기준 통과 <토큰포스트> 2025.07.22
https://www.tokenpost.kr/news/ai/269358

'디지털콘텐츠 > 이슈리포트' 카테고리의 다른 글
| 인공지능이 전쟁을 바꾼다? (0) | 2025.08.11 |
|---|---|
| 이게 AI가 만든 거라고? – 유행하는 AI 창작 콘텐츠들 (6) | 2025.08.07 |
| 역사를 깨우는 AI, 기술로 다시 만나는 우리의 영웅들 (1) | 2025.08.01 |
| 환경 위기 문제, 디지털로 답하다: 지속가능성을 향한 디지털 기술 (4) | 2025.08.01 |
| AI의 수학 문제 풀이: AI 챗봇, 국제수학올림피아드 주인공 돼 (0) | 2025.08.01 |