“深层思维”宣布人工智能测试得分达国际数学奥赛金牌水平
创始人
2025-07-22 17:41:49
0

新华社伦敦7月22日电 谷歌旗下“深层思维”公司21日宣布,其搭载了“深度思考”能力的高级版“双子座(Gemini)”人工智能模型测试得分达到国际数学奥林匹克竞赛(IMO)金牌水平,该成绩已获官方认证。

“深层思维”公司在官网发布公报说,高级版“双子座”模型的“深度思考”模式成功解答了2025年国际数学奥林匹克竞赛6道题目中的5道,共获35分,达到金牌水平。相关解题方案已在网上公布。

“我们可以证实,谷歌‘深层思维’已达成这一备受期待的里程碑,在总分42分中获得35分——这已达到(今年)金牌分数线。”国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授说。他称解题方案在诸多方面都“令人惊叹”。国际数学奥林匹克竞赛评分员认为这些方案清晰、精确,且大多数都易于理解。

国际数学奥林匹克竞赛自1959年起每年举办一届,参赛选手需在两天(每天各4.5小时)内解答涉及代数、组合数学、几何和数论四大领域的6道极具难度的题目。近年来,该竞赛成为检验人工智能模型解决高级数学问题能力和推理能力的热门挑战。

“深层思维”公司推出的人工智能模型AlphaProof与AlphaGeometry 2组合解答了2024年国际数学奥林匹克竞赛6道题中的4道,以28分的成绩达到当年银牌水平。为了让这两个模型理解题目,专家先将题目从自然语言翻译成特定计算机语言,解题总共耗费两到三天的计算时间。今年,高级版“双子座”测试成果相比去年有显著进展,它直接根据自然语言描述的题目给出数学证明,并在竞赛时限内完成挑战。竞赛协调员采用与学生选手解题方案相同的标准对其进行正式评分和认证。

“深层思维”公司说,今年取得的成果得益于高级版“双子座”的“深层思考”模式——这是一种针对复杂问题的增强推理模式,融合了“并行思维”等最新技术。这种模式设置可使模型在给出最终答案之前,同时探索并整合多种可能的解决方案,而非沿着单一、线性思路推进。

相关内容

热门资讯

这部音乐超好听的权谋短剧,AI... 2025年8月6日刊| 总第4050期 短剧行业一直对AI情有独钟。 原因很简单,AI不仅可以降本增...
杭州海创自动化申请集成化ATR... 金融界2025年8月6日消息,国家知识产权局信息显示,杭州海创自动化有限公司申请一项名为“一种集成化...
苹果iOS 26新增提醒回电功... 8月6日,科技媒体GizChina今天发文表示,苹果iOS 26中的“电话”App新增了回电提醒功能...
周鸿祎:现阶段智能体竞争的唯一... 周鸿祎在ISC.AI 2025 "Agent不存在谁活下来活不下来,Agent都在进化,任何产品领先...
拉米酷取得笔记本电脑支架专利,... 金融界2025年8月6日消息,国家知识产权局信息显示,深圳前海拉米酷信息技术有限公司取得一项名为“一...
广东品汇流体科技取得薄壁保温不... 金融界2025年8月6日消息,国家知识产权局信息显示,广东品汇流体科技有限公司取得一项名为“一种薄壁...
快来报名!“大创慧谷”微剧组与... 你是否也曾梦想拍一部属于自己的剧?是否想真正走进影视剧组、成为职业化制作的一员?现在,机会来了!近日...
全球最长风电叶片吊装纪录在烟台... 中新网烟台8月6日电(王娇妮 王延达)记者6日从山东港口烟台港获悉,搭载3支超大尺寸海上风电叶片的“...
雷赛智能:公司对具身智能机器人... 证券日报网讯 雷赛智能8月6日在互动平台回答投资者提问时表示,公司长期从事运动控制、伺服驱动、视觉软...
智行时代:南宁交通迈向智能高效... 人工智能是区域交通运输效率跃升、安全保障及模式创新的核心变革驱动力。 朝着中央城市工作会议提出的“着...