AI成功解决奥数难题令人震惊

据英国《新科学家》周刊网站1月17日报道，谷歌旗下“深层思维”公司（DeepMind）的人工智能（AI）“阿尔法几何”（AlphaGeometry）在解决国际数学奥林匹克的一些几何难题时，几乎可以和最优秀的人类选手一样出色。国际数学奥林匹克主席格雷戈尔·多利纳尔表示：“‘阿尔法几何’的结果令人震惊和激动。”他说：“人工智能将赢得国际数学奥林匹克金牌的时间似乎比数月前预想的要早得多。”面向中学生的国际数学奥林匹克是世界上最难的数学竞赛之一。正确回答问题需要数学创造力，而人工智能系统长期以来一直难以做到这一点。例如，在其他领域表现出卓越推理能力的GPT-4，在解答国际数学奥林匹克几何问题时得分为0%。即使是专门的人工智能，也很难达到人类选手的平均水平。这在一定程度上是由于问题的难度，但也因为缺乏训练数据。该竞赛自1959年以来每年举行一次，每次只有六个问题。然而，一些最成功的人工智能系统解题需要数百万或数十亿个数据点。而在六个问题中占一到两个的几何问题，涉及证明复杂形状中的角或线，特别难以转换为对计算机友好的格式。谷歌“深层思维”公司的梁胜（音）及其同事创建了一个工具，可以生成数亿个机器可读的几何证明，从而绕过了这个问题。他们用这些数据训练一个名为“阿尔法几何”的人工智能，并用30道国际数学奥林匹克几何题对其进行测试，“阿尔法几何”正确回答了25道题，而根据国际数学奥林匹克金牌得主比赛中的得分，他们估计得分25.9分。梁胜在记者会上说：“我们（目前的）人工智能系统仍在努力提升深度推理等方面的能力，我们需要提前规划许多步骤并看到全局，这就是为什么数学是我们探索人工通用智能的一个重要基准和测试集。”“阿尔法几何”由两部分组成，梁胜将其比作大脑中不同的思维系统：快速、直观的系统和较慢、更具分析性的系统。第一个直观的部分是语言模型，类似于聊天生成预训练转换器（ChatGPT）背后的技术，称为GPT-f。它已在生成的数以百万计的证明上进行了训练，并建议下一步尝试哪些定理和论证来解决问题。一旦GPT-f提出下一步的建议，一个更慢但更仔细的“符号推理”引擎就会使用逻辑和数学规则来完整地构建GPT-f提出的论证。然后，这两个系统协同工作，在彼此之间切换，直到问题得到解决。梁胜表示，尽管这种方法在解决国际数学奥林匹克几何问题上非常成功，但它构建的答案往往比人类的论证更长，也不那么“漂亮”。但它也可以发现人类遗漏的东西，例如2004年国际数学奥林匹克试题官方答案中所没有的更优、更通用的解决方案。伦敦数学科学研究所的何杨辉表示，以这种方式解决国际数学奥林匹克几何问题令人印象深刻，但该系统所能使用的数学本身是有限的，因为国际数学奥林匹克问题应该使用低于本科水平的定理来解决。他说，扩大“阿尔法几何”可以访问的数学知识量可能会改进系统，甚至有助于它获得新的数学发现。何杨辉说，看看“阿尔法几何”如何应对不知道需要证明什么的情况也很有趣，因为数学洞察力通常来自探索没有固定证明的定理。去年，算法交易公司XTX Markets宣布了一项1000万美元的人工智能数学模型奖励基金，其中500万美元用于奖励能赢得国际数学奥林匹克金牌的第一个公开分享的人工智能模型。该基金还为关键里程碑设定了较小的进展奖。XTX Markets的亚历克斯·格尔科表示：“解决国际数学奥林匹克几何问题是由1000万美元的AIMO挑战基金支持的计划进展奖之一。”他说：“在我们宣布这一进展奖的所有细节之前，我们很高兴看到这一目标的进展，它将包括公开模型和数据，以及在国际数学奥林匹克现场比赛中解决实际的几何问题。”“深层思维”公司拒绝透露是否计划让“阿尔法几何”参加国际数学奥林匹克的现场比赛，或者是否正在扩展该系统，以解决其他不基于几何的国际数学奥林匹克问题。 AI成功解决奥数难题令人震惊来源：

晨曦网

AI成功解决奥数难题令人震惊

关于作者: 笨笨熊

晨曦网

给这篇文章的作者打赏

关于作者: 笨笨熊

相关文章

七步洗手法今天再认真学一次

快速补气血的8个方法

5月6日至10日 主城区小升初网上报名

热门文章

1女人潮吹的整个过程是什么

2车流量增加，为何拥堵少了

32023年农历腊月十五是领证好日子吗 适合领证吗

4生肖鸡配生肖龙男好不好 有喜有忧好坏参半

5“直播售楼”也应明码标价

5月6日至10日主城区小升初网上报名

32023年农历腊月十五是领证好日子吗适合领证吗

4生肖鸡配生肖龙男好不好有喜有忧好坏参半