谷歌 DeepMind 声称在人工智能问题解决方面取得“历史性”突破

分类:News 大学新闻

该公司的 Gemini 2.5 人工智能模型解决了困扰人类程序员的复杂现实问题

英国科技编辑罗伯特·布斯2025年9月17日星期三 18.42 BST分享

谷歌 DeepMind 声称,它取得了人工智能的“历史性”突破,类似于 1997 年深蓝计算机在国际象棋中击败加里卡斯帕罗夫,以及2016 年人工智能击败人类围棋冠军。

该公司的 Gemini 2.5 人工智能模型解决了困扰人类计算机程序员的复杂现实问题,成为本月早些时候在阿塞拜疆举行的国际编程大赛中第一个获得金牌的人工智能模型。

这家科技公司称,这场演示是“抽象问题解决能力的一次重大飞跃”。演示者在不到半小时的时间内,就计算出如何权衡无数种可能性,将液体通过管道网络输送到一组相互连接的储液器。目标是尽快完成液体的分配。

包括来自俄罗斯、中国和日本大学的顶尖选手在内的所有人类队伍都没有答对。

尽管该人工智能在设定的12项任务中失败了两项,但其整体表现在全球139位顶尖大学水平的计算机程序员中排名第二。谷歌表示,这是“迈向通用人工智能(AGI)的历史性时刻”。通用人工智能被广泛认为在各种任务上都拥有与人类水平相当的智能。

谷歌 DeepMind 副总裁 Quoc Le 表示:“对我来说,这一刻就相当于国际象棋的深蓝和围棋的 AlphaGo。”

“更重要的是,它的推理更多地面向现实世界,而不仅仅是受限的环境(比如国际象棋和围棋)……正因为如此,我认为这一进步有可能改变许多科学和工程学科。”他引用了药物和芯片设计的例子。

该模型是一个通用人工智能,但经过特殊训练,可以解决非常困难的编码、数学和推理问题。谷歌表示,它的表现“堪比全球排名前20的程序员”。

该公司表示:“解决这些比赛中的复杂任务需要深度抽象推理、创造力、综合解决前所未有的问题的新颖解决方案的能力以及真正的创造力。”

在细节公开之前,加州大学伯克利分校计算机科学教授斯图尔特·拉塞尔表示,“划时代意义的说法似乎有些夸大其词”。

他说,人工智能系统在编程任务上一直表现良好,而深蓝国际象棋的突破“对现实世界的应用人工智能基本上没有影响”。

然而,他表示,“为了正确回答 ICPC [国际大学生程序设计竞赛] 的问题,代码实际上必须正确运行(至少在有限数量的测试用例上),因此这种表现可能表明在使基于人工智能的编码系统足够准确以生成高质量代码方面取得了进展”。

他补充道:“人工智能公司不断宣称取得突破的压力是巨大的。”

牛津大学人工智能基础阿沙尔教授迈克尔·伍尔德里奇表示,这听起来是一项令人印象深刻的成就,“能够解决这种水平的问题令人兴奋”。

但他质疑需要多少计算能力。谷歌拒绝透露,只是确认,对于每月 250 美元的 Google AI Ultra 服务的普通用户来说,使用 Gemini App 中 Gemini 2.5 Deep Think 的轻量级版本,即可获得更高的计算能力。

ICPC 执行董事 Bill Poucher 博士表示:“Gemini 成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。”

微信微博XFacebook