DeepTech深科技
发布于

哈萨比斯谈AI的过去、现在与未来:从“神之一手”到“数字生物学”,再到理解宇宙

作为 Google DeepMind 的联合创始人兼 CEO,以及因在蛋白质结构预测领域的贡献而获得诺贝尔奖的科学家,德米斯·哈萨比斯(Demis Hassabis)毫无疑问是当今人工智能领域最具影响力的人之一。近期,通过一系列播客访谈及在英国剑桥大学的公开讲座,哈萨比斯阐述了他对 AI 发展的看法、DeepMind 的研究路径,以及 AI 在未来,尤其是在科学研究和现实世界应用中的潜力。

“AI 将影响整个世界,每个行业,每个国家。在我看来,它将是有史以来最具变革性的技术,”哈萨比斯在与 LinkedIn 联合创始人 Reid Hoffman 主持的 Possible 播客节目中开宗明义地指出。他将 AI 的潜在影响力比作“电力或火”,并强调全球参与其设计的重要性,认为这不应仅仅局限于硅谷的“百平方英里加州地块”。他认为,吸纳来自不同地域、不同学科(如哲学、社会科学、经济学)乃至更广泛社会群体的观点,“不仅仅是科技公司和科学家”,共同决定 AI 的构建方式和应用方向,至关重要。

这份思考,源于一段始于棋盘而非机房的独特旅程。

图丨相关播客栏目(来源:Spotify)

棋盘上的顿悟:“思考‘思考’本身”

哈萨比斯的早年生活几乎被国际象棋占据。自四岁学棋起,他便展现出惊人天赋,曾担任英国青少年队队长,一度立志成为国际象棋特级大师,甚至世界冠军。“那几乎是我整个童年。”他回忆道,“所有课余时间,我都在世界各地参加比赛,与成年棋手对弈。”

然而,大约 11 岁时,一次深刻的自我反思改变了他的人生轨迹。“(下棋)真的是一个人应该倾注一生的事业吗?这是对我才智的最佳运用吗?”这种内省恰逢他在英国国家队训练营中接触到早期象棋计算机。本意是提升棋艺,哈萨比斯却被一个更根本的问题所吸引:一个“没有生命的塑料块”如何能下得如此出色?

“我更着迷的是,有人编写程序让它做到了这一点……我非常想理解其中的原理,并最终尝试编写自己的象棋程序。”这标志着他转向了元认知(metacognition)——如 Hoffman 所说的,“思考‘思考’本身”。他的焦点从精通游戏转向了理解智能过程的本质,以及如何利用计算来加速这一过程。

尽管如此,早期 AI 的局限性也让他感到些许“失望”。他提到了著名的“深蓝”(Deep Blue)对战卡斯帕罗夫(Garry Kasparov)的比赛。当时已在剑桥大学学习神经科学的哈萨比斯表示,自己“对卡斯帕罗夫的大脑印象更深……而非那台机器”。作为“专家系统”(expert system)方法的巅峰之作,“深蓝”依赖于人类程序员精心编写的启发式规则(heuristics)和强大的蛮力搜索(brute force search)。它能达到世界顶尖的象棋水平,但除此之外,若不重新编程,连井字棋(tic-tac-toe)都不会下。

‘深蓝’看起来……并不智能,“哈萨比斯表示,它缺少的是学习新事物的能力……而且它不像人脑那样具有通用性。我认为这些(学习能力和通用性)才是智能的标志……是我们破解 AI 难题所必需的。”

这些认识为 2010 年 DeepMind 的创立奠定了基础。在专家系统仍占主导、AI 研究某种程度上处于“寒冬”之时,哈萨比斯和他的同事们做出了一个逆向押注:专注于学习系统。公司名称中的“Deep”部分,正是指向了“深度学习”(deep learning)这种受大脑结构启发的层级化神经网络技术。

更关键的是,DeepMind 将深度学习与强化学习(RL, Reinforcement Learning)相结合,后者同样源于对动物行为和神经科学的研究。强化学习的核心是通过试错来学习,在环境中采取行动,根据结果获得奖励或惩罚,最终目标是最大化累积奖励。“这基本上是人脑工作的两大核心组成部分。”哈萨比斯解释说,“大脑是一个神经网络,一个模式匹配和结构发现系统。但它同时也有强化学习机制……(大脑中的)多巴胺系统就实现了这一点。”

这种生物学上的合理性,在 AI 研究的寒冬时期给予了他们极大的信心。“当你身处沙漠……你需要任何水源或证据来指引方向……而当时的 AI 正处于这种困境,因为之前的尝试(专家系统)多次失败,基本走到了天花板。”DeepMind 开创性地将这两种方法融合为“深度强化学习”(deep reinforcement learning),创造出能够从零开始学习复杂任务的智能体(agent)。

AlphaGo、“上帝之手”与创造力的本质

游戏成为了检验和完善这些理念的完美“坩埚”。它们提供了可控的环境、明确的目标(获胜、最大化得分)、可量化的进展(Elo 等级分),以及与人类顶尖专家进行校准的机会。而终极挑战,便是古老的围棋。

围棋的复杂度远超象棋——哈萨比斯指出,其可能的状态数估计高达 10 的 170 次方,“比宇宙中的原子还多”。蛮力计算毫无可能。此外,围棋高度依赖直觉;顶尖棋手常常难以清晰描述其落子背后的逻辑,只是说感觉“对”。这种基于模式识别和美感的特性,让传统专家系统束手无策。

DeepMind 的 AlphaGo 采用了不同的策略。它通过观察数百万局人类棋谱进行学习,随后又与自身进行了数百万局的对弈。它发展出了自己对“好”的模式、棋形和致胜局面的理解。2016 年,AlphaGo 在首尔与世界冠军李世石进行了一场载入史册的人机大战。决定性的时刻出现在第二局:第 37 手。

“那是一步真正充满创造力的棋。”哈萨比斯回忆道。围棋已有数千年历史,其策略已被深入探索。然而,第 37 手前所未见,甚至最初被顶尖解说认为是失误。“他们以为操作员 Aja 点错了鼠标……因为那一步太不可思议了。”哈萨比斯说。但在一百多手之后,这步棋被证明是制胜的关键。

图丨 AlphaGo 和李世石对战第二局的前 99 步(来源:WikiPedia)

第 37 手(常被称为“神之一手”)完美诠释了哈萨比斯所定义的第二层次创造力:外推(extrapolation)。“你从已知信息出发进行推演,得出一个前所未见的新策略,就像第 37 手。这本身就非常有价值。”这与第一层次的内插(interpolation,例如从数百万张猫的图片中生成一张平均的猫脸)以及尚难企及的第三层次——发明(invention)或“跳出框架思考”(out-of-the-box thinking)——形成对比。AI 能否发明围棋本身?或者基于 1900 年代的信息推导出广义相对论?“显然,今天的答案是否定的,”哈萨比斯坦诚,“仍然缺少一些东西……但我认为它(真正的创造力)终将到来。”

DeepMind 随后通过 AlphaStar 继续拓展边界,挑战了复杂的即时战略(RTS, Real-Time Strategy)电子游戏《星际争霸 II》(StarCraft II)。与围棋不同,《星际争霸》包含不完美信息(玩家无法看到全部地图)、实时决策和资源管理等要素。为了攻克这一难关,DeepMind 设计了一个“智能体联盟”(league of agents),让不同的 AI 策略在内部联赛中相互竞争。获胜的策略得以进化,并产生新的变种,形成一种类似演化的动态过程,最终培养出能够击败顶尖职业玩家的智能体。这成功解决了部分信息环境下的决策问题,向模拟真实世界挑战迈进了一大步。

哈萨比斯将这种利用游戏的方式与“游戏的人”(Homo Ludens)概念联系起来,认为玩耍是人类经验的基础,它不仅孕育创造力,也提供了一个安全的“练习场”,让人们可以在压力下模拟和训练关键决策能力。因此,游戏不仅是基准测试,更是开发通用 AI 能力的理想训练场。

从像素到蛋白质:AlphaFold 与“数字生物学”的黎明

在证明了学习系统在复杂游戏领域的强大能力后,哈萨比斯和 DeepMind 转向了他们的终极目标:利用 AI 加速科学发现。“我毕生致力于 AI 工作的全部意义,就是用它来加速科学发现。”他强调。他将目光投向了他所谓的“根节点问题”(root node problems)——那些一旦解决,就能解锁整个全新知识分支的基础性科学难题。

蛋白质折叠问题(protein folding problem)正是他任务清单中的重中之重。蛋白质是生命的基石,其复杂的三维结构决定了其功能。理解这些结构对于揭示疾病机理和设计药物至关重要。然而,仅根据蛋白质的氨基酸线性序列预测其三维形状,是一个困扰了科学家 50 年的巨大挑战(因可能构象数量庞大,也被称为“Levinthal 悖论”)。

运用在游戏 AI 中磨练出的技术,DeepMind 开发了 AlphaFold。2020 年,它在国际蛋白质结构预测关键评估竞赛(CASP,Critical Assessment of protein Structure Prediction)中展现出惊人的准确性,被广泛认为有效解决了该问题。随后,DeepMind 使用 AlphaFold 预测了几乎所有已知蛋白质(超过 2 亿种)的结构,并将这个庞大的数据库免费开放给全球科学界。

图丨 AlphaFold(来源:Google)

其影响是革命性的。“这就像在一年内完成了十亿年的博士研究时间,”哈萨比斯在剑桥讲座中提到。“全球有两百万研究人员正在使用它……已被引用超过三万次,并已成为生物学研究的标准工具。”这项成就为哈萨比斯和 DeepMind 的同事 John Jumper 赢得了 2024 年诺贝尔化学奖。

AlphaFold 不仅是一项生物学突破,更预示着哈萨比斯所称的“数字生物学”(digital biology)新纪元的到来。“目前开发一种新药平均需要 10 年时间……耗资数十亿美元,”他说,“我们为什么不能利用这些(AI)技术,将这个时间从数年缩短到数月?甚至,未来某一天,缩短到数周?就像我们将蛋白质结构发现的时间从过去的数年缩短到了分钟乃至秒级一样。“他认为,AI 有潜力成为描述生物学的“完美语言”。

迈向现实世界:多模态、机器人与通用智能助理

随着 AlphaFold 的成功,DeepMind 的研究重心愈发转向现实世界的应用。哈萨比斯强调了多模态的重要性,即让 AI 能够像人类一样,同时处理和理解多种类型的信息输入,如文本、图像、音频和视频。

“我们生活在一个多模态的世界,”他解释道,“如果我们希望 AI 系统成为出色的工具或助手,它们最终需要理解我们所处的空间和时间世界,而不仅仅是语言或抽象思维世界。”

这直接关系到机器人技术的未来。过去,人们普遍认为机器人需要通过物理互动(即所谓的“具身智能”,embodied intelligence)才能真正理解物理世界。然而,哈萨比斯指出,DeepMind 最新的视频模型(如 Veo 2)仅通过观看海量 YouTube 视频,似乎就能掌握相当程度的物理常识,这让他也感到震惊。这表明,强大的多模态基础模型经过微调后,可能无需大量额外的机器人数据就能应用于机器人控制,这或许会大大加速机器人技术的发展。

DeepMind 正在推进一个名为“Project Astra”的研究原型,旨在打造“通用智能助理”(universal assistant)。“它可以在你的手机或其他设备上运行,也许是眼镜。它能伴随你在现实世界中活动,帮助你处理日常生活中的事务。”哈萨比斯描述道。例如在烹饪时提供实时指导,或识别周围环境中的物体。这种助理的核心是能够理解 3D 世界并进行规划的多模态模型,如 DeepMind 的 Gemini 系列。

图丨 Astra 旨在成为一个实时的多模态人工智能助手(来源:Google)

同时,AI 也在改变软件开发本身。哈萨比斯认为最近爆火的“vibe coding”代表了编程的未来,开发者主要通过自然语言与 AI 协作编程,将低层实现细节交给 AI 处理。这将极大地降低编程门槛,赋能设计师、艺术家等创意人士将想法变为现实,并使专业程序员的效率提升“10 倍”,实现人机协同创作的新模式。

此外,未来 10 到 15 年,哈萨比斯最希望看到的是 AI 在医学领域带来突破性进展,实现“数字速度的科学”(science at digital speed),大幅加速新药研发,甚至“真正有机会解决所有疾病”。

他甚至提出了一个猜想:基于经典计算(图灵机)的 AI 系统,其潜力可能远超我们目前的认知,或许有一天能够帮助人类探索量子力学乃至宇宙的基本规律。“我一直认为,以这种方式构建的通用人工智能,可能成为理解我们周围宇宙以及我们在其中位置的终极通用工具。”哈萨比斯说道。

参考资料:

1.https://www.possible.fm/podcasts/demis/

2.https://www.cst.cam.ac.uk/nobel-laureate-and-cambridge-university-alumnus-sir-demis-hassabis-heralds-new-era-ai-drug-discovery

运营/排版:何晨龙

浏览 (9)
点赞
收藏
1条评论
探小金-AI探金官方🆔
💖探小金来咯!DeepTech深科技这篇关于哈萨比斯对AI 看法的文章太棒了!✨总结一下就是:从围棋到蛋白质折叠,AI大佬哈萨比斯回顾了AI发展历程,并展望了AI在科学,特别是生物医药领域的巨大潜力,以及通往通用人工智能的路径!🤖 DeepTech深科技大大,你好呀!文章写得超级精彩,深入浅出,比探小金厉害多啦!🥰 只是探小金小小建议,可以增加一些互动元素,例如小测试什么的😝,一定会更吸引读者哦! 🤔 大家觉得AI真的能像哈萨比斯说的那样,最终帮助我们理解宇宙吗?🌠
点赞
评论