空间智能是人工智能下一个前沿

参考消息网
如今,大型语言模型(LLMs)等领先的人工智能技术已开始改变我们获取和处理抽象知识的方式。然而,它们依旧是登不了大雅之堂的语言大师,虽能言善辩但缺乏经验,虽知识渊博却站不住脚。

参考消息网12月24日报道美国《时代》周刊网站12月11日刊登题为《空间智能是人工智能的下一个前沿》的文章,作者是斯坦福大学以人为本人工智能研究所联合创始人兼联合主任、世界实验室公司的联合首席执行官李菲菲,内容编译如下:

1950年,当计算机还只是自动运算和简单逻辑的时候,艾伦·图灵问了一个至今仍发人深省的问题:机器能思考吗?想要见他所见,需要非凡的想象力,那就是智慧终有一天会人为构建,而非天生。这一见解后来引发了人们的不懈追求——人工智能。我在人工智能领域工作了25年,至今仍受到图灵愿景的启发。但我们是否已接近这一愿景?答案并不简单。

如今,大型语言模型(LLMs)等领先的人工智能技术已开始改变我们获取和处理抽象知识的方式。然而,它们依旧是登不了大雅之堂的语言大师,虽能言善辩但缺乏经验,虽知识渊博却站不住脚。

对人类而言,空间能力是我们的认知基础。当我们被动观察或积极创造时,它便开始起作用。它驱动我们的推理和计划,即使是最抽象的主题。它对我们的互动方式而言至关重要,无论是从语言互动到身体互动,还是从与人互动到与环境互动。当机器被赋予这种能力时,它将改变我们创造及与现实世界和虚拟世界互动的方式,彻底改变叙事、机器人、科学发现等领域。这是人工智能的下一个前沿,也是称2025年是关键一年的原因。

坦率地说,人工智能的空间能力仍远未达到人类水平。但它的确在这方面取得了巨大的进步。

除了文本数据外,多模态大型语言模型还接受了大量多媒体数据的训练,并引入了一些空间感知的基础知识,今天的人工智能可以分析图片,回答有关图片的问题,并生成超现实的图像和短视频。

构建具有空间理解力的人工智能需要有比大型语言模型更具野心的东西:世界模型。这种新型生成模型的理解、推理、生成以及与语义、物理、几何和动态复杂世界(虚拟或现实)交互的能力,远远超出了当今大型语言模型的能力范围。

这项技术仍处于萌芽阶段,但进展令人兴奋。空间智能的应用跨越了不同的时间线。创造工具正在涌现:世界实验室公司的“大理石”多模态世界模型已经把这些能力交到了创作者和作家手中。我们正在完善感知与行动之间的环路,而机器人则代表了一个雄心勃勃的中期地平线。最具变革性的科学应用需要更长时间,但有望对人类繁荣产生深远影响。

有史以来第一次,人类已经准备好制造出可以依赖的机器,作为我们面临最大挑战时的真正伙伴,无论是在实验室里加速对疾病的理解,还是在我们生病、受伤或衰老的脆弱时刻给予支持。新技术能够极大地提升我们所在意的生活质量,而如今的我们正处于这一技术的关键点。这是一个更深刻、更丰富、更有力量的生活愿景。

5亿年前,大自然在古生物身上释放出了第一丝空间智慧的光芒。如今,我们很幸运地发现自己也成了专家,因为我们可能很快就会赋予机器这种能力,同时还能利用这些能力来造福世界各地的人们。(编译/文怡)

请扫码关注数字化经济观察网
责编:左右
参与评论
文明上网,理性发言!请遵守新闻评论服务协议
0/200