AI盲区曝光!李飞飞:机器不会“活”世界!

人工智能,这个词汇在今天已经不再陌生,它正以惊人的速度改变着我们的生活。从智能手机里的语音助手,到线上购物的个性化推荐,再到自动驾驶的初步尝试,人工智能的触角无处不在。然而,当我们沉浸在AI带来的便利与惊喜时,一些行业专家也在冷静思考,人工智能的下一步突破究竟在哪里?
在人工智能领域,有一位被誉为“人工智能教母”的杰出学者——美国斯坦福大学的李飞飞教授。她近期发表了一篇深度文章,对当前人工智能的发展现状提出了独到的见解。在她看来,虽然当前以大语言模型和图像识别系统为代表的人工智能取得了巨大成就,但在某些关键领域,它似乎已经达到了一个瓶颈。
李飞飞教授在这篇名为《从文字到世界》(From Words to Worlds)的文章中指出,我们已经成功地训练出了能够理解和生成文字、分析和识别图像的机器。这些机器在处理抽象信息方面表现出色,能够整理海量数据,进行复杂的模式匹配。然而,它们仍然缺乏一种至关重要的能力——对真实世界的理解和感知。用她的话来说,我们“建造了能够阅读和书写的机器,但还没有建造出能在世界上看、移动和生活的机器。”
为何空间智能对AI如此重要?
李飞飞教授的核心观点在于,如果人工智能无法获得“空间智能”,即感知几何、深度、运动以及物体之间关系的能力,那么它未来的发展将受到严重限制。她认为,现在的大语言模型固然可以生成和组织各种信息,但它们完全是在抽象层面运作,对真实世界中事物如何变化一无所知。同样的,计算机视觉系统虽然能够识别物体,却无法理解这些物体之间是如何互动、移动或演变的。有外媒报道指出,只有让机器像人类一样“看”世界,才能让下一代自主系统从静态的模式识别器中脱颖而出,实现真正的飞跃。
空间智能不仅仅是识别眼前的景象,它更是一种理解能力,能够洞悉当一个物体移动时,或者当环境条件发生变化时,整个场景将如何随之改变。缺乏这种能力,机器人和智能系统就只能局限于狭窄的任务,难以适应那些充满不确定性的现实环境。李飞飞教授和许多业内专家都相信,赋予机器建模和预测真实世界动态变化的能力,将使其在瞬息万变的环境中,更安全、更有效地发挥作用。这不仅将大幅提升AI的实用价值,也将为各行各业带来革命性的变革。
当前AI的盲区在哪里?
如今的人工智能擅长分析和分类,但它缺乏对“行动”和“结果”进行推理的能力。举个例子,一个语言模型可能知道“门”是什么,但它无法判断一扇门是开着还是关着,更无法预测如果门突然关上会发生什么。视觉系统能够检测到运动或物体,却无法推断出意图,也无法预判接下来会发生什么。
有外媒曾形象地描述了这个问题:现在的人工智能可以标记、分类和描述这个世界,但它无法“生活”在这个世界里。那些仅仅依靠静态图像或文本进行训练的系统,一旦遇到与训练数据不符的现实情况,就会举步维艰。
这种能力上的差距,极大地限制了人工智能在受控环境之外的应用。例如,工厂里的机器人仍然需要依赖预先设定好的布局才能运作;自动驾驶汽车在遇到罕见或意想不到的事件时,往往会显得手足无措;许多人工智能系统更多地扮演着观察者的角色,而非它们所服务环境的积极参与者。李飞飞教授强调,在人工智能获得真正的空间感知能力之前,它的作用将主要局限于狭窄的预测,而难以实现广泛的自主行为。
构建“世界模型”的努力
为了突破这些局限,研究人员正在积极开发一种被称为“世界模型”的系统。这些模型旨在理解世界是如何“运作”的,而不仅仅是“看起来”如何。它们整合了感知、模拟、空间推理和预测等多种能力,使机器能够构建一个内在的因果模型。与仅仅从文本和静态图像中学习不同,这些系统将通过环境、模拟和传感器输入进行学习,从而理解物体是如何移动、互动以及随时间变化的。
新媒网跨境获悉,目前,全球多家科技巨头和研究机构都在这一领域投入巨资并取得了显著进展。例如,谷歌旗下的人工智能公司DeepMind推出的Genie 3,就能够生成遵循物理规律的3D环境,让AI代理在虚拟世界中进行探索和学习,而不是仅仅依赖静态数据集。英伟达(NVIDIA)的Cosmos平台也遵循着类似的发展路径,它在能够高度模拟真实世界物理环境的虚拟空间中训练机器人。这些发展趋势共同反映了业界的一个广泛转变:从单纯的模式识别,转向对世界的更深层次、更具“根基”的理解。
世界经济论坛近期也将这一转变描述为人工智能的下一个重要前沿。在其2025年发布的关于空间计算、可穿戴设备和机器人技术的报告中,该组织指出,空间技术正在将数字世界与物理世界融合,创造出一个“理解上下文、运动和交互的持久智能层”。
该论坛进一步强调,传感器、计算机视觉和实时地图技术的融合,将为未来十年的人机协作奠定基础。在这样的未来中,人工智能将不再仅仅是处理数据,而是能够随着世界的实时变化而进行解释和理解。报告特别指出,空间计算领域的进步有望催生出更直观的交互界面、更智能的工业机器人,以及能够根据人与机器在空间中的移动方式动态响应的自适应城市系统。这无疑将加速智能社会建设的步伐,让科技更好地服务于人民美好生活。
这些深刻的洞察与李飞飞教授的观点不谋而合,都指向了一个核心思想:人工智能的真正进步,有赖于将智能“根植”于物理世界。空间计算为人工智能提供了所需的感官输入和情境感知能力,使其能够更安全、更有效地与其周围环境进行交互,从而将那些静态模型转变为其所服务环境的积极参与者。
未来图景:空间智能将如何改变一切?
李飞飞教授坚信,空间智能将重新定义人工智能的能力边界及其行为模式。在拥有“世界模型”之后,机器将从被动的分析者转变为积极的规划者和适应者。这将带来一系列令人兴奋的应用场景。
想象一下,在繁忙的智能仓储中,一个机器人不再会在被障碍物挡住时停滞不前,而是能够根据实时变化的库存状况,主动规划出一条新的绕行路径,高效完成任务。同样,在自动驾驶领域,未来的智能汽车将不再仅仅等待明确的交通信号,而是能够主动预判行人的移动轨迹,甚至预测其他车辆的意图,从而在复杂的城市交通中做出更智能、更安全的决策。甚至我们日常使用的数字助手,有一天也可能通过解读手势、理解空间上下文,或是共享视觉画面,为我们提供更贴心、更人性化的服务。
新媒网跨境了解到,这些进步对工业领域的影响尤为深远。有外媒近期关于空间计算和数字孪生的文章指出,企业正将人工智能与真实世界的地图数据和传感器数据相结合,在虚拟环境中对决策进行测试,然后在现实世界中加以实施。这种“数字孪生”技术,即对现实环境进行数字复制,正成为训练具备空间感知能力人工智能的绝佳场所。它允许在低风险的设置中进行高风险的模拟,从而大大降低了开发成本和潜在风险,并显著提升了生产效率和决策的精准性,为我国智能制造和产业升级提供了新的发展动能。
总而言之,人工智能的未来发展,无疑将是技术创新与社会进步的深度融合。通过赋予机器空间智能,我们正在打开一扇通往更智能、更安全、更高效世界的大门。这不仅是科技本身的巨大飞跃,更是我们迈向更加美好生活的重要一步。新媒网跨境认为,未来已来,智能浪潮的下一个篇章,正在空间智能的探索中徐徐展开。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/li-feifei-ai-cant-live-world.html


粤公网安备 44011302004783号 













