Meta巨资押注人形机器人:硬件不难,软件才是王道!
近年来,随着人工智能技术的飞速发展,人形机器人已成为全球科技巨头竞相追逐的新高地。一场关于未来生活方式的变革,正悄然在我们的视野中展开。新媒网跨境获悉,全球社交媒体巨头Meta(原Facebook)正将目光投向这一前沿领域,并将其视为继增强现实(AR)之后,公司层面的又一次“巨额押注”。这意味着,Meta计划在此方向上投入数十亿美元,无疑将为人形机器人的研发和商业化注入强大动力。
Meta首席技术官安德鲁·博斯沃思(Andrew Bosworth)在公司总部的一次交流中透露,今年早些时候,在首席执行官马克·扎克伯格(Mark Zuckerberg)的亲自指示下,他们已经启动了一项机器人“研究计划”。虽然此前外界已有关于该团队存在的报道,但博斯沃思在此次访谈中首次深入阐述了Meta在人形机器人领域的战略构想,这无疑为我们揭示了这家科技巨头在未来十年乃至更长时间内的宏大蓝图。
博斯沃思指出,在人形机器人的研发过程中,他认为“硬件并非最难的部分”。他进一步解释说:“我并不是说硬件不难,但它不是瓶颈所在。真正的瓶颈在于软件。” 这番话听起来有些反直觉,毕竟我们通常看到的是机器人精密的机械结构和复杂的物理动作。然而,他强调的是,如果缺乏能够理解、决策和灵活执行任务的智能软件,再先进的硬件也只能是“躯壳”。
为了更直观地说明软件的重要性,博斯沃思在交流中拿起摆在我们之间桌子上的一杯水。他解释道:“如果您对机器人技术有所了解,就会知道最棘手的问题之一便是灵巧操作。” 如今的机器人,它们可以站立、奔跑,甚至能完成一个后空翻,因为地面是一个相对稳定且可预测的环境。但在处理一个脆弱的玻璃杯时,情况就截然不同了。一个机器人试图拿起水杯,很可能“立刻将其捏碎或洒出杯中的水”。这种精细的、需要实时判断和反馈的任务,正是当前机器人软件所面临的巨大挑战。这不仅考验着机器人的感知能力,更对其在复杂环境中进行推理和精细控制提出了极高要求。
想象一下,人类拿起水杯的动作看似简单,实则涉及视觉、触觉、本体感觉等多感官信息的协同处理,以及对物体材质、重量、稳定性等因素的预判。机器人要模拟这一过程,需要一个极其智能且适应性强的软件系统,才能在不造成损坏的前提下完成任务。因此,Meta的策略非常清晰:突破软件瓶颈,才能真正解锁人形机器人的潜能。
目前,Meta内部正在积极打造自己的人形机器人,公司内部称之为“Metabot”。然而,博斯沃思的愿景远不止于此。他设想,Meta将像谷歌(美国一家科技公司)授权其安卓(Android)系统给全球各大手机制造商一样,将自己开发的人形机器人软件平台授权给其他机器人制造商使用。“我们并不在意自己是否是硬件制造商,”他解释道。这意味着Meta更倾向于成为人形机器人领域的“大脑”供应商,而非“身体”的制造者。他们的想法是,只要其他公司的机器人硬件能够满足Meta设定的技术规范,就可以使用Meta开发的软件蓝图,从而共同推动整个机器人行业的标准化和生态建设。
这种开放策略无疑具有深远的意义。它能让Meta专注于其最擅长的软件和人工智能研发,同时也能降低其他公司进入人形机器人领域的门槛,加速整个行业的创新和发展。通过构建一个开放的软件生态系统,Meta有望将自己的技术影响力扩展到更广阔的领域,就像安卓系统定义了智能手机操作系统格局一样,Meta或许也想在未来的人形机器人世界中占据主导地位。
为了实现这一宏伟目标,Meta新成立的“超级智能AI实验室”正与机器人团队紧密合作,共同致力于构建一个能够“进行软件模拟以驱动灵巧之手”的“世界模型”。这个由前Scale公司首席执行官亚历山大·王(Alexandr Wang)领导的新团队,肩负着极其重要的使命。新媒网跨境了解到,构建“世界模型”这一概念在人工智能领域备受关注。外媒报道称,谷歌DeepMind的德米斯·哈萨比斯(Demis Hassabis,英国一位人工智能研究者)也曾多次谈及他希望建立一个能为AI带来空间感知能力的“世界模型”。
那么,“世界模型”究竟是什么?简单来说,它就像是给机器人提供一个对真实世界的内在理解和模拟能力。这包括对物理规律、物体属性、环境变化以及自身行为结果的预测能力。博斯沃思解释说,目前人形机器人要做到像人类那样,能够灵巧地从牛仔裤口袋里取出钥匙,其所需的“传感器回路并不存在”。这意味着,我们缺乏足够的数据和算法,让机器人能够精确感知并理解如此复杂且微小的操作。因此,“你必须建立那个数据集。”
构建这样一个庞大而精确的数据集,是实现机器人高级灵巧操作的关键。Meta的超级智能AI实验室正试图通过先进的AI模型和模拟技术来弥补这一空白。博斯沃思表示:“如果我们没有这个实验室,如果我们不认为我们能够建立实现这一目标的模型,我们就不会做这件事。”这充分体现了Meta对其AI研发能力的信心,以及将AI与机器人技术深度融合的决心。通过在虚拟环境中进行大量的模拟训练,机器人可以学习如何在不同情境下进行精细操作,从而提升其在现实世界中的表现。
在谈到美国特斯拉(Tesla)公司首席执行官埃隆·马斯克(Elon Musk)旗下的人形机器人“擎天柱”(Optimus)所采取的方法时,博斯沃思表达了不同的看法。他认为,建造人形机器人并不能像特斯拉建造其自动驾驶平台那样。马斯克曾表示,特斯拉的自动驾驶系统不使用激光雷达(LiDAR),而是像人类一样依靠纯视觉感知,通过足够的数据来实现。博斯沃思对此评价道:“我认为特斯拉的汽车确实能够获取足够的数据。但我无法想象他们将如何获取机器人所需的数据。”
这里的关键区别在于,自动驾驶汽车的数据收集相对集中且可控,主要围绕道路交通场景。而一个通用型人形机器人所面临的环境则复杂得多,涉及到家庭、工厂、户外等各种非结构化场景,以及无数种与物品和人交互的方式。为如此广泛的应用场景收集足够且高质量的数据,其难度是指数级的。新媒网跨境认为,博斯沃思的这番话,无疑点出了当前通用型人形机器人发展所面临的核心挑战之一:如何高效、安全、合规地获取并处理海量的真实世界交互数据,以训练出真正智能、适应性强的机器人。这两种不同的技术路线和数据哲学,也反映了科技巨头在面对前沿技术时的不同思考。
为了组建一支实力雄厚的研究团队,Meta不惜重金吸引顶尖人才。前美国自动驾驶公司Cruise的首席执行官马克·惠滕(Marc Whitten)目前正领导着Meta的机器人团队。博斯沃思强调:“真正的故事在于我们所能吸引到的人才。” 他特别提到了桑巴伊·金(Sangbae Kim),一位来自麻省理工学院(美国一所著名高校)的顶级战术机器人专家,被博斯沃思誉为“目前业内最杰出的战术机器人专家”,Meta于今年早些时候将其招致麾下。
此外,博斯沃思还分享了一个趣闻:他曾成功说服了资深Meta工程师余金松(Jinsong Yu)放弃退休计划,转而加入机器人团队。余金松此前是猎户座(Orion)AR眼镜原型机软件的架构师,其在复杂系统软件设计方面的经验对于人形机器人项目至关重要。而拥有15年公司资历的宁力(Ning Li),目前则担任机器人工程团队的负责人。这些顶尖人才的汇聚,不仅彰显了Meta对人形机器人项目的重视,也预示着其在人才储备和技术实力上的雄厚基础。正是这些充满智慧和经验的工程师,将把Meta的愿景一步步变为现实,共同打造人形机器人的未来。
从博斯沃思的谈话中可以看出,Meta在人形机器人领域的具体战略仍在不断完善之中。他提到,目前在硅片层面,如英伟达(Nvidia)和高通(Qualcomm)等公司都在积极竞争,希望成为人形机器人的“骨干供应商”,而Meta“正在考虑所有这些因素”。这意味着Meta可能不会自行生产所有的芯片,而是会与这些专业的芯片制造商合作,共同为机器人提供强大的计算能力。
尽管博斯沃思将人形机器人项目与Meta在AR领域投入数十亿美元的规模相提并论,但他似乎也淡化了对机器人需要达到特斯拉“擎天柱”那种高度灵巧性的需求。他直言不讳地表示:“我认为你的手不需要有23个自由度。两个拇指会很不错。我只需要两个拇指。” 这句话非常富有洞察力,它可能暗示着Meta在初期会采取一种更为务实和聚焦的策略,即优先解决核心功能和应用场景的需求,而不是盲目追求与人类手部完全一致的复杂性。
在初期阶段,或许机器人并不需要像人类一样完成所有精细的艺术创作或外科手术,但它们可以胜任许多重复性高、危险性大或对体力有要求的任务,例如在工厂中搬运物品、辅助医疗看护,甚至在家庭环境中提供基础的服务。两个灵活的“拇指”,加上强大的软件支持,或许就足以解锁人形机器人在许多实用场景中的巨大潜力。这种渐进式的发展思路,有助于Meta在有限的资源下,更快地将机器人从实验室推向实际应用。
展望未来,人形机器人的发展不仅仅是科技的进步,更是对人类社会生活方式的深刻影响。它们有望在工业生产、医疗健康、教育培训、养老服务乃至日常家庭生活中发挥越来越重要的作用,极大地提高生产效率,改善生活品质。通过不断的技术创新,人形机器人将成为我们有益的伙伴,共同构建一个更加智能、便捷和充满活力的未来社会。当然,这一进程中,也需要我们持续关注技术伦理、安全保障等方面的挑战,确保人形机器人的发展始终以人为本,服务于人类的福祉和进步。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/meta-robot-bet-software-is-king.html

评论(0)