机器人版ChatGPT:估值56亿!颠覆自动化?

近年来,随着人工智能技术的飞速发展,全球科技界正掀起一场关于“通用型机器人智能”的变革浪潮。这不仅仅是让机器执行单一任务,而是赋予它们像人类一样学习、适应和解决复杂问题的能力。特别是以大型语言模型(LLM)为代表的通用人工智能在2023年展现出惊人潜力之后,人们开始思考,这种“基础模型”的理念能否应用于机器人领域,让机器人也能拥有一个能处理各种物理任务的“大脑”?美国旧金山一家名为Physical Intelligence的初创公司,正是在这一前沿领域深度探索,试图打造出硅谷乃至全球瞩目的“机器人大脑”。
走进位于美国旧金山的Physical Intelligence总部,没有传统科技公司的豪华前台,也看不到醒目的企业标识,只有门上一个不甚显眼的“π”符号,透露着这里的与众不同。这里是一个巨大的混凝土空间,被随意摆放的木质长桌和各种设备打破了冷峻感。有的桌子摆满了零食和调味品,显然是员工用餐区;而更多的桌面则堆满了显示器、机器人零件、缠绕的电线,以及处于不同“学习”状态的机械臂。
亲身探访时,我看到一个机械臂正尝试叠一条黑色裤子,虽然进展不顺利;另一个机械臂则努力将一件衬衫翻面,那股子专注劲儿似乎在说:“我迟早会成功,只是不是今天。”而第三个机械臂似乎找到了自己的“使命”,它熟练地削着西葫芦皮,并准确地将削下的碎片放入另一个容器中,效率颇高。
Physical Intelligence的联合创始人之一、加州大学伯克利分校副教授谢尔盖·莱文(Sergey Levine)向我解释道:“你可以把它想象成机器人的ChatGPT。”他指着眼前这些机械臂的“芭蕾表演”说道。莱文教授是一位戴着眼镜、和蔼可亲的学者,习惯了向非专业人士解释复杂的概念。他口中的“机器人版ChatGPT”,正是这家公司所追求的愿景。
探秘前沿:Physical Intelligence的创新路径
莱文教授进一步阐释了Physical Intelligence的核心方法论:这是一个数据驱动的持续循环过程。机器人从公司总部以及其他地点(如仓库、家庭等)收集大量任务数据,这些数据随后用于训练通用的机器人基础模型。每当研究人员训练出一个新模型,它就会被部署到这些工作站进行评估测试。
比如那个叠裤子的机械臂,可能就是某个研究员正在进行的实验项目;翻衬衫的机械臂亦是如此。而削西葫芦的机械臂,则可能是在测试模型能否泛化到不同蔬菜上,即它是否能掌握“削皮”这一基本动作的精髓,从而也能处理从未见过的苹果或土豆。
该公司还在总部和其他地方运营着一个“测试厨房”,使用市售的普通硬件,让机器人接触到各种不同的环境和挑战。旁边一台看似为员工准备的意式浓缩咖啡机,实际上也是机器人的学习对象。莱文澄清说,机器人学习制作泡沫拿铁,其产生的“泡沫”和过程都是数据,而非给现场几十位工程师准备的福利。这些工程师大多沉浸在电脑前或围绕着他们的机械实验。
值得注意的是,这些硬件设备都刻意选择了“朴实无华”的型号。莱文透露,这些机械臂的售价约为3500美元,这其中供应商的溢价已经很高。如果由公司内部生产,材料成本甚至可以降到1000美元以下。他提到,大约在2023年左右,任何一位机器人专家都会对这些简陋的设备能完成任务感到震惊。但这就是他们的重点:高超的智能可以弥补硬件上的不足。这反映出一种重要的趋势,即未来的机器人发展,可能更侧重于软件和算法的突破,而非仅仅依赖昂贵的硬件堆砌。
掌舵者:Lachy Groom的远见与布局
在莱文教授离开后,我见到了Physical Intelligence的另一位联合创始人,拉奇·格鲁姆(Lachy Groom)。他以一种高效而专注的姿态穿梭于办公室中,显然是身兼数职。年仅31岁的格鲁姆,依旧保持着硅谷“少年英才”的活力。他在年仅13岁时就在家乡澳大利亚创办了第一家公司,并在9个月后将其成功出售(这也解释了办公室里为何会有澳大利亚特产Vegemite酱)。
格鲁姆此前的职业生涯也颇为亮眼。作为Stripe的早期员工,他积累了丰富的行业经验。离开Stripe后,他在大约五年的时间里转型成为一名天使投资人,成功投资了Figma、Notion、Ramp和Lattice等知名公司。尽管投资业绩斐然,但格鲁姆从不满足于此,他始终在寻找一个能够全身心投入并改变世界的项目。
2021年,他对Standard Bots公司的投资,重新点燃了他儿时对乐高机器人的热爱。格鲁姆坦言,作为投资者,他“度假的时间多得多”,但投资只是他保持活跃、结识人才的方式,并非终极目标。他表示:“离开Stripe后,我寻找了五年才找到这家值得全身心投入的公司。”他认为,一个项目成功的关键在于“好的想法、好的时机和好的团队”的稀有组合,“光有执行力,而没有好的想法,最终也只是事倍功半。”
格鲁姆最终被莱文教授和切尔西·芬恩(Chelsea Finn,莱文的前博士生,现斯坦福大学机器人学习实验室负责人)的学术研究深深吸引。这两位学者的名字不断出现在机器人领域最前沿的研究中。当他听说他们可能正在筹划一个项目时,他找到了前谷歌DeepMind研究员、同时也在斯坦福大学任教的卡罗尔·豪斯曼(Karol Hausman),并很快确认了他的参与。格鲁姆回忆道:“那次会面结束后,我立刻感觉,就是它了!”
资本青睐:独特融资策略与商业化展望
成立于2024年的Physical Intelligence,在短短两年内已经累计融资超过10亿美元,公司估值达到56亿美元,获得了Khosla Ventures、Sequoia Capital和Thrive Capital等知名投资机构的青睐。当被问及资金使用情况时,格鲁姆解释说,公司实际的现金消耗并不大,大部分资金投入都用于购买强大的计算资源。他也坦言,在合适的条件下,如果有合适的合作伙伴,他们会继续融资。他强调:“我们投入资金的上限几乎是无限的,因为总有更多的计算资源可以用于解决问题。”
与其他初创公司不同寻常的是,格鲁姆并未向投资者提供明确的商业化时间表。他表示:“我不会给投资者具体的商业化答案。”他承认这种做法在行业内显得有些“奇怪”,但投资者们似乎也接受了这种模式。他认为,正是这种对底层技术研发的专注,才使得公司具备在未来实现突破的潜力。而目前充足的资金,也为公司争取了宝贵的研发时间。
那么,如果没有明确的商业化时间表,Physical Intelligence的战略是什么?另一位联合创始人、同样来自谷歌DeepMind的权望(Quan Vuong)解释说,他们的策略围绕着“跨平台学习”和“多样化数据源”展开。这意味着,即使未来出现全新的硬件平台,也不需要从零开始收集数据进行训练,而是可以直接将模型已有的知识进行迁移。他指出:“将自主能力导入新的机器人平台,无论该平台是什么类型,其边际成本都将大大降低。”
目前,Physical Intelligence已与少量不同垂直领域的公司展开合作,以测试其系统在实际自动化场景中的表现,包括物流、杂货店和一家位于街对面的巧克力制造商。权望表示,在某些场景下,他们的系统已经能够胜任。凭借“任何平台、任何任务”的通用化方法,公司在广阔的应用领域中正逐步验证其能力,并开始解决那些已经成熟的自动化任务。
行业竞逐:通用机器人智能的多元探索
Physical Intelligence并非唯一追逐通用型机器人智能的公司。就像2023年LLM模型风靡全球一样,建立通用型机器人智能基础模型的竞赛正日益白热化。这种基础模型可以支撑更专业化的应用开发。
例如,总部位于美国匹兹堡的Skild AI公司,成立于2023年。在2026年上半年,该公司刚刚完成了14亿美元的融资,估值高达140亿美元。与Physical Intelligence专注于纯粹研究的路线不同,Skild AI采取了显著不同的商业化路径。他们已经将其“全能型”(omni-bodied)Skild大脑商业化部署,并声称在2025年短短几个月内就在安保、仓储和制造业等领域创造了3000万美元的营收。
Skild AI甚至在公开场合对竞争对手提出质疑,在其博客中指出,大多数“机器人基础模型”不过是“伪装”的视觉语言模型,它们缺乏“真正的物理常识”,因为它过于依赖互联网规模的预训练数据,而非基于物理仿真和真实机器人数据。这体现了两家公司在核心理念上的深刻分歧:
| 特征 | Physical Intelligence | Skild AI |
|---|---|---|
| 核心策略 | 专注于纯粹的基础研究,抵制短期商业化诱惑,致力于开发卓越的通用智能。 | 快速商业化部署,通过实际应用产生数据飞轮,不断优化模型。 |
| 数据来源 | 主要通过内部和合作站点收集机器人物理交互数据,强调跨平台学习。 | 依赖广泛的实际部署数据,同时可能包含更多基于互联网的视觉语言模型数据。 |
| 商业化路径 | 不设明确商业化时间表,早期通过少量行业合作试点验证。 | 2025年已实现规模化商业营收,覆盖安保、仓储、制造等领域。 |
| 哲学差异 | 认为纯粹研究能带来更深层次、更通用的智能突破。 | 认为商业部署能快速积累真实世界数据,加速模型迭代和实用性。 |
| 目前营收 | 暂无明确的规模化营收披露。 | 2025年数月内实现3000万美元营收。 |
Skild AI押注通过商业部署可以创造数据飞轮,让模型在每一个真实世界的用例中得到改进。而Physical Intelligence则坚信,抵制短期商业化的诱惑,能够让其产出更卓越的通用智能。究竟哪种路径“更正确”,可能需要数年时间才能见分晓。
挑战与机遇:未来之路
目前,Physical Intelligence以格鲁姆所描述的“不寻常的清晰度”运营着。他表示:“这是一家非常纯粹的公司。研究员有了需求,我们就会去收集数据来支持,或者提供新的硬件等等,然后我们去实现它。它不是由外部因素驱动的。”公司最初设想了一个5到10年的发展路线图,但格鲁姆透露,在短短18个月内,他们就已经超越了原定目标。公司目前拥有约80名员工,并计划继续发展,尽管格鲁姆希望“尽可能缓慢地”扩张。
格鲁姆认为,目前最具挑战性的是硬件方面。“硬件确实非常困难。我们所做的每一件事都比一家软件公司要困难得多。”硬件容易损坏,到货速度缓慢,这都会延迟测试进程。此外,安全考量也让一切变得更加复杂。
当格鲁姆急匆匆地赶往下一个会议时,我留下来继续观察这些机器人练习。叠裤子的机器人依然没能完全成功,衬衫也固执地保持着正面朝外的状态,而西葫芦皮则堆积如山。
当然,围绕这项技术也存在一些显而易见的问题,例如,人们是否真的需要在厨房里让机器人削蔬菜?安全问题如何保障?家中的宠物是否会对这些机械入侵者感到不安?投入如此多的时间与资金,究竟是为了解决真正重要的难题,还是会制造出新的问题?与此同时,外界也对Physical Intelligence的进展、其愿景的可行性,以及押注通用智能而非特定应用是否明智,抱持着各种疑问。
但如果格鲁姆有任何疑虑,他丝毫没有表现出来。他与那些几十年来一直在研究这一领域的人合作,他们都坚信时机终于成熟了,而这正是他所需的一切。此外,从硅谷产业诞生之初,这里就一直支持着像格鲁姆这样的创新者,即使没有明确的商业化路径,没有时间表,甚至不确定市场最终会走向何方,硅谷也相信他们最终能找到出路。这种模式并非总能成功,但一旦成功,它往往能证明过去无数次失败的尝试都是值得的。
对于国内跨境行业的从业者而言,Physical Intelligence和Skild AI等公司在通用型机器人智能领域的探索,预示着未来自动化和智能化的高度融合。这将不仅改变制造业和物流业的形态,更可能渗透到居家服务、零售、农业等更广泛领域。未来,能够实现跨任务、跨平台学习的机器人技术,将极大地降低自动化部署的门槛和成本,为全球产业链的升级带来新的机遇。关注此类前沿技术动态,有助于我们把握未来商业模式和竞争力的制高点。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/robot-chatgpt-56b-valuation-disrupts-auto.html


粤公网安备 44011302004783号 











