全球掘金。人形机器人市场380亿刀AI训练新机遇。

新媒网跨境获悉,随着人工智能技术在全球范围内的飞速发展,其在数字世界中的能力已日臻完善。然而,在物理现实世界中,AI如何理解并模仿人类的日常行动,正成为行业巨头们竞相攻克的新高地。一场全球性的“训练运动”正在兴起,旨在帮助AI摆脱计算机的束缚,进入我们的生活空间、办公室乃至工厂,通过学习人类的物理动作来掌握现实世界的运行规律。
在印度南部的一座工业小镇金奈,28岁的纳文·库马尔(Naveen Kumar)每天站在办公桌前,开始了他当日的工作:精确地折叠数百条手巾。他并非酒店服务员,而是一家名为Objectways的数据标注公司的员工,该公司专门为AI训练提供物理世界数据。
为了捕捉人类折叠动作的视角数据,库马尔需要在额头上佩戴一个GoPro摄像头,并严格遵循一套预设的手部动作流程。他需要用右手从桌子右侧的篮子里取出每条毛巾,然后用双手将其抖平,再整齐地折叠三次,最后将折叠好的毛巾放在桌子左角。如果单次操作耗时超过一分钟或遗漏任何步骤,他都必须从头开始。
库马尔所在的Objectways公司已向其位于美国旧金山的客户Encord发送了200个毛巾折叠视频。该公司拥有超过2000名员工,其中约一半从事自动驾驶汽车和机器人领域的传感器数据标注工作,其余则专注于生成式AI相关任务。尽管大部分员工是工程师,但他们需要轮流进行这些体力劳动,以确保数据收集的多样性。库马尔表示,由于折叠或放置物品的微小失误,有时需要删除近150到200个视频。
这些经过精心编排的动作旨在捕捉人类折叠衣物时所有的细微差别,例如手臂的伸展、手指的抓握以及布料的滑动。收集到的视频随后由库马尔及其团队进行标注。他们会在视频的不同部分绘制方框,标记毛巾,并给手臂向左或向右的移动以及每个手势进行分类。库马尔和他在卡鲁尔镇(位于印度班加罗尔以南约300英里)的同事们,正为下一代AI驱动的机器人提供着重要的“教学”素材。
美国旧金山的数据管理平台Encord的联合创始人乌尔里克·斯蒂格·汉森(Ulrik Stig Hansen)指出,公司正在为物理世界构建基础模型,机器人领域正经历一次大规模的复兴。Encord与杰夫·贝佐斯(Jeff Bezos)投资的Physical Intelligence以及Dyna Robotics等机器人公司合作。在美国,特斯拉、波士顿动力和英伟达是研发下一代人形机器人的领跑者。特斯拉已在其公司活动中使用了Optimus机器人,这些机器人似乎经常被远程控制。谷歌拥有自己的机器人AI模型,而OpenAI也在积极拓展其机器人业务。英伟达预测,未来十年内,人形机器人市场规模有望达到380亿美元。
除了这些行业巨头,还有许多不那么知名的公司也正致力于提供硬件、软件和数据支持,以期将大规模生产的多任务人形机器人变为现实。
新媒网跨境了解到,当前,驱动ChatGPT等聊天机器人的大型语言模型,通过抓取海量的线上数据,已掌握了语言、图像、音乐、编程等诸多技能。它们利用整个互联网的数据来理解事物之间的关联性,并模仿人类的行为模式,例如回答问题和创建逼真的视频。然而,物理世界的数据——例如折叠餐巾所需的力道大小——更难获取并转化为AI可用的形式。
随着机器人技术不断进步,并与能够理解物理世界运动的AI相结合,将有更多机器人进入工作场所和家庭。尽管有人担忧这可能导致失业,但乐观者认为,先进的机器人将把人类从繁琐的工作中解放出来,降低劳动力成本,并最终让人类有更多时间放松或专注于更有趣、更重要的工作。
大量公司已涌入这场“AI淘金热”,扮演着“卖铲人”的角色,寻求为所谓的“物理AI”收集数据。
其中一类公司通过让人类远程指导机器人来训练AI在现实世界中的行动。美国旧金山Micro1公司的创始人阿里·安萨里(Ali Ansari)表示,新兴的机器人数据收集正日益聚焦于远程操控(teleoperations)。人类操作员使用控制器让机器人执行特定任务,例如拿起杯子或泡茶。AI通过学习成功和失败的尝试视频来掌握这些技能。远程控制训练可以在与机器人相同的房间进行,也可以在不同的国家进行。Encord的汉森透露,东欧已计划设立大型仓库,配备大量操作员,通过操纵杆远程控制全球各地的机器人。
据外媒报道,随着需求增长,这些被一些人称为“手臂农场”(arm farms)的远程操作中心数量正在增加。位于美国加利福尼亚州的数据标注公司Deepen AI的创始人穆罕默德·穆萨(Mohammad Musa)指出,目前,机器人训练数据是真实数据和合成数据的结合,来源于人类示范、远程操控会话以及模拟场景。他补充说,虽然大部分这类工作目前仍在西方国家以外进行,但自动化和模拟技术正在逐步降低对这种外部依赖。
不过,也有观点认为,远程操控的人形机器人更多是表面功夫,而非实质性突破。尽管在他人操控下它们表现令人印象深刻,但距离完全自主操作仍有很大距离。
Micro1公司还开展“人体数据捕捉”业务。他们支付费用给人们,让他们佩戴智能眼镜,捕捉日常活动数据。这项业务已在巴西、阿根廷、印度和美国等地推行。
位于美国圣何塞的Figure AI公司与房地产巨头Brookfield合作,从10万个家庭内部收集视频片段。他们将收集人类运动数据,以训练人形机器人在人类环境中移动。该公司表示,将把其筹集的10亿美元大部分用于收集第一人称人体数据。Meta支持的Scale AI公司通过其在旧金山设立的原型实验室,也已收集了10万小时类似的机器人训练素材。
然而,训练机器人并非易事。20岁的德夫·曼达尔(Dev Mandal)在印度班加罗尔创办了一家公司,希望通过提供印度廉价劳动力来捕捉物理数据,从而满足AI训练的需求。他曾接到训练机械臂烹饪食物以及训练机器人插拔数据中心线缆的请求。但最终他不得不放弃这项业务。原因在于潜在客户对物理运动数据的收集方式有着极其具体的要求,这使得即使利用印度低成本劳动力,他也难以盈利。客户甚至会指定机器人手臂的类型、特定桌子(例如紫色灯光的桌子),并要求“一切,包括桌子的颜色,都必须完全符合他们的要求”。
尽管如此,卡鲁尔的毛巾折叠工们仍有大量工作可做。Objectways创始人拉维·尚卡尔(Ravi Shankar)表示,最近几个月,他的公司已收集并标注了机械臂折叠纸箱和T恤、以及从桌上分拣特定颜色物品的视频素材。该公司最近还开始标注来自更先进人形机器人的视频,帮助它们学习分拣和折叠混杂的毛巾和衣物,并将其放置在桌子不同角落。为此,他的团队需要标注15000个机器人执行这些任务的视频。
Objectways的员工卡文(Kavin)观察到,有时机器人的手臂会乱扔衣物,无法正确折叠,或者打散堆叠好的物品,但机器人学习的速度非常快。他认为,可能在五到十年内,机器人将能够胜任所有的工作。新媒网跨境了解到,当前物理AI训练正处于关键发展阶段,全球各大科技企业与数据服务商协同推进,人形机器人的自主行动能力有望在未来持续提升。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/humanoid-robotics-38bn-usd-ai-training-boom.html








粤公网安备 44011302004783号 














评论(0)