亚马逊AI!不足1年打造代理GPT!

2025-08-22Amazon

Image

近期,外媒对亚马逊通用人工智能(AGI)实验室负责人戴维·阮(David Luan)进行了一次深度访谈。此次访谈聚焦于亚马逊在AI领域,特别是代理(Agent)技术上的战略布局。作为全球科技巨头,亚马逊正将目光投向代理模型,力求在未来AI竞赛中占据领先地位。戴维·阮认为,解决代理模型问题是人工智能领域下一个“S型曲线”的关键。
DCD - David Luan

戴维·阮的AI探索之旅

戴维·阮在人工智能领域拥有丰富的经验。2017年至2020年中期,他在OpenAI担任研究与工程团队负责人,主导了GPT-2、GPT-3以及CLIP和DALL-E等里程碑式项目。他曾提及,在OpenAI的工作充满乐趣,团队成员共同探索前沿研究理念,当时的市场压力远低于2025年。

离开OpenAI后,戴维·阮加入了谷歌,负责大型语言模型(LLM)研发,训练了在当时颇具实力的PaLM模型。不久,他与团队成员共同创立了Adept,一家专注于AI代理模型的初创公司。Adept成功研发出业界首个可投入生产的计算机使用代理模型,并在2024年被亚马逊纳入麾下。戴维·阮的这次转型,被外媒形容为一种“反向人才吸纳策略”,即大型科技公司通过吸纳初创团队来避免反垄断审查。戴维·阮的决策源于对AI未来走向的深刻洞察。

GPT-5与模型能力收敛:行业共识与新视角

访谈中,戴维·阮就GPT-5的发布及其对行业的影响发表了看法。他指出,当前前沿AI模型的能力正趋于收敛。这部分归因于他的前OpenAI同事、麻省理工学院教授菲利普·伊索拉(Phillip Isola)提出的“柏拉图式表征假设”。该假设认为,正如柏拉图的洞穴寓言所示,我们所见的世界只是现实的一种映射。对于大型语言模型而言,它们通过训练数据获取现实世界的切片。随着模型在海量数据上进行训练,它们会逐渐趋同,形成对共享现实的统一理解。因此,所有大型语言模型最终将收敛到同一世界模型。这种趋势在当前前沿实验室交付的模型中已得到印证。

戴维·阮同时强调,基准测试的意义正逐渐减弱。他认为,当前行业对基准分数的过度追求,如同早期数码相机行业的“像素大战”,虽然数字更高,但与实际效果的相关性并不强。他观察到,当今人工智能领域缺乏创造力的核心在于,通用人工智能远不止聊天和代码。尽管聊天和代码是大型语言模型最早成功落地的应用场景,但许多更具价值的应用和底层模型能力尚未被有效衡量。他提出,与其在提升创意写作或国际数学奥林匹克竞赛成绩上投入精力,不如将目光投向更广阔的问题领域,例如代理模型所能解决的更广泛问题。

他还注意到,用户对AI模型的“情感依恋”现象日益普遍。他提到,早在2020年谷歌内部的LaMDA或Meena项目时期,员工就已开始对AI系统产生个人情感。他认为,人类天生擅长将事物拟人化,因此人们对特定模型检查点形成情感联结并不意外。

亚马逊对AGI的独特诠释

谈及AGI,戴维·阮回忆起OpenAI在2018年对AGI的定义:能胜任人类经济价值任务的系统。然而,他认为当前AI领域已远超此范畴。如今,他每天工作的动力并非取代人类,而是构建一个能够为每位知识工作者提供强大协助的“通用队友”。他所追求的AGI,是一个能够帮助人类在计算机上完成任何想做的事情的模型。他强调,这一定义更具实际操作性,并聚焦于为人类提供帮助。

戴维·阮认为,如果一个AI系统能接管人类日常任务中大量的执行工作,这将极大地提升人类的时间效率。他反驳了萨姆·奥特曼(Sam Altman,OpenAI首席执行官)将AGI定义为能够自我改进的模型的观点,指出自我改进固然有趣,但其目的应是何物?从用户的角度看,AGI能否自我改进并非核心,更重要的是它能否成为一个能够带来巨大助益的超级通用技术,并能被普罗大众广泛使用。他认为,如果一个代理模型能处理用户在计算机上需要完成的任何有用任务,就能为用户带来巨大的优势,因为当今生活的大部分已数字化。

对于亚马逊而言,AGI的含义远不止购物。戴维·阮解释道,从计算的角度看,过去的构建模块是租赁服务器、存储和编写代码。然而,计算的构建模块正在发生改变,未来代码将由AI编写,而智能和决策将由AI完成。在这种趋势下,亚马逊必须擅长解决代理模型问题,因为代理将成为计算的原子级构建块。这将释放巨大的经济价值,并与亚马逊在云计算和基础设施建设方面的既有优势完美契合。

破解代理模型的可靠性瓶颈:亚马逊的创新路径

戴维·阮承认,尽管业界普遍认为代理模型是行业未来,但当前大多数用户体验并不理想。他指出,当前的代理模型往往只是“多了一步”的聊天机器人,可靠性不高,例如:某些企业为了避免人工客服而使用聊天机器人,或是浏览器插件式的计算机使用代理,其效率可能低于人工操作,并且出现错误的概率较高。

他用一个药物发现任务为例,阐释了代理模型的真正潜力。如果向2025年3月发布的GPT-5询问该问题,它能提供一篇格式工整的学术文献总结。但这并非真正的代理模型。戴维·阮心目中的代理模型,是一个能与湿实验室(Wet Lab)设备连接的系统,它能阅读所有文献、使用实验室的科学设备、提出并执行最优实验方案、分析结果并根据反馈进行迭代,直至实际达成目标。这种代理模型所能带来的效率提升,远超当前行业水平。

对于大型语言模型的固有局限性,如幻觉和“一本正经地胡说八道”,戴维·阮认为这正是大型语言模型与代理模型训练方式的根本区别。大型语言模型主要通过“下一个词预测”进行训练,本质上是行为克隆或模仿学习,它们学习的是“看到类似语境就说出某个词”,而非“为什么某个词是正确答案”的因果机制。这种训练方式适用于聊天和创意场景,但若要成为成功的决策代理,模型必须学习真实的因果机制,即“如果我做X,结果是Y”。

因此,亚马逊AGI实验室的研究路线图是训练代理模型学习行为的后果。这需要超越简单的行为克隆和文本复制,转变为现实世界中的反复试错。戴维·阮引用了OpenAI前同事安德烈·卡帕西(Andrej Karpathy)的比喻:训练一个AI打网球,不应让它99%的时间看网球视频,而只用1%的时间打网球。亚马逊的方法是“大规模自博弈”(Large-scale Self-play),即创建海量的强化学习(RL)训练场(RL Gyms)。这些训练场模拟了知识工作者可能遇到的各种真实环境,例如:Salesforce系统、企业资源规划(ERP)、计算机辅助设计(CAD)程序、电子病历系统、会计软件等。

通过在这些模拟环境中设定目标并尝试解决问题,代理模型在成功完成任务时获得奖励和反馈,从而学习其行为的真实后果。例如,模型会学习如何正确进行资产折旧、如何在CAD中准确制作零件,或如何成功预订航班。戴维·阮认为,这是实现通用人工智能的关键缺失环节,亚马逊正在大规模推广这种训练方法。

亚马逊内部实践与未来图景

戴维·阮表示,这种训练方法在行业内独树一帜。他认为,为了突破互联网上有限的“自由浮动数据”对模型训练的限制,未来必须采用这种方法。亚马逊在该领域取得显著进展,得益于Adept团队长期深耕代理模型问题。

提及“训练场”(Gyms),戴维·阮回忆起OpenAI早期一个名为OpenAI Gym的有用项目,它是一系列视频游戏和机器人任务集合。受此启发,亚马逊团队思考:既然模型已足够智能,为何不将人类在计算机上完成的实际任务放入这些“训练场”,让模型从中学习?他认为这种方法同样可以推广到机器人领域。

亚马逊的最终目标是开发一个“磐石般可靠”(99%可靠)的代理模型和系统,用于处理计算机上的各种有价值的知识工作任务。这将作为AWS上的一项服务,支撑未来大量的实用应用程序。

针对消费者端,外媒提到Perplexity首席执行官阿拉温德·斯里尼瓦斯(Aravind Srinivas)曾提出浏览器界面是代理模型普及的关键。戴维·阮认同,当前的聊天机器人并非长期解决方案,尤其是对于需要执行操作的系统而言。他认为,人类与AI的交互界面需要创新,不应仅限于一对一的问答模式。理想的交互应是用户与AI在共享画布上协同工作,实现并行的、协作式的交互。

新媒网跨境了解到,亚马逊内部正大力推动代理模型的广泛应用。由于亚马逊的业务涵盖了几乎所有知识工作的有用领域,内部团队对这些系统表现出极大的热情。戴维·阮透露,自2025年3月发布研究预览版Nova Act以来,该产品功能已大幅提升。亚马逊始终秉持“先内部测试,再推广”的原则,将产品率先在内部团队中进行打磨。

Nova Act在企业级应用中展现出高可靠性。外媒提及,其产品可靠性已达到95%以上,远超其他代理产品平均60%的可靠性。戴维·阮认为,可靠性是阻碍代理模型普及的关键瓶颈。通过极端关注可靠性,Nova Act已成功应用于医生和护士注册、差旅预订自动化(例如与Navan公司合作),以及自动化高达93个步骤的质量保证工作流。

戴维·阮乐观地表示,距离“为强化学习代理模型打造一个GPT”的时刻已不足一年。他认为,当前团队在训练循环中每天都在取得小而重要的突破,速度不断加快。

关于GPT-5发布后“AI进展是否会放缓”的讨论,戴维·阮断然否定。他认为,当一个S型曲线(如预训练阶段)趋于平缓时,新的S型曲线就会出现。他坚信,代理模型是下一个S型曲线。亚马逊独特的训练方式——大规模自博弈,正是实现下一次巨大加速的主要途径。

他指出,每次模型训练配方发生变化,都会为新入局者带来巨大的机会,使其能够实现跨越式发展,而非追赶旧有配方。因为对于现有巨头而言,旧有配方反而可能成为一种“包袱”。例如,OpenAI率先开创了大型模型和大型语言模型领域,但最初的文本训练配方在引入人类反馈强化学习(RLHF)后,又面临多模态输入的挑战,这为其他竞争者提供了追赶的机会。

新媒网跨境认为,亚马逊对代理模型的深入研究与实践,不仅是其自身AI战略的重要组成部分,也预示着AI领域未来发展的重要方向。

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/17607.html

评论(0)

暂无评论,快来抢沙发~
外媒深度访谈亚马逊通用人工智能(AGI)实验室负责人戴维·阮,聚焦亚马逊在AI代理技术上的战略布局。戴维·阮认为,解决代理模型问题是人工智能领域下一个“S型曲线”的关键。亚马逊正通过大规模自博弈训练代理模型,并已在内部应用中取得显著进展,目标是打造一个“磐石般可靠”的代理模型服务于AWS。
发布于 2025-08-22
查看人数 1640
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。