亚马逊AI!不足1年打造代理GPT!

近期，外媒对亚马逊通用人工智能（AGI）实验室负责人戴维·阮（David Luan）进行了一次深度访谈。此次访谈聚焦于亚马逊在AI领域，特别是代理（Agent）技术上的战略布局。作为全球科技巨头，亚马逊正将目光投向代理模型，力求在未来AI竞赛中占据领先地位。戴维·阮认为，解决代理模型问题是人工智能领域下一个“S型曲线”的关键。
DCD - David Luan

戴维·阮的AI探索之旅

戴维·阮在人工智能领域拥有丰富的经验。2017年至2020年中期，他在OpenAI担任研究与工程团队负责人，主导了GPT-2、GPT-3以及CLIP和DALL-E等里程碑式项目。他曾提及，在OpenAI的工作充满乐趣，团队成员共同探索前沿研究理念，当时的市场压力远低于2025年。

离开OpenAI后，戴维·阮加入了谷歌，负责大型语言模型（LLM）研发，训练了在当时颇具实力的PaLM模型。不久，他与团队成员共同创立了Adept，一家专注于AI代理模型的初创公司。Adept成功研发出业界首个可投入生产的计算机使用代理模型，并在2024年被亚马逊纳入麾下。戴维·阮的这次转型，被外媒形容为一种“反向人才吸纳策略”，即大型科技公司通过吸纳初创团队来避免反垄断审查。戴维·阮的决策源于对AI未来走向的深刻洞察。

GPT-5与模型能力收敛：行业共识与新视角

访谈中，戴维·阮就GPT-5的发布及其对行业的影响发表了看法。他指出，当前前沿AI模型的能力正趋于收敛。这部分归因于他的前OpenAI同事、麻省理工学院教授菲利普·伊索拉（Phillip Isola）提出的“柏拉图式表征假设”。该假设认为，正如柏拉图的洞穴寓言所示，我们所见的世界只是现实的一种映射。对于大型语言模型而言，它们通过训练数据获取现实世界的切片。随着模型在海量数据上进行训练，它们会逐渐趋同，形成对共享现实的统一理解。因此，所有大型语言模型最终将收敛到同一世界模型。这种趋势在当前前沿实验室交付的模型中已得到印证。

戴维·阮同时强调，基准测试的意义正逐渐减弱。他认为，当前行业对基准分数的过度追求，如同早期数码相机行业的“像素大战”，虽然数字更高，但与实际效果的相关性并不强。他观察到，当今人工智能领域缺乏创造力的核心在于，通用人工智能远不止聊天和代码。尽管聊天和代码是大型语言模型最早成功落地的应用场景，但许多更具价值的应用和底层模型能力尚未被有效衡量。他提出，与其在提升创意写作或国际数学奥林匹克竞赛成绩上投入精力，不如将目光投向更广阔的问题领域，例如代理模型所能解决的更广泛问题。

他还注意到，用户对AI模型的“情感依恋”现象日益普遍。他提到，早在2020年谷歌内部的LaMDA或Meena项目时期，员工就已开始对AI系统产生个人情感。他认为，人类天生擅长将事物拟人化，因此人们对特定模型检查点形成情感联结并不意外。

亚马逊对AGI的独特诠释

谈及AGI，戴维·阮回忆起OpenAI在2018年对AGI的定义：能胜任人类经济价值任务的系统。然而，他认为当前AI领域已远超此范畴。如今，他每天工作的动力并非取代人类，而是构建一个能够为每位知识工作者提供强大协助的“通用队友”。他所追求的AGI，是一个能够帮助人类在计算机上完成任何想做的事情的模型。他强调，这一定义更具实际操作性，并聚焦于为人类提供帮助。

戴维·阮认为，如果一个AI系统能接管人类日常任务中大量的执行工作，这将极大地提升人类的时间效率。他反驳了萨姆·奥特曼（Sam Altman，OpenAI首席执行官）将AGI定义为能够自我改进的模型的观点，指出自我改进固然有趣，但其目的应是何物？从用户的角度看，AGI能否自我改进并非核心，更重要的是它能否成为一个能够带来巨大助益的超级通用技术，并能被普罗大众广泛使用。他认为，如果一个代理模型能处理用户在计算机上需要完成的任何有用任务，就能为用户带来巨大的优势，因为当今生活的大部分已数字化。

对于亚马逊而言，AGI的含义远不止购物。戴维·阮解释道，从计算的角度看，过去的构建模块是租赁服务器、存储和编写代码。然而，计算的构建模块正在发生改变，未来代码将由AI编写，而智能和决策将由AI完成。在这种趋势下，亚马逊必须擅长解决代理模型问题，因为代理将成为计算的原子级构建块。这将释放巨大的经济价值，并与亚马逊在云计算和基础设施建设方面的既有优势完美契合。

破解代理模型的可靠性瓶颈：亚马逊的创新路径

戴维·阮承认，尽管业界普遍认为代理模型是行业未来，但当前大多数用户体验并不理想。他指出，当前的代理模型往往只是“多了一步”的聊天机器人，可靠性不高，例如：某些企业为了避免人工客服而使用聊天机器人，或是浏览器插件式的计算机使用代理，其效率可能低于人工操作，并且出现错误的概率较高。

他用一个药物发现任务为例，阐释了代理模型的真正潜力。如果向2025年3月发布的GPT-5询问该问题，它能提供一篇格式工整的学术文献总结。但这并非真正的代理模型。戴维·阮心目中的代理模型，是一个能与湿实验室（Wet Lab）设备连接的系统，它能阅读所有文献、使用实验室的科学设备、提出并执行最优实验方案、分析结果并根据反馈进行迭代，直至实际达成目标。这种代理模型所能带来的效率提升，远超当前行业水平。

对于大型语言模型的固有局限性，如幻觉和“一本正经地胡说八道”，戴维·阮认为这正是大型语言模型与代理模型训练方式的根本区别。大型语言模型主要通过“下一个词预测”进行训练，本质上是行为克隆或模仿学习，它们学习的是“看到类似语境就说出某个词”，而非“为什么某个词是正确答案”的因果机制。这种训练方式适用于聊天和创意场景，但若要成为成功的决策代理，模型必须学习真实的因果机制，即“如果我做X，结果是Y”。

因此，亚马逊AGI实验室的研究路线图是训练代理模型学习行为的后果。这需要超越简单的行为克隆和文本复制，转变为现实世界中的反复试错。戴维·阮引用了OpenAI前同事安德烈·卡帕西（Andrej Karpathy）的比喻：训练一个AI打网球，不应让它99%的时间看网球视频，而只用1%的时间打网球。亚马逊的方法是“大规模自博弈”（Large-scale Self-play），即创建海量的强化学习（RL）训练场（RL Gyms）。这些训练场模拟了知识工作者可能遇到的各种真实环境，例如：Salesforce系统、企业资源规划（ERP）、计算机辅助设计（CAD）程序、电子病历系统、会计软件等。

通过在这些模拟环境中设定目标并尝试解决问题，代理模型在成功完成任务时获得奖励和反馈，从而学习其行为的真实后果。例如，模型会学习如何正确进行资产折旧、如何在CAD中准确制作零件，或如何成功预订航班。戴维·阮认为，这是实现通用人工智能的关键缺失环节，亚马逊正在大规模推广这种训练方法。

亚马逊内部实践与未来图景

戴维·阮表示，这种训练方法在行业内独树一帜。他认为，为了突破互联网上有限的“自由浮动数据”对模型训练的限制，未来必须采用这种方法。亚马逊在该领域取得显著进展，得益于Adept团队长期深耕代理模型问题。

提及“训练场”（Gyms），戴维·阮回忆起OpenAI早期一个名为OpenAI Gym的有用项目，它是一系列视频游戏和机器人任务集合。受此启发，亚马逊团队思考：既然模型已足够智能，为何不将人类在计算机上完成的实际任务放入这些“训练场”，让模型从中学习？他认为这种方法同样可以推广到机器人领域。

亚马逊的最终目标是开发一个“磐石般可靠”（99%可靠）的代理模型和系统，用于处理计算机上的各种有价值的知识工作任务。这将作为AWS上的一项服务，支撑未来大量的实用应用程序。

针对消费者端，外媒提到Perplexity首席执行官阿拉温德·斯里尼瓦斯（Aravind Srinivas）曾提出浏览器界面是代理模型普及的关键。戴维·阮认同，当前的聊天机器人并非长期解决方案，尤其是对于需要执行操作的系统而言。他认为，人类与AI的交互界面需要创新，不应仅限于一对一的问答模式。理想的交互应是用户与AI在共享画布上协同工作，实现并行的、协作式的交互。

新媒网跨境了解到，亚马逊内部正大力推动代理模型的广泛应用。由于亚马逊的业务涵盖了几乎所有知识工作的有用领域，内部团队对这些系统表现出极大的热情。戴维·阮透露，自2025年3月发布研究预览版Nova Act以来，该产品功能已大幅提升。亚马逊始终秉持“先内部测试，再推广”的原则，将产品率先在内部团队中进行打磨。

Nova Act在企业级应用中展现出高可靠性。外媒提及，其产品可靠性已达到95%以上，远超其他代理产品平均60%的可靠性。戴维·阮认为，可靠性是阻碍代理模型普及的关键瓶颈。通过极端关注可靠性，Nova Act已成功应用于医生和护士注册、差旅预订自动化（例如与Navan公司合作），以及自动化高达93个步骤的质量保证工作流。

戴维·阮乐观地表示，距离“为强化学习代理模型打造一个GPT”的时刻已不足一年。他认为，当前团队在训练循环中每天都在取得小而重要的突破，速度不断加快。

关于GPT-5发布后“AI进展是否会放缓”的讨论，戴维·阮断然否定。他认为，当一个S型曲线（如预训练阶段）趋于平缓时，新的S型曲线就会出现。他坚信，代理模型是下一个S型曲线。亚马逊独特的训练方式——大规模自博弈，正是实现下一次巨大加速的主要途径。

他指出，每次模型训练配方发生变化，都会为新入局者带来巨大的机会，使其能够实现跨越式发展，而非追赶旧有配方。因为对于现有巨头而言，旧有配方反而可能成为一种“包袱”。例如，OpenAI率先开创了大型模型和大型语言模型领域，但最初的文本训练配方在引入人类反馈强化学习（RLHF）后，又面临多模态输入的挑战，这为其他竞争者提供了追赶的机会。

新媒网跨境认为，亚马逊对代理模型的深入研究与实践，不仅是其自身AI战略的重要组成部分，也预示着AI领域未来发展的重要方向。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/17607.html