AI智能体狂飙：700人工作量！30%代码它包办！

AI智能体，这个听起来充满未来感的词汇，正一步步从科幻走向现实，虽然前路依旧漫漫，但其发展的步伐却从未停歇。

梦想照进现实的起点

谈及AI智能体的概念，许多人脑海中首先浮现的或许就是电影《钢铁侠》中那个无所不能的人工智能管家——贾维斯（J.A.R.V.I.S.）。虽然现实并非电影，但贾维斯无疑为人们描绘了一个理想中的AI智能体形态：它能未卜先知，在你开口之前便洞察需求；能从海量数据中抽丝剥茧，提炼出独到见解；更能为你出谋划策，甚至独立完成业务中的特定环节。

当然，对于AI智能体的确切定义，业界仍有诸多探讨，但其核心共识在于：它超越了传统聊天机器人的范畴，能够自主完成多步骤、复杂的任务，而无需用户持续地来回指令。它仿佛拥有自我规划的能力，能将庞大的最终目标拆解为一系列子任务，并逐一攻克。这份曾被视为遥不可及的幻想，如今正以超乎想象的速度接近现实。然而，对于普通用户而言，要实现真正的实用化，仍有诸多挑战亟待克服。

“AI智能体”一词，其实早在业界流传多年，但在2023年，它才真正成为科技圈的热门话题。那一年，围绕AI智能体的概念讨论达到了高潮，人们热衷于探索其可能性，并积极寻找将其变为现实的路径。然而，彼时成功的应用案例却寥寥无几。紧接着的2024年，成为了AI智能体的“部署元年”，各大科技公司开始将代码投入实际应用场景，尝试验证其能力。但彼时的反馈却不尽如人意，常常伴随着错误提示，显示出技术尚不成熟的一面。

AI智能体热潮的真正引爆点，可以追溯到2024年2月。当时，欧洲一家名为Klarna的金融科技公司对外宣布了一项惊人成就：其由OpenAI技术驱动的AI客服助理，在一个月内成功完成了700名全职客服人员的工作量，并自动化处理了该公司三分之二的客户服务聊天。这一数据，在接下来的数月里，几乎成为了所有AI行业交流中的必提案例，无疑为AI智能体的巨大潜力提供了强有力的注脚。

此后，这股热潮愈演愈烈，从未消退。随后的几个月里，亚马逊、Meta、谷歌、微软等各大科技巨头的高管们，在每一场财报电话会议中，都反复强调其对开发实用且成功的AI智能体的承诺。他们不仅口头宣誓，更付诸行动，投入巨额资金和资源，力求将这一愿景变为现实。

从憧憬到现实的路径

最初的设想是，AI智能体有朝一日能够包办一切：从预订旅行行程，到为你的商务演示生成定制化的视觉内容。一个理想的工具，甚至能根据所有参与者的日程、饮食偏好和特殊要求，智能地找出与朋友聚会的最佳时间和地点，然后自动预订餐厅，并为每个人创建日历提醒。
未来设想

在目前的实际应用中，AI编程领域无疑是AI智能体行业的一大亮点。如果你询问业界人士，目前有哪些真实、成功且不让人感到困扰的AI智能体应用案例，他们几乎无一例外地会指向AI编程——这曾是他们唯一能拿得出手的具体成果。许多工程师已将AI智能体融入日常编程工作中，并且普遍认为其表现相当出色。事实上，AI编程智能体表现之优秀，甚至在微软和谷歌这样的科技巨头中，高达30%的代码已由AI智能体完成。对于OpenAI和Anthropic等这类资金消耗巨大的初创公司而言，面向企业客户提供的AI编程工具，更是其重要的营收来源之一。

因此，在最近一段时间，AI编程一直是AI智能体最主要的实际应用场景。但显而易见，这并非直接面向普通消费者的产品。AI智能体最初的愿景，是要成为“普罗大众”的万能助手。尽管我们尚未完全实现这一目标，但在2025年，我们比以往任何时候都更接近它。

2024年10月，Anthropic公司率先推出了“计算机使用”（Computer Use）功能，这使得其Claude智能体能够像人类一样操作电脑——包括浏览网页、进行搜索、访问不同平台，并为用户完成复杂的任务。尽管业界普遍认为这项工具是技术上的一大进步，但早期用户反馈也指出，实际使用中仍有许多不尽如人意之处。快进到2025年1月，OpenAI发布了其类似产品“Operator”，并将其宣传为一款能够填写表格、订购杂货、预订旅行以及制作表情包的工具。然而，与Anthropic的“计算机使用”类似，许多用户在使用后表示，“Operator”在实际操作中依然存在Bug、运行缓慢且效率不高的问题。尽管如此，这仍然被视为AI智能体发展道路上迈出的重要一步。次月，OpenAI又推出了“深度研究”（Deep Research）——一款能够为用户就任何主题生成长篇研究报告的AI智能体工具，这同样推动了技术向前发展。尽管有人认为其研究报告在长度上比内容更令人印象深刻，但也有部分用户对此深感震撼。到了7月，OpenAI更是将“深度研究”和“Operator”整合为一体，推出了全新的AI智能体产品：ChatGPT Agent。新媒网跨境获悉，这款整合型产品是否比之前大多数面向消费者的AI智能体工具更出色？答案是肯定的。但它在实际使用中是否仍然难以完美运行？答案同样是肯定的。

未来展望与挑战并存

要实现理想中AI智能体的宏伟愿景，我们还有很长的路要走。然而，我们必须看到，从技术层面而言，我们已经前所未有地接近这个目标。正因如此，各大科技公司正不遗余力地投入巨资，用于AI智能体的研发，包括增加计算资源、加强研发投入以及引进顶尖人才。例如，谷歌近期就聘请了Windsurf公司的首席执行官、联合创始人及其部分研发团队成员，专门用于推动其AI智能体项目向前发展。与此同时，Anthropic和OpenAI等行业巨头也在你追我赶，不断推出渐进式的新功能，致力于将这些智能体更广泛地推向消费者。例如，Anthropic近期就发布了适用于Claude的Chrome浏览器扩展程序，使其能够在用户的浏览器环境中直接工作。

那么，接下来会发生什么呢？我们可以预见，AI编程技术将持续精进，不幸的是，这可能会对许多入门级软件工程师的就业构成一定挑战。同时，面向消费者的AI智能体产品也将逐步改善，尽管这一过程可能会缓慢而坚定。此外，AI智能体在企业和政府层面的应用将日益增多，尤其考虑到Anthropic、OpenAI和xAI等公司近几个月都已推出了专门面向政府用户的AI平台。

总体而言，随着AI智能体竞争的白热化以及市场热度的持续升温，我们预计将看到更多技术上的尝试与挫折，以及行业内的兼并与收购。新媒网认为，未来数月乃至数年，我们每个人都需要不断思考一个核心问题：我们究竟希望一个“AI智能体”能够为我们做些什么？我们是希望它们仅仅替代物流和执行层面的工作，还是也能处理生活中更具人情味的个人事务（比如帮助撰写婚礼祝词或鲜花附言）？在协助处理物流事务和个人情感事务方面，它们的表现又如何呢？就目前而言，在处理个人情感事务方面，它们的能力还远远不够。

深思背后的考量

除了AI技术，特别是大型模型，在推动AI智能体发展过程中所产生的巨大环境成本之外，还有一个不容忽视的问题。那就是“更智能、无所不能的AI”并非总是带来正面效应，尤其当有人试图利用它来做一些“坏事”时。例如，利用AI来辅助制造化学、生物、放射性及核（CBRN）武器。全球顶尖的AI公司对此类风险日益担忧（当然，这种担忧还不足以阻止它们继续开发）。

关于AI的监管，社会上存在诸多担忧。许多人虽然对AI的潜在影响有所耳闻，但并未充分意识到，当这些极其智能且旨在取悦用户的AI智能体落入不法分子之手时，无论是境内还是境外，都可能带来巨大的危害，比如“情绪操控”（vibe-hacking）和情感诈骗等。AI公司声称，他们已通过自愿采取的安全防护措施，走在了风险前面。然而，也有许多人认为，这可能需要更外部的审视和评估。

延伸阅读

关于AI智能体的深入探讨，各界持续关注。例如，外媒曾有文章指出OpenAI的ChatGPT Agent在实际应用中的不足。

另一篇外媒的深入报道，则探讨了AI智能体的哲学风险，及其为何特别容易成为“操纵引擎”。还有外媒曾以冷静的视角分析，AI智能体在实际任务中表现仍不尽如人意。

你是否曾好奇，每次AI查询会消耗多少能源？有外媒曾就此进行过精确计算，并披露了惊人的潜在数据。早在2024年，就有分析文章曾解释，为何AI智能体正在迎来其“ChatGPT时刻”。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/22684.html