AI智能体狂飙:700人工作量!30%代码它包办!

2025-08-31AI工具

Image

AI智能体,这个听起来充满未来感的词汇,正一步步从科幻走向现实,虽然前路依旧漫漫,但其发展的步伐却从未停歇。
AI智能体

梦想照进现实的起点

谈及AI智能体的概念,许多人脑海中首先浮现的或许就是电影《钢铁侠》中那个无所不能的人工智能管家——贾维斯(J.A.R.V.I.S.)。虽然现实并非电影,但贾维斯无疑为人们描绘了一个理想中的AI智能体形态:它能未卜先知,在你开口之前便洞察需求;能从海量数据中抽丝剥茧,提炼出独到见解;更能为你出谋划策,甚至独立完成业务中的特定环节。

当然,对于AI智能体的确切定义,业界仍有诸多探讨,但其核心共识在于:它超越了传统聊天机器人的范畴,能够自主完成多步骤、复杂的任务,而无需用户持续地来回指令。它仿佛拥有自我规划的能力,能将庞大的最终目标拆解为一系列子任务,并逐一攻克。这份曾被视为遥不可及的幻想,如今正以超乎想象的速度接近现实。然而,对于普通用户而言,要实现真正的实用化,仍有诸多挑战亟待克服。

“AI智能体”一词,其实早在业界流传多年,但在2023年,它才真正成为科技圈的热门话题。那一年,围绕AI智能体的概念讨论达到了高潮,人们热衷于探索其可能性,并积极寻找将其变为现实的路径。然而,彼时成功的应用案例却寥寥无几。紧接着的2024年,成为了AI智能体的“部署元年”,各大科技公司开始将代码投入实际应用场景,尝试验证其能力。但彼时的反馈却不尽如人意,常常伴随着错误提示,显示出技术尚不成熟的一面。

AI智能体热潮的真正引爆点,可以追溯到2024年2月。当时,欧洲一家名为Klarna的金融科技公司对外宣布了一项惊人成就:其由OpenAI技术驱动的AI客服助理,在一个月内成功完成了700名全职客服人员的工作量,并自动化处理了该公司三分之二的客户服务聊天。这一数据,在接下来的数月里,几乎成为了所有AI行业交流中的必提案例,无疑为AI智能体的巨大潜力提供了强有力的注脚。

此后,这股热潮愈演愈烈,从未消退。随后的几个月里,亚马逊、Meta、谷歌、微软等各大科技巨头的高管们,在每一场财报电话会议中,都反复强调其对开发实用且成功的AI智能体的承诺。他们不仅口头宣誓,更付诸行动,投入巨额资金和资源,力求将这一愿景变为现实。

从憧憬到现实的路径

最初的设想是,AI智能体有朝一日能够包办一切:从预订旅行行程,到为你的商务演示生成定制化的视觉内容。一个理想的工具,甚至能根据所有参与者的日程、饮食偏好和特殊要求,智能地找出与朋友聚会的最佳时间和地点,然后自动预订餐厅,并为每个人创建日历提醒。
未来设想

在目前的实际应用中,AI编程领域无疑是AI智能体行业的一大亮点。如果你询问业界人士,目前有哪些真实、成功且不让人感到困扰的AI智能体应用案例,他们几乎无一例外地会指向AI编程——这曾是他们唯一能拿得出手的具体成果。许多工程师已将AI智能体融入日常编程工作中,并且普遍认为其表现相当出色。事实上,AI编程智能体表现之优秀,甚至在微软和谷歌这样的科技巨头中,高达30%的代码已由AI智能体完成。对于OpenAI和Anthropic等这类资金消耗巨大的初创公司而言,面向企业客户提供的AI编程工具,更是其重要的营收来源之一。

因此,在最近一段时间,AI编程一直是AI智能体最主要的实际应用场景。但显而易见,这并非直接面向普通消费者的产品。AI智能体最初的愿景,是要成为“普罗大众”的万能助手。尽管我们尚未完全实现这一目标,但在2025年,我们比以往任何时候都更接近它。

2024年10月,Anthropic公司率先推出了“计算机使用”(Computer Use)功能,这使得其Claude智能体能够像人类一样操作电脑——包括浏览网页、进行搜索、访问不同平台,并为用户完成复杂的任务。尽管业界普遍认为这项工具是技术上的一大进步,但早期用户反馈也指出,实际使用中仍有许多不尽如人意之处。快进到2025年1月,OpenAI发布了其类似产品“Operator”,并将其宣传为一款能够填写表格、订购杂货、预订旅行以及制作表情包的工具。然而,与Anthropic的“计算机使用”类似,许多用户在使用后表示,“Operator”在实际操作中依然存在Bug、运行缓慢且效率不高的问题。尽管如此,这仍然被视为AI智能体发展道路上迈出的重要一步。次月,OpenAI又推出了“深度研究”(Deep Research)——一款能够为用户就任何主题生成长篇研究报告的AI智能体工具,这同样推动了技术向前发展。尽管有人认为其研究报告在长度上比内容更令人印象深刻,但也有部分用户对此深感震撼。到了7月,OpenAI更是将“深度研究”和“Operator”整合为一体,推出了全新的AI智能体产品:ChatGPT Agent。新媒网跨境获悉,这款整合型产品是否比之前大多数面向消费者的AI智能体工具更出色?答案是肯定的。但它在实际使用中是否仍然难以完美运行?答案同样是肯定的。

未来展望与挑战并存

要实现理想中AI智能体的宏伟愿景,我们还有很长的路要走。然而,我们必须看到,从技术层面而言,我们已经前所未有地接近这个目标。正因如此,各大科技公司正不遗余力地投入巨资,用于AI智能体的研发,包括增加计算资源、加强研发投入以及引进顶尖人才。例如,谷歌近期就聘请了Windsurf公司的首席执行官、联合创始人及其部分研发团队成员,专门用于推动其AI智能体项目向前发展。与此同时,Anthropic和OpenAI等行业巨头也在你追我赶,不断推出渐进式的新功能,致力于将这些智能体更广泛地推向消费者。例如,Anthropic近期就发布了适用于Claude的Chrome浏览器扩展程序,使其能够在用户的浏览器环境中直接工作。

那么,接下来会发生什么呢?我们可以预见,AI编程技术将持续精进,不幸的是,这可能会对许多入门级软件工程师的就业构成一定挑战。同时,面向消费者的AI智能体产品也将逐步改善,尽管这一过程可能会缓慢而坚定。此外,AI智能体在企业和政府层面的应用将日益增多,尤其考虑到Anthropic、OpenAI和xAI等公司近几个月都已推出了专门面向政府用户的AI平台。

总体而言,随着AI智能体竞争的白热化以及市场热度的持续升温,我们预计将看到更多技术上的尝试与挫折,以及行业内的兼并与收购。新媒网认为,未来数月乃至数年,我们每个人都需要不断思考一个核心问题:我们究竟希望一个“AI智能体”能够为我们做些什么?我们是希望它们仅仅替代物流和执行层面的工作,还是也能处理生活中更具人情味的个人事务(比如帮助撰写婚礼祝词或鲜花附言)?在协助处理物流事务和个人情感事务方面,它们的表现又如何呢?就目前而言,在处理个人情感事务方面,它们的能力还远远不够。

深思背后的考量

除了AI技术,特别是大型模型,在推动AI智能体发展过程中所产生的巨大环境成本之外,还有一个不容忽视的问题。那就是“更智能、无所不能的AI”并非总是带来正面效应,尤其当有人试图利用它来做一些“坏事”时。例如,利用AI来辅助制造化学、生物、放射性及核(CBRN)武器。全球顶尖的AI公司对此类风险日益担忧(当然,这种担忧还不足以阻止它们继续开发)。

关于AI的监管,社会上存在诸多担忧。许多人虽然对AI的潜在影响有所耳闻,但并未充分意识到,当这些极其智能且旨在取悦用户的AI智能体落入不法分子之手时,无论是境内还是境外,都可能带来巨大的危害,比如“情绪操控”(vibe-hacking)和情感诈骗等。AI公司声称,他们已通过自愿采取的安全防护措施,走在了风险前面。然而,也有许多人认为,这可能需要更外部的审视和评估。

延伸阅读

关于AI智能体的深入探讨,各界持续关注。例如,外媒曾有文章指出OpenAI的ChatGPT Agent在实际应用中的不足。

另一篇外媒的深入报道,则探讨了AI智能体的哲学风险,及其为何特别容易成为“操纵引擎”。还有外媒曾以冷静的视角分析,AI智能体在实际任务中表现仍不尽如人意。

你是否曾好奇,每次AI查询会消耗多少能源?有外媒曾就此进行过精确计算,并披露了惊人的潜在数据。早在2024年,就有分析文章曾解释,为何AI智能体正在迎来其“ChatGPT时刻”。


新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/22684.html

评论(0)

暂无评论,快来抢沙发~
AI智能体正快速发展,从最初的设想走向现实应用,尤其在AI编程领域表现突出。 Klarna的AI客服助理成功案例和各大科技巨头的投入,推动了AI智能体的发展。尽管面临技术挑战和伦理考量,AI智能体在企业和消费级应用方面都展现出巨大潜力。
发布于 2025-08-31
查看人数 279
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。