AI浏览器实测！120刀购物，用户却更忙了。

近年来，人工智能技术浪潮席卷全球，各行各业都在积极探索其应用边界。其中，将AI能力深度集成到浏览器中，被视为重塑用户互联网交互体验的下一个前沿阵地。科技巨头纷纷入局，推出各自的AI浏览器或内置AI助手的传统浏览器，旨在让AI像人类一样甚至更高效地完成网页浏览任务。然而，这些AI浏览器究竟能否如宣传般强大，真正提升我们的上网效率？一位外媒科技记者近期通过一系列实测，对当前主流的AI浏览器进行了深入评估，其结果为我们提供了宝贵的行业洞察。

AI浏览器：新一代互联网交互的尝试

当前的互联网生态，电商网站繁杂的信息、眼花缭乱的促销广告，常常让消费者在寻找心仪商品时感到力不从心。传统的搜索引擎虽然强大，但仍需要用户主动筛选信息。科技界领袖们描绘了一个未来图景：用户只需向AI发出指令，AI便能自主完成复杂的网页操作，如预订、购物乃至信息整理等。微软公司首席执行官萨蒂亚·纳德拉曾在播客中表示，未来AI将能“像人类一样高效地使用电脑”。这种观点并非个例，许多业内高管都认为，AI智能体很快将在各项任务上超越人类。

在这一背景下，浏览器成为了AI竞争的新焦点。以Perplexity Comet、ChatGPT Atlas乃至集成Gemini功能的Chrome浏览器为例，它们正试图通过原生嵌入聊天机器人，改变过去三十年由搜索引擎主导的浏览模式。这些新一代AI浏览器的核心理念与所有“智能体至上”的公司如出一辙：AI将能像人类一样，甚至比人类更擅长网上冲浪。这一愿景的实现程度，是市场和用户关注的焦点。

当前市面上的AI浏览器主要分为两大类。一类是传统浏览器内置AI助手，如集成Gemini功能的Chrome浏览器和带有Copilot模式的Edge浏览器，AI功能通常以可折叠窗口的形式呈现。另一类是更专业化的AI浏览器，其中以ChatGPT Atlas、Perplexity Comet和The Browser Company的Dia最为知名。这类浏览器往往用AI取代传统的搜索栏，并且有时包含“智能体模式”（agentic mode），允许AI为用户完成更复杂的浏览器相关任务，理论上包括预订服务或将商品添加到购物车等。

实测方法与评估维度

新媒网跨境了解到，尽管AI浏览器的核心理念相似，但它们在理想的网页浏览体验上各有侧重。有些特定功能需要付费使用，底层AI模型也存在差异。此次外媒测试旨在评估AI浏览器能否在当前阶段提供更优质的互联网体验，重点关注了以下三个核心标准：

AI浏览器的实用场景与效率提升： 哪些浏览任务在引入AI后变得更便捷或更快速？
提示词的精细化程度要求： 用户是否需要精心设计繁琐的提示词或经历多轮问答才能获得理想结果？期望AI能像谷歌（Google）那样，即使是拼写错误的关键词也能理解用户意图。
智能体模式下的任务信任度： 如果AI具备智能体功能，用户对其自动完成任务的信任度有多高？结果是否可靠？

为了确保评估的客观性，外媒此次测试设定了严格的规则。测试范围限定在五款主流桌面AI浏览器：Chrome、Edge、Atlas、Comet和Dia，它们代表了两种AI浏览器类型和多家主要参与者。测试环境尽量保持一致：通常指令AI浏览器快速给出答案，在允许的情况下共享位置信息，启用记忆功能，并将自身描述为“专注于健康和可穿戴技术的科技记者”。此外，测试考虑了不同AI熟练度用户的体验，包括AI新手和擅长提示词工程的用户。所有浏览器在执行同一任务时，均使用完全相同的提示词。最终目的是探究这些AI浏览器是否真的名副其实。

实验结果：现状与局限

整体来看，外媒的测试结果显示，当前AI浏览器尚未完全兑现其宣传的承诺。简单地将AI助手“捆绑”到浏览器上，并没有从根本上改变用户与聊天机器人的互动方式。这更像是一种从发短信到面对面交流的转变，对话内容相同，只是形式不同，各有优劣。但无论使用哪款浏览器，测试者都反复遇到了同一个核心问题：用户需要投入额外精力，仔细思考如何构建恰当的提示词。

这与传统搜索引擎（尤其是谷歌）的发展路径截然相反。在谷歌的鼎盛时期，即使输入一连串拼写错误的词语，通常也能得到正确的答案。然而，AI模型目前需要更多的准备和引导。

电子邮件管理：理解“重要性”的挑战

以日常工作中整理电子邮件这一普遍需求为例。测试者希望AI能识别最重要的邮件并优先处理。最初尝试时，向AI浏览器发出了“总结我的邮件”这一常用指令。结果仅是直观地描述了收件箱中的邮件内容，例如“主文件夹中有一封邮件，主题是…，预览摘要是…，日期是11月20日，未加星标或标记为重要”。

当指令被优化为“根据紧急程度识别重要邮件”时，结果也并不理想。工作邮箱中生成了一堆不重要、不紧急的邮件列表，因为AI模型无法准确理解测试者实际认为的“重要”邮件是什么。测试者期待的是读者反馈、来自可靠联系人的投稿或遗忘回复的邮件，而AI却推荐了大量不相关的推广邮件，其中甚至包含一些健康诈骗信息。

直到Comet浏览器建议使用“找到重要未回复邮件”这一提示词，情况才略有改善。结果显示的前四封邮件确实包含“紧急！”、“禁令！”、“The Verge独家！”等科技记者常关注的关键词，且都有多轮跟进请求。虽然AI因此认为它们重要，但经核查，这些邮件实际都无需阅读或回复。AI在这里犯了一个常见错误：将关键词与事实的“重要性”混淆。

不过，Comet的AI在冗长的总结中，也“不经意地”在四分之三的位置提供了一个名为“个性化请求/跟进”的要点。其中高亮了两封邮件：一封来自某公司CEO，回应了测试者近期产品评测中的反馈；另一封来自读者，提供了一条与测试者关注领域相关的线索。这两封邮件虽然不“紧急”，但都值得仔细审阅。

当同样的“找到重要未回复邮件”提示词应用于其他AI浏览器时，它们也同样高亮了那些此前被跳过的、堆砌关键词的推广邮件，而未能识别出测试者真正感兴趣的两封邮件。进一步尝试更复杂的提示词，如“找到我曾表示兴趣或包含个性化请求/反馈的未回复邮件。然后，根据时效性和诸如‘禁令’等未来两周内包含日期的关键词，评估哪些邮件需要回复。忽略那些已被多次跟进但我尚未回复的邮件。”Comet和Dia在此次尝试中表现稍好，识别出多条相关邮件线索，但最终只有一封确实需要回复。Edge的Copilot识别出一条相关线索和五条垃圾推广。Chrome的Gemini则完全失败，只显示了一封“黑五”营销邮件。

而Atlas在面对这类复杂指令时，仅回复“Gmail似乎已成功返回未读邮件ID，但这些邮件的实际内容未能返回——批量读取返回为空，这意味着Gmail API此次未提供邮件正文。”并接着提出了两个冗长的问题。面对此情此景，测试者最终放弃了进一步的尝试。

有限的成功：信息整理与网页交互

尽管邮件处理大多以失败告终，但在某些日常任务中，AI浏览器表现尚可。例如，需要从一份48页的法律文件中查找家族事务相关信息时，尽管传统Ctrl+F（或CMD+F）功能有效，但冗长的法律术语令人头疼。此时，将文件载入一个标签页，并要求AI浏览器列出所有相关页面和章节，并提供摘要，所有浏览器都返回了相同的页面，只是摘要略有不同。这虽然仍需用户自行阅读，但显著加快了定位关键信息的起始点。

对于网页搜索，AI浏览器在某些场景下也能发挥作用——前提是用户有足够的耐心去调整二十年来形成的谷歌搜索习惯。当用户需要针对当前正在浏览的特定网站回答问题时，AI搜索效果最佳。例如，在考虑升级iPhone时，测试者要求AI机器人从苹果官网和互联网上收集各种iPhone的规格和尺寸数据，并整理成表格。这比在多个标签页之间切换要方便和有效得多。完成这一过程后，测试者对要升级哪款iPhone有了更明确的信心。

新媒网跨境认为，测试结果反映出一个关键点：当用户的思维模式从“让AI替我做事情”转变为“AI如何帮助我与当前页面互动”时，AI浏览器的成功率会显著提高。例如，在阅读一份临床研究报告时，遇到包含密集医学术语的专业段落，要求AI模型用通俗易懂的语言总结和解释某些晦涩概念，被证明是非常有帮助的。

此类摘要和数据整理功能是AI浏览器最便捷之处。所有浏览器在此方面表现良好，且触手可及。尽管偶尔仍需来回确认，但总体而言，它减少了用户所需时间和打开的标签页数量，使其能够更快地进入到在线工作的核心部分。

复杂任务的挣扎：视频转录与下载

众所周知，AI擅长总结和整理信息。然而，AI浏览器理应在处理复杂查询时大放异彩。但在这些任务中，用户同样需要费力引导AI才能获得满意的结果。

在《怪奇物语》第五季首播前，测试者与同事讨论观看一个18分钟的YouTube回顾视频。同事正在进行另一个AI项目，询问AI浏览器助手是否能将视频转换为可下载的.txt文本文件。于是测试者尝试询问：“你能抓取这个YouTube视频的转录文本吗？”
Note how Dia says it will export the full transcript.

Copilot以版权为由拒绝了这一请求（尽管大多数YouTube视频本身就带有转录文本，这项任务本不应如此困难）。它只能提供视频内容的摘要或大纲。Comet成功抓取了前25秒的准确转录文本，随后表示“转录文本将继续包含第一至第四季的详细情节和角色回顾”。Dia提供了带时间戳的转录文本，但仅限于前15分钟。Atlas和Chrome是唯二提供了完整转录文本的浏览器，它们将极长的逐行转录文本直接显示在聊天窗口中。
Semantics matter. “Put in a txt file” versus “create a downloadable .txt file” may mean the same things to humans, but not to AI.

接着，测试者询问每个AI浏览器是否能将该转录文本转换为带时间戳的可下载.txt文件。只有Atlas成功完成了这项任务。其他浏览器均表示无法生成可下载文件，但用户可以自行复制粘贴纯文本到文件中。由此可见，“告诉AI我想要什么”的愿望，在很多情况下仍难以实现。

在线购物：复杂的个性化与信任难题

经过多次尝试，测试者回到了最初的任务：购买一双新百伦（New Balance）运动鞋，并找到最优惠的价格。手动完成这一过程通常耗时费力，包括社交媒体调研、朋友推荐、品牌历史研究，以及数小时在品牌官网上的筛选，最终可能只剩下三款备选。之后还要花费时间寻找在线优惠。这一过程漫长且容易出错，也是测试者两年都未找到一双耐用、时尚、舒适步行鞋的原因。

有了AI浏览器，研究部分变得“轻松”。简而言之，用户需要提供高度具体的调研提示词。例如，测试者明确指出自己是扁平足，喜欢宽鞋，寻找休闲运动鞋而非跑鞋，需能应对每天1.5万至2万步的步行量，偏爱百搭颜色但首选纯白，需要搭配运动休闲和时尚街头风格，预算不超过120美元（最好在100美元以下）。
Screenshot of ChatGPT Atlas working on putting a pair of New Balance 530 into a cart

随之而来的是多轮互动，浏览器有时能听取需求，有时却无法理解。响应越长，出现相互矛盾建议的可能性越大——例如，推荐一双200美元的超高性能跑鞋作为首选，但在最底部却推荐了一双85美元的休闲款，颜色却完全不符合要求。如此反复，经过五款浏览器约20轮的交互，测试者最终筛选出了New Balance 530。

值得一提的是，New Balance 530也是测试者手动筛选时进入短名单的鞋款。不过，虽然手动筛选型号的速度更快，但AI为每个选择提供了理由，例如某款鞋因其额外缓冲而更耐用，或某款鞋的轮廓适合多种搭配。而测试者手动选择时，更多是基于“感觉”。

进入第二阶段：寻找优惠。测试者要求所有五款浏览器找到一款纯白色、白银色或粉白色，尺码为女款8.5（25厘米），且在所在邮政编码地区有库存的New Balance 530，并找出最低价格。如果AI具备智能体模式，则要求AI将其放入购物车。
ChatGPT Atlas in agent mode describing an attempt to close a pop-up window. “The pop-up is still there, and clicking the ‘X’ hasn’t worked yet. I think I might need to click slightly more precisely—at coordinates 659,247. Let’s give that a try and see if it closes this time so I can move forward with the task.”

随后的多轮互动产生了不同的结果。Dia、Comet、Chrome和Edge找到了同一家本地Foot Locker商店，但选择了不同颜色。Atlas最终成功地将正确的鞋款放入了购物车，但在此过程中多次确认测试者是否真的想要，并曾试图覆盖取货偏好，改为送货。有一次，测试者甚至看到Atlas花费了一分钟试图关闭一个弹出窗口，只为继续购物。

经过多次完整实验，测试者虽然确信浏览器每天都能找到最佳价格，但对这些鞋是否真是自己想要的，信心却越来越低。尤其当Atlas推荐New Balance 574 Core作为替代品时，理由是它们是“NB最具标志性的日常廓形之一”，且是百搭的中性鞋款（ChatGPT知道测试者喜欢中性风格）。

总结与展望：用户适应是关键

如果以外媒最初的设想——AI在网上冲浪方面能比人类更出色——来评判这些浏览器，那么事实并非如此。在整个体验过程中，没有哪一刻能称得上是“无需动手”的。更广泛地说，整个AI浏览器体验强化了一个观点：用户花费大量时间为AI做事情，然后AI才能在某些时候为用户做事情。用户正在改变自己的思考方式、提问方式，以及搜索和消化信息的方式。与其说是AI如何适应我的生活，不如说是用户如何调整自身的自然行为来适应AI日益增长的存在。

一次良好的AI浏览器体验需要诸多前提。尽管使用谷歌搜索也需要一些习惯，但在20年的发展后，它所需的认知努力远低于目前AI浏览器所能提供的最佳体验。使用AI浏览器，用户必须相当擅长提示词工程，必须理解聊天机器人的优势，并有足够的耐心来应对其弱点。或者，至少用户必须愿意学习。这对许多人来说是事实。但测试结果表明，并非所有下载AI浏览器的人都会觉得学习曲线是值得的。

AI有时确实能带来便利，但它总是伴随着大量的工作。测试者最终决定亲自前往New Balance门店购买新鞋。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/ai-browser-test-120-budget-shopping-busier.html