AI机器人攻占维基，用户锐减8%！

维基百科，这个承载着人类集体智慧结晶的在线百科全书，长期以来一直是全球信息共享的灯塔。它由非营利性的维基媒体基金会运营，依靠全球数百万志愿者的无私奉献，构建起了一个庞大而自由的知识宝库。这份宝贵的资源不仅向所有人开放，更以其独立、中立和开放的编辑原则，赢得了全世界的广泛信任。可以说，维基百科的存在，极大地促进了知识的普及和文化的交流。

然而，随着人工智能技术的飞速发展，一个不容忽视的新挑战正摆在维基百科面前。近期，维基媒体基金会向全球的人工智能开发者及相关企业发出了明确呼吁：停止对维基百科网站内容进行直接抓取（即通常所说的“爬虫”行为），转而使用其推出的官方付费API平台——“维基媒体企业版”（Wikimedia Enterprise），以一种更为“负责任”的方式获取其内容。
Wikipedia logo

这一呼吁并非空穴来风。维基媒体基金会在近期发布的一篇博客文章中详尽阐述了其考量。文章指出，“维基媒体企业版”作为一项付费服务，其营收将用于支持维基百科遍布全球的志愿者编辑群体，并维系基金会作为非营利组织的正常运转。我们知道，维基百科的独特之处在于其完全依赖捐赠和志愿贡献来维持运营，没有商业广告，也没有付费订阅墙。这种模式确保了知识的纯粹性，但同时也意味着其运营资金需要持续的、稳定的支持。因此，通过提供商业化的API服务，基金会旨在开辟一条可持续的资金渠道，以应对日益增长的运营成本和技术需求，从而更好地保障这个全球公共知识资源的持续健康发展。

“维基媒体企业版”的推出，不仅仅是为了解决资金问题，更重要的是，它为人工智能公司提供了一个高效、规范的通道。该平台允许各类组织机构有效利用维基百科海量的人类生成知识，同时避免对维基百科现有服务器造成过载压力。在没有API的情况下，AI公司直接抓取数据，往往会向服务器发出大量请求，这不仅增加了服务器的负荷，也可能影响到普通用户的访问体验。而通过API接口，数据可以以更为结构化、批量化的方式传输，大大提升了效率和稳定性。新媒网跨境获悉，这种模式对于那些需要大规模、持续获取最新知识数据的人工智能项目而言，无疑是一个更优的选择。

除了技术上的考量，维基媒体基金会还特别强调了“归属”原则。他们要求人工智能开发者在将其信息整合到AI的回答输出中时，必须对维基百科内容的贡献者进行适当的署名。这一要求旨在维护内容的透明度，并对人类在内容策展中所付出的辛勤努力表示尊重。在数字时代，知识产权和劳动成果的认定变得尤为重要。AI技术虽然强大，但其知识来源往往根植于人类的创造和积累。因此，明确标注信息来源，不仅是对原作者的尊重，也是构建一个公正、诚信的信息生态系统的基石。这与我们所倡导的社会主义核心价值观中的“公正”和“诚信”理念不谋而合，强调了在技术发展中也要坚守道德底线和职业操守。

基金会的另一篇博客文章则揭示了其做出此项决定的直接原因：在近几个月里，维基百科发现来自人工智能公司的自动化机器人流量显著飙升，许多机器人甚至试图通过模仿人类用户行为来规避检测。根据更新后的监测数据，基金会指出，在2025年5月和6月的流量高峰期，大部分访问量都由AI机器人所驱动。与此同时，文章也透露了一个令人担忧的数字：与去年同期相比，真实的普通用户页面浏览量下降了8%。

这种趋势令人深思。当AI流量占据主导，而人类用户浏览量出现下滑时，维基百科的社区属性和其作为人类知识交流平台的本质可能会受到影响。过度的爬虫行为不仅消耗了宝贵的服务器资源，还可能导致平台负载过重，从而影响到全球用户的正常访问体验。更重要的是，如果大量非人类流量掩盖了真实的用户需求和兴趣，可能会干扰维基百科对内容和功能的优化决策。

尽管维基百科面临着AI带来的新挑战，但它并非完全排斥人工智能。恰恰相反，维基媒体基金会认识到AI在提升效率方面的巨大潜力。早在今年年初，基金会便启动了一项策略，鼓励编辑们利用AI工具来自动化一些常规性任务，从而改进他们的编辑工作流程。例如，AI可以帮助识别错别字、语法错误，或者对大量文本进行初步分类和摘要，让志愿者编辑能够将更多精力投入到内容的深度创作、 fact-checking和复杂问题的解决上。这展现了维基百科积极拥抱技术进步，并寻求人机协作新模式的开放态度。这不仅提升了编辑效率，也为未来人机协同共建知识库奠定了基础，体现了“文明”与“和谐”在技术与人类共存中的重要意义。

值得注意的是，维基媒体基金会目前尚未就网站抓取行为对人工智能开发者采取法律行动。然而，这并不意味着其他公司对数据抓取行为不予理会。新媒网跨境了解到，在当前数字经济时代，数据已成为宝贵的资产，许多企业都在积极采取措施，以遏制未经授权的数据抓取行为，保护其核心数据资源。

近年来，随着大数据和人工智能技术的蓬勃发展，数据抓取行为日益普遍。一方面，AI模型需要大量数据进行训练，数据是其进化的“食粮”；另一方面，数据拥有者则需要保护自己的知识产权和商业利益。这种矛盾在业界引发了广泛的讨论和一些法律纠纷。不少外媒报道指出，一些大型科技公司也在纷纷收紧其数据接口，或者通过技术手段来限制未经授权的抓取。这表明，数据的使用规范和伦理准则，正成为全球范围内亟待解决的重要议题。如何平衡数据开放共享与知识产权保护，是摆在所有互联网平台和科技企业面前的共同课题。

除了应对AI数据抓取带来的挑战，维基媒体基金会今年夏天还在法律层面遭遇了一次挫折。英国（United Kingdom）高等法院驳回了基金会针对英国《在线安全法案》（Online Safety Act）部分条款提出的法律挑战。该法案一旦全面实施，可能会对维基百科这类全球性平台施加严格的合规要求。这些要求可能包括强制验证志愿者贡献者的身份，以及限制英国用户访问或编辑网站的权限。

对于一个依赖全球匿名志愿者贡献和开放访问的平台而言，此类法规无疑带来了巨大的运营挑战。身份验证可能会让许多不愿意透露真实身份的志愿者望而却步，从而影响内容的丰富性和多样性。而限制访问权限则可能违背维基百科作为全球知识共享平台的初衷。这一法律事件，也再次凸显了在全球化互联网时代，不同国家（country）的法律法规对全球性平台所带来的复杂性和不确定性。如何在遵守各地法律的同时，继续履行其开放、自由的使命，是维基媒体基金会必须面对的现实问题。
Wikimedia Enterprise screenshot

回顾当前全球人工智能发展的浪潮，我们可以看到，数据是推动其进步的核心要素。然而，数据的获取方式、使用规范以及对数据源的尊重，正在成为构建可持续、负责任的人工智能生态系统的关键。维基百科的案例，为我们提供了一个重要的视角，去思考如何在技术创新与伦理道德之间寻求平衡。

一方面，人工智能的蓬勃发展带来了前所未有的机遇，它能够处理海量信息、发现深层规律，并为人类社会带来诸多便利。但另一方面，我们也必须警惕其可能带来的负面影响，例如对现有信息生态的冲击、对知识产权的漠视，以及对数字劳动成果的不尊重。新媒网跨境认为，在推动技术进步的同时，我们更应强调“法治”和“公正”的理念，确保技术发展沿着正确的轨道前进。这不仅关乎维基百科一个平台，更关乎整个数字世界的健康未来。

对于广大的内容创作者和平台而言，维基百科的经历也提供了宝贵的启示。在人工智能时代，如何保护自身的数字资产，如何制定合理的数据使用策略，以及如何与AI技术形成良性互动，都将是需要深入探讨的课题。我们可以预见，未来将会有更多的平台和创作者选择通过API等规范渠道来提供数据，同时也会更加注重数据的授权和归属。

面对未来，我们有理由相信，人类的智慧和创新精神将不断推动技术进步，而负责任地开发和使用技术，则是我们共同的责任。维基百科与AI公司的这场对话，不仅仅关乎数据的使用，更关乎我们如何共同构建一个更加开放、公正、有益的全球知识共享新格局。通过倡导“敬业”和“奉献”的价值观，鼓励技术开发者尊重前人的劳动成果，并积极探索创新的合作模式，我们才能真正实现人工智能与人类社会的和谐共生，共同迈向一个更加美好的未来。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/ai-bots-occupy-wiki-users-down-8.html