Reddit狂赚3500万刀！AI数据战打响，这平台如何反击抓取？

一篇重磅法律诉讼在跨境行业内引起广泛关注：知名社交媒体平台Reddit于近日采取法律行动，将矛头指向了多家涉嫌未经授权抓取其平台数据的公司。这一举动，无疑为人工智能时代的数据使用和知识产权保护划定界限，预示着一场围绕“数据主权”的深度博弈正在加速上演。

突发事件：Reddit发起数据抓取诉讼

新媒网跨境获悉，在2025年10月22日，Reddit向美国联邦地方法院提起了一项新的诉讼，目标直指四家公司。Reddit在此次诉讼中明确指出，这四家公司通过谷歌搜索结果而非其官方API接口，非法抓取并使用了Reddit平台上的海量数据。

根据外媒报道，被Reddit点名的公司包括：立陶宛初创公司SerpApi和Oxylabs，俄罗斯公司AWMProxy，以及美国旧金山的AI搜索引擎初创公司Perplexity。Reddit在诉讼文件中明确指出，前三家公司——SerpApi、Oxylabs和AWMProxy——涉嫌向OpenAI和Meta等人工智能巨头出售所抓取的数据。而Perplexity公司，则被指控利用这些数据来构建其自身的AI搜索产品。

Reddit在此次法律行动中，寻求法院对这些公司发出永久禁令，以彻底阻止其未来的数据抓取行为。同时，Reddit也提出了经济赔偿的诉求，旨在弥补因数据被非法使用所造成的损失。更深层次的考量在于，Reddit希望通过这一案件，为数据保护领域树立起一个更为坚实的法律先例。对于Reddit而言，此举不仅是维护自身商业利益，更是在日益激烈的数字经济时代，明确平台对其用户生成内容数据的所有权和控制权。

数据价值凸显：AI对Reddit内容的依赖

从商业角度审视，Reddit的这一法律行动具有极强的合理性。作为全球互联网上用户生成内容最丰富、最活跃的平台之一，Reddit的讨论区（Subreddits）汇集了从专业知识到生活经验的各类信息，构成了庞大的、高质量的文本数据集。这些数据对于训练人工智能模型，尤其是提升其理解自然语言、生成高质量回答和进行复杂推理的能力，具有不可估量的价值。

事实上，外媒分析数据显示，Reddit已成为人工智能工具生成响应时最常引用的来源之一。其独特的社区文化、实时更新的内容以及用户之间深入的问答互动，使得Reddit数据在AI训练中扮演着关键角色。人工智能项目看到了利用Reddit对话作为参考数据来赋能其工具的巨大机会。

Reddit深谙其数据的商业价值，并早已为此采取了多项措施。在2023年，Reddit便调整了其API收费政策，大幅提高了API使用费用，旨在将数据的使用商业化，并确保通过官方渠道获取数据的公司需要为此付费。这一政策调整在当时曾引发了部分第三方应用的不满，甚至导致一些长期合作的应用终止服务。

然而，Reddit此次诉讼揭示了一个新的“漏洞”：这些公司并未直接通过Reddit的API接口进行数据抓取，而是通过谷歌搜索结果这一间接路径，绕过了Reddit的收费和授权机制。Reddit指出，这些提供商通过这种方式规避了其服务条款，这相当于利用了平台数据保护措施中的灰色地带。现在，Reddit希望通过法律手段来彻底堵塞这一漏洞，以确保其数据资产得到全面的保护和合法的变现。

收益与合作：Reddit数据变现的探索

Reddit对数据价值的重视，也体现在其不断增长的营收数据上。新媒网跨境了解到，在2025年第二季度，Reddit的“其他”收入类别实现了显著增长，同比飙升24%，该季度来自这一部分的收入达到3500万美元。这部分收入的增长，很大程度上归功于其数据授权和API服务所带来的收益。这一数据直观地反映了外部对Reddit数据需求的强劲，以及Reddit在数据变现方面的积极进展。

为了进一步拓展数据变现渠道，Reddit此前也已与多家科技巨头建立合作。例如，Reddit曾与谷歌达成新的数据共享协议，允许谷歌更好地利用Reddit数据来提升其搜索结果质量和人工智能能力。随后，Reddit也宣布与OpenAI建立了合作关系，进一步深化了其数据在AI领域的应用。这些合作模式都基于明确的授权和付费机制，与此次诉讼中指控的未经授权抓取行为形成鲜明对比。

正是因为Reddit数据蕴含的巨大价值，以及其在数据变现和保护方面所做的努力，此次法律行动显得尤为关键。它不仅有助于Reddit自身，也可能为其他社交媒体平台在未来打击未经授权的数据抓取行为，建立起更坚实的法律基础。

行业背景：数据之争日益激烈

在人工智能快速发展的今天，数据被视为“新石油”。AI项目的蓬勃发展对高质量数据的需求永无止境，而社交平台正是这一需求的关键来源之一。随着数十亿甚至数万亿美元的市场价值被卷入这场数据争夺战，各大平台都在审视自己的选项，以阻止未经授权的数据使用。

放眼全球科技界，数据抓取和知识产权的边界问题，已成为一个长期且日益尖锐的冲突点。新媒网跨境认为，Reddit的案例并非孤例，而是当前整个行业面临的普遍挑战。

LinkedIn的胜利： 职业社交平台LinkedIn就曾成功在法律上赢得针对数据抓取者的诉讼，明确了其平台数据的商业保护。这一案例为其他平台提供了重要的参考。
Meta的困境： 社交巨头Meta在与数据抓取者的法律斗争中，有时会遭遇挫折，这凸显了在数据抓取监管方面，法律框架仍需进一步明确。
马斯克的警告： 甚至连埃隆·马斯克也曾公开威胁要起诉微软，理由是微软在未经授权的情况下，使用X平台（原Twitter）的数据来训练其AI模型。

这些案例都表明，随着AI工具的不断演进，关于数据所有权和合法使用方式的法律案件只会越来越多。数据保护和变现，将成为未来科技巨头之间，乃至平台与AI公司之间，一个日益激烈的“战场”，也将成为律师们大展身手的“肥沃土壤”。Reddit的此次诉讼，无疑是这场大戏中的又一重要篇章，其结果将对整个行业的数据治理和AI发展产生深远影响。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/reddit-earns-35m-sues-ai-for-data-scraping.html