流量被“白嫖”,媒体集体掀桌子!79%新闻巨头封杀AI机器人:这是一场关乎尊严的“闭门战争”

现在的内容生态,简直像是一场没有硝烟的“丛林肉搏”。自媒体人和新闻出版商们辛辛苦苦码出来的文字,转头就成了大模型口中的“养料”,甚至连个引用链接都不给?
这口气,全球的内容出版商终于咽不下了。
最近,一场规模宏大的“防御战”正在互联网的底层协议里悄然打响。新媒网跨境观察到,全球出版商正排着队修改自家的robots.txt文件。这不仅仅是为了防范那些偷偷摸摸采集数据去“喂”AI的训练机器人,更狠的一招是:他们连那些能让内容出现在AI搜索答案里的检索机器人也一并关在了门外。🚫
根据BuzzStream对全球百大新闻网站的硬核拆解,一个让人脊背发凉的趋势浮出了水面:高达**79%的顶级新闻网站至少阻止了一个AI训练机器人。更绝的是,其中71%**的网站甚至连实时检索机器人也给封杀了。
这意味着什么?这意味着媒体人宁可不要AI搜索带来的那点碎渣流量,也不愿让自家的内容被AI“无偿征用”。
是“知识搬运”还是“过河拆桥”?
在这场纷争中,我们得先搞清楚这群“数字昆虫”的分类。研究人员把AI机器人精准地切成了两块:
- 训练机器人(Training Bots): 这帮家伙是“大胃王”,它们疯狂吞噬海量文字,只为构建和迭代AI模型的大脑。你之所以觉得ChatGPT博学,全靠它们在互联网的各个角落里“捡破烂”。
- 检索机器人(Retrieval Bots): 它们更像是“外卖员”。当你问AI一个时效性问题时,检索机器人会实时跳出来抓取最新的资讯,以此为AI的回答提供支撑和信源。
尴尬的地方就在这里:如果一个网站阻止了检索机器人,虽然能防止内容被实时“洗稿”,但副作用也极其明显——当AI回答用户问题时,原本属于你的高光时刻(引用推荐)将彻底消失。这简直就是一个生存还是尊严的终极悖论。🤔
核心数据揭秘:谁在围堵,谁在放行?
BuzzStream这次抽样了美英两国流量前50的新闻网站,共计100个样本。数据里的“爱恨情仇”可谓一目了然:
- 头号公敌是谁? Common Crawl的CCBot高居榜首,被75%的网站无情拦截。Anthropic-ai(72%)和ClaudeBot(69%)紧随其后,GPTBot也有62%的拦截率。
- 谷歌的“面子”: 负责训练Gemini的Google-Extended反倒是阻力最小的,平均阻截率仅46%。有趣的是,美国出版商对谷歌的防范心理明显更重(58%拦截),而英国同行则显得佛系得多(29%)。
英国《每日电讯报》的SEO总监哈里·克拉克森-本内特把话挑明了:“大家之所以锁门,是因为现在根本没有等价交换。大模型设计出来就不是为了引流的,但没流量,媒体怎么活?”
这话说到了心坎里。没有回报的奉献,那不叫共享,那叫“被薅羊毛”。💸
检索与索引:防线上的“猫鼠游戏”
再来看看那些实时搜索的机器人。
Claude-Web最惨,拦截率飙到了66%。OpenAI为了ChatGPT搜索而派出的OAI-SearchBot也被近一半的媒体(49%)给拒了。相比之下,Perplexity-User似乎口碑还行,阻截率只有17%,看来大家对这种“引用驱动型”的新锐搜索还留了一丝念想。
更有意思的是,只有14%的网站选择了“全封锁”这种极端战术,而18%的网站则完全“躺平”,敞开大门任由AI采撷。这种分歧说明,大家都还在迷雾中摸索:到底该把AI当成敌人,还是当成下一个流量入口?
robots.txt:一纸空文,还是最后防线?
必须承认,robots.txt这玩意儿在技术圈里其实挺苍白的。它更像是一个“请勿入内”的告示牌,而不是一道焊死的防盗门。
谷歌的加里·伊利耶斯早就戳穿过这个真相:它挡不住那些存心想闯入的“野蛮人”。很多AI爬虫会玩“隐身术”,比如Perplexity就曾被Cloudflare踢爆通过轮换IP、伪装浏览器特征来规避限制。
这种“潜行爬取”的行为彻底激怒了基础设施提供商。Cloudflare现在已经开始主动出击,利用CDN层面的指纹识别技术来帮出版商“抓鬼”。毕竟,单靠君子协定,是挡不住逐利的算法的。🛡️
深远影响:AI答案里,谁在消失?
当你封杀了检索机器人,你其实是在选择退出未来的搜索生态。
这是一个极其沉重的决定。未来用户可能不再去点击搜索结果,而是直接在AI对话框里获取答案。如果你不在AI的引用名单里,哪怕你的观点再卓越,也会被淹没在数据的汪洋大海中。
OpenAI和Perplexity现在都在玩“精细化运营”,把训练爬虫和检索爬虫分开。这种策略就是在给出版商出难题:你是想要保护版权,还是想要那点可怜的曝光量?
前路何方:技术博弈的升级
单纯靠改几行代码指令(robots.txt)的日子快到头了。新媒网跨境认为,未来出版商可能会更多地转向CDN层面的硬拦截。
现在的局势很明朗:
- 拦截训练机器人: 关乎知识主权,防止被AI“洗脑”。
- 拦截检索机器人: 关乎当下的曝光,决定了内容在AI时代的可见度。
这场博弈才刚刚进入中场。是彻底断绝往来,还是在谈判桌上拿回属于自己的流量分成?在这个AI横行的时代,每一个内容创作者都在守卫自己的最后一片领地。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/us-uk-media-reject-ai-for-traffic.html


粤公网安备 44011302004783号 













