OpenAI 15分钟狂抓LLMs.txt!网站隐私告急?谷歌却说...

2025-07-24Google Ads

Image

近日,关于人工智能系统是否抓取网站上的LLMS.txt文件引发了讨论。LLMS.txt文件通常用于告知AI系统哪些内容不应该被抓取,类似于robots.txt文件对传统搜索引擎的作用。

Ray Martinez先生,一位技术领域的从业者,分享了一张截图,显示OpenAI正在抓取他网站上的LLMS.txt文件。他在社交平台X上表示:“日志文件分析显示,OpenAI正在抓取我几个网站上的LLMs.txt文件。它大约每15分钟ping一次我们的服务器,以寻找更新。”
Openai Crawling Llms Txt Files Log

这一现象引起了一些网站管理员的关注,他们开始检查自己的服务器日志,想看看是否也出现了类似的情况。

与此同时,谷歌公司的Gary Illyes先生在Google Search Central Live Deep Dive活动中明确表示,谷歌目前不支持LLMS.txt文件,并且也没有计划支持。新媒网跨境了解到,这一表态是由Kenichi Suzuki先生在领英上分享的。
Google Event

据了解,Anthropic、ElevenLabs和PineCone等公司已经发布了关于LLMS.txt文件的相关文档。一篇名为《LLMs.txt文件是否正在网络上被广泛应用?》的博文也对此进行了深入探讨。新媒网认为,LLMS.txt文件的出现,反映了AI技术发展过程中,内容创作者和平台对于数据使用的规范和控制的关注日益增加。

尽管谷歌明确表示目前不使用LLMS.txt文件,但OpenAI的行为表明,至少有一些AI系统正在开始关注这一文件。新媒网跨境获悉,这可能预示着未来AI系统在数据抓取和使用方面,将会有更加精细化的规则和标准。

外媒报道,关于LLMS.txt文件的讨论,反映了人工智能发展中的一个重要趋势,即如何在数据利用和尊重网站所有者意愿之间取得平衡。随着AI技术的不断进步,相关的规范和标准也需要不断完善,以确保技术的健康发展。

在X平台上,相关话题也引发了广泛的讨论。人们对AI系统抓取LLMS.txt文件的行为,以及未来可能的发展方向,表达了各自的看法。

目前,关于AI系统是否应该抓取LLMS.txt文件,以及如何制定相关的标准,仍然存在争议。但可以肯定的是,随着AI技术的日益普及,这一问题将会变得越来越重要。来自美国的专家表示,需要行业各方共同努力,制定出合理的规范和标准,以促进AI技术的健康发展。

新媒网跨境预测,未来LLMS.txt文件可能会成为一种行业标准,被越来越多的网站和AI系统所采用。这将有助于更好地保护网站所有者的权益,并促进AI技术的可持续发展。

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/6681.html

评论(0)

暂无评论,快来抢沙发~
OpenAI开始抓取网站上的LLMS.txt文件,该文件旨在告知AI系统哪些内容不应被抓取,类似于robots.txt。谷歌目前不支持该文件。LLMS.txt的出现反映了内容创作者对数据使用的规范和控制日益增加的关注,未来或将成为行业标准。
发布于 2025-07-24
查看人数 869
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。