OpenAI 15分钟狂抓LLMs.txt！网站隐私告急？谷歌却说...

近日，关于人工智能系统是否抓取网站上的LLMS.txt文件引发了讨论。LLMS.txt文件通常用于告知AI系统哪些内容不应该被抓取，类似于robots.txt文件对传统搜索引擎的作用。

Ray Martinez先生，一位技术领域的从业者，分享了一张截图，显示OpenAI正在抓取他网站上的LLMS.txt文件。他在社交平台X上表示：“日志文件分析显示，OpenAI正在抓取我几个网站上的LLMs.txt文件。它大约每15分钟ping一次我们的服务器，以寻找更新。”
Openai Crawling Llms Txt Files Log

这一现象引起了一些网站管理员的关注，他们开始检查自己的服务器日志，想看看是否也出现了类似的情况。

与此同时，谷歌公司的Gary Illyes先生在Google Search Central Live Deep Dive活动中明确表示，谷歌目前不支持LLMS.txt文件，并且也没有计划支持。新媒网跨境了解到，这一表态是由Kenichi Suzuki先生在领英上分享的。
Google Event

据了解，Anthropic、ElevenLabs和PineCone等公司已经发布了关于LLMS.txt文件的相关文档。一篇名为《LLMs.txt文件是否正在网络上被广泛应用？》的博文也对此进行了深入探讨。新媒网认为，LLMS.txt文件的出现，反映了AI技术发展过程中，内容创作者和平台对于数据使用的规范和控制的关注日益增加。

尽管谷歌明确表示目前不使用LLMS.txt文件，但OpenAI的行为表明，至少有一些AI系统正在开始关注这一文件。新媒网跨境获悉，这可能预示着未来AI系统在数据抓取和使用方面，将会有更加精细化的规则和标准。

外媒报道，关于LLMS.txt文件的讨论，反映了人工智能发展中的一个重要趋势，即如何在数据利用和尊重网站所有者意愿之间取得平衡。随着AI技术的不断进步，相关的规范和标准也需要不断完善，以确保技术的健康发展。

在X平台上，相关话题也引发了广泛的讨论。人们对AI系统抓取LLMS.txt文件的行为，以及未来可能的发展方向，表达了各自的看法。

目前，关于AI系统是否应该抓取LLMS.txt文件，以及如何制定相关的标准，仍然存在争议。但可以肯定的是，随着AI技术的日益普及，这一问题将会变得越来越重要。来自美国的专家表示，需要行业各方共同努力，制定出合理的规范和标准，以促进AI技术的健康发展。

新媒网跨境预测，未来LLMS.txt文件可能会成为一种行业标准，被越来越多的网站和AI系统所采用。这将有助于更好地保护网站所有者的权益，并促进AI技术的可持续发展。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/6681.html