OpenAI 15分钟狂抓LLMs.txt!网站隐私告急?谷歌却说...
近日,关于人工智能系统是否抓取网站上的LLMS.txt文件引发了讨论。LLMS.txt文件通常用于告知AI系统哪些内容不应该被抓取,类似于robots.txt文件对传统搜索引擎的作用。
Ray Martinez先生,一位技术领域的从业者,分享了一张截图,显示OpenAI正在抓取他网站上的LLMS.txt文件。他在社交平台X上表示:“日志文件分析显示,OpenAI正在抓取我几个网站上的LLMs.txt文件。它大约每15分钟ping一次我们的服务器,以寻找更新。”
这一现象引起了一些网站管理员的关注,他们开始检查自己的服务器日志,想看看是否也出现了类似的情况。
与此同时,谷歌公司的Gary Illyes先生在Google Search Central Live Deep Dive活动中明确表示,谷歌目前不支持LLMS.txt文件,并且也没有计划支持。新媒网跨境了解到,这一表态是由Kenichi Suzuki先生在领英上分享的。
据了解,Anthropic、ElevenLabs和PineCone等公司已经发布了关于LLMS.txt文件的相关文档。一篇名为《LLMs.txt文件是否正在网络上被广泛应用?》的博文也对此进行了深入探讨。新媒网认为,LLMS.txt文件的出现,反映了AI技术发展过程中,内容创作者和平台对于数据使用的规范和控制的关注日益增加。
尽管谷歌明确表示目前不使用LLMS.txt文件,但OpenAI的行为表明,至少有一些AI系统正在开始关注这一文件。新媒网跨境获悉,这可能预示着未来AI系统在数据抓取和使用方面,将会有更加精细化的规则和标准。
外媒报道,关于LLMS.txt文件的讨论,反映了人工智能发展中的一个重要趋势,即如何在数据利用和尊重网站所有者意愿之间取得平衡。随着AI技术的不断进步,相关的规范和标准也需要不断完善,以确保技术的健康发展。
在X平台上,相关话题也引发了广泛的讨论。人们对AI系统抓取LLMS.txt文件的行为,以及未来可能的发展方向,表达了各自的看法。
目前,关于AI系统是否应该抓取LLMS.txt文件,以及如何制定相关的标准,仍然存在争议。但可以肯定的是,随着AI技术的日益普及,这一问题将会变得越来越重要。来自美国的专家表示,需要行业各方共同努力,制定出合理的规范和标准,以促进AI技术的健康发展。
新媒网跨境预测,未来LLMS.txt文件可能会成为一种行业标准,被越来越多的网站和AI系统所采用。这将有助于更好地保护网站所有者的权益,并促进AI技术的可持续发展。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。











评论(0)