谷歌揭秘！美司法部文件曝：AI算法训练，人工评估员与70天搜索日志同为核心数据！

美国司法部与谷歌的法律文件披露：人工质量评估员如何直接参与谷歌核心算法训练

新媒网跨境获悉，一份来自美国司法部（DOJ）与谷歌（Google）诉讼案的法庭文件，揭示了谷歌搜索引擎核心排名模型运作的深层机制。该文件明确指出，人工质量评估员的评分，是谷歌训练其核心排名模型的直接且基础性输入数据。这一发现，与谷歌公司长期以来在公开场合所持的立场有所不同，引发了行业内的广泛关注。

突发事件：法庭文件揭示谷歌排名算法核心机密

事件概述：
在美国司法部与科技巨头谷歌的反垄断诉讼中，一项关键的法庭文件和证词被公之于众。该披露的核心内容是，谷歌赖以构建其搜索结果排序的AI模型，并非仅仅将人工质量评估员的评分作为“间接基准”或“反馈意见”，而是将这些评分直接作为训练数据的关键组成部分。

具体来说，涉案的谷歌核心排名模型，包括RankEmbed及其后续迭代版本RankEmbedBERT，在训练过程中直接使用了来自人工评估员的评分数据。这些模型对谷歌搜索引擎的质量和用户体验至关重要。文件还指出，这些评估员的评分与用户的查询及点击日志一同，构成了模型训练的基础性数据来源。

这一重磅消息的披露，源于法庭证词，其中谷歌搜索业务副总裁潘杜·纳亚克博士（Dr. Pandu Nayak）的证言尤其引人注目。纳亚克博士在证词中强调，经过人工评估员训练的RankEmbedBERT模型，显著提升了谷歌在处理复杂长尾查询方面的性能，这正是对语言理解能力要求极高的领域。

相关方回应：
尽管法庭文件详细揭示了人工评估员评分在谷歌排名模型训练中的直接作用，但原文并未提及美国司法部或谷歌公司在此披露后的即时公开声明或应对措施。不过，此次披露的内容本身，构成了一种对谷歌公司过往公开声明的“回应”。长期以来，谷歌一直向公众强调，人工评估员的评分并不会直接影响任何单个网站的排名。此次法庭文件的公开，使得行业内外对于谷歌算法透明度和其公开表述的理解产生了新的审视。

事态进展：
目前，这些法庭文件和证词的披露，已成为美国司法部对谷歌反垄断诉讼中的重要证据。行业分析师和搜索引擎优化（SEO）专家正在根据这些最新信息，重新评估谷歌搜索算法的实际运行机制及其对数字生态可能产生的影响。此次披露无疑将进一步推动关于搜索算法透明化和大型科技公司市场主导地位的讨论。

核心数据洞察：人工评估员评分的深层价值

此次披露并非空穴来风，其背后是具体的数据和技术细节。新媒网跨境了解到，法庭文件明确指出，人工评估员的评分数据并非辅助性信息，而是与搜索日志并列的，用于训练谷歌关键AI排名模型的核心数据源。

数据来源与统计周期：
本次核心信息的来源是“美国司法部与谷歌诉讼案的补救意见书”（DOJ v. Google remedial opinion）以及庭审证词。这些文件和证词记录了谷歌公司内部技术专家对于其排名系统工作原理的阐述。文件中并未明确提及具体的统计周期，但其描述的是谷歌当前及过去一段时间内的排名模型训练实践。

核心数据呈现：
法庭文件清晰地阐明，RankEmbed及其升级版RankEmbedBERT这两个至关重要的AI排名模型，依赖于两大主要数据来源进行训练：

搜索日志数据： 占比约为70天的搜索日志数据。
人工评估员评分： 由人工评估员生成并用于衡量自然搜索结果质量的评分。

这意味着，人工评估员对网页质量的判断，被直接嵌入到这些机器学习系统中，成为决定数十亿网页如何排序的基础。

数据维度与结构：
此次披露的数据，深入到谷歌排名算法的训练维度。它揭示了：

数据类型整合： 人工评估员的评分与用户互动数据（点击和查询日志）被结合使用，共同为RankEmbed模型提供底层数据。这种结合使得模型能够学习到用户行为与人工判断之间复杂的关联性。
模型核心组成： 这些评分是训练AI排名系统（如RankEmbed和RankEmbedBERT）的“基础性数据集”，而非简单的外部反馈。它们直接影响模型对网页相关性和质量的理解和学习。

数据趋势与现象：
数据所反映出的最显著趋势和现象是，人工评估员的深度参与，尤其在处理复杂查询时，显著提升了谷歌的搜索性能。谷歌搜索副总裁潘杜·纳亚克博士的证词明确指出：“RankEmbedBERT再次带来了非常显著的影响，尤其在长尾查询中，其语言理解能力的重要性更加凸显。”这一表述揭示了，人工评估员的判断对于训练AI模型理解复杂语言、提升搜索结果质量方面具有不可替代的作用。这表明，在AI时代，人类的智慧和判断依然是驱动高精度算法进步的关键要素。

行业背景关联：
此次披露将人工评估员的角色置于当前AI和机器学习技术飞速发展的宏观背景之下。它强调了“人工在环”（Human-in-the-Loop）在训练高质量AI系统中的核心价值。在算法日趋复杂、用户需求日益多样化的今天，仅依靠机器自动学习难以完全捕捉人类对于内容质量、相关性和意图的细微理解。因此，人工评估员的直接参与，成为谷歌保持其在搜索质量方面优势的深层原因之一。同时，这也在一定程度上回应了外界对大型科技公司算法透明度的呼声，尽管是以法庭文件披露的形式而非公司主动公开。

谷歌过往声明与法庭披露的对比解析

长期以来，谷歌在公开场合对其质量评估员（quality rater）的角色有着明确的表述，但此次法庭文件的披露，使得这些表述与实际操作之间的微妙差异浮出水面。

谷歌的公开立场：
多年来，谷歌一直坚持其官方指导方针，即质量评估员的评分不会直接影响任何单个网站的排名。公司曾多次强调，评估员的主要任务是提供反馈，帮助“衡量搜索结果的质量”并“评估系统变化”。这种表述通常被解读为，评估员的影响是间接的，他们更像是帮助工程师调整和优化整体系统的“基准”或“晴雨表”，而非直接的排名信号。换言之，他们的工作是辅助谷歌了解其算法的宏观表现，而不是手动将某个网页提升或降低排名。

法庭披露的偏差与澄清：
然而，此次法庭文件的公开，揭示了人工评估员的影响力远比此前外界理解的更为直接和系统化。尽管单一评估员的评分确实不会“手动”改变某个页面的排名，但所有评估员的聚合评分，却构成了谷歌核心排名算法赖以建立和训练的基础数据集。

文件明确指出：“RankEmbed模型利用这些数据进行训练，直接提升了公司相对于竞争对手的质量优势。”这表明，评估员的集体判断被用来训练核心的AI排名模型，这些模型进而自动化地决定了搜索结果的排序。

本质上，谷歌此前的声明在“单个评估员评分不直接改变单个网站排名”的技术层面是正确的。但法庭的调查结果揭示了一个更深层次、更具系统性的联系：评估员的集体判断被用于训练构成谷歌算法核心的AI排名模型。这种作用远比谷歌历来强调的“反馈”或“基准测试”角色更具影响力。此次披露，不仅为理解谷歌搜索算法提供了关键视角，也促使行业重新思考算法透明度与信息披露的边界。
DOJ
Strategic SEO 2025 - Hobo - Ebook