劲爆!谷歌Q*系统内幕:网站0.4分定生死!

在当今这个信息爆炸的时代,如何在海量的网络内容中脱颖而出,赢得用户的青睐,并获得搜索引擎的认可,是每一个内容创作者和网站运营者都必须面对的核心课题。对于致力于为用户提供优质内容与服务的平台而言,构建一个健康、可信赖的数字生态系统至关重要。在这场关乎内容质量的“竞赛”中,谷歌(Google)作为全球领先的搜索引擎,其背后一套复杂而精密的评估体系,正持续引导着整个互联网内容的发展方向。
新媒网跨境获悉,谷歌的核心理念,最终都归结为一个字:信任。
谷歌的“搜索质量评估指南”(Search Quality Rater Guidelines,简称QRG)、贯穿其中的E-E-A-T(经验、专业、权威、信任)框架,以及其近年来推出的“实用内容更新”(Helpful Content Update),并非各自独立的举措。它们是一套紧密相连的系统,旨在清晰地定义、精确地衡量并积极地奖励那些真正值得用户信赖的内容。根据谷歌官方的说法,“在这些方面中,信任是最重要的”。这正是其评估模型所依据的根本原则。E-E-A-T框架中的其他三个要素——经验、专业和权威——都是为支撑这个核心的“信任”概念而服务的。
一个页面,即使在某些方面展现出了一定的专业性或经验,但如果其本身缺乏可信度,那么它最终获得的质量评分将是最低的。正如最新的指南所明确指出的:“信任是E-E-A-T家族中最重要的成员,因为不可信的页面,无论它们看起来多么有经验、多专业或多有权威,其E-E-A-T评分都会很低。”这一点在“关乎你财富与生命”(Your Money or Your Life,简称YMYL)等高度敏感和重要的领域尤为突出。在这些领域,缺乏可信度可能会给用户带来实际的损害和风险。
谷歌前高管埃里克·施密特早在2014年就曾指出:“即便内容再引人入胜,如果发布者匿名无名,也很难获得应有的关注,因为其排名将会异常低下。”这深刻揭示了内容背后“实体”的重要性。
深度剖析Q-Star(Q*):质量评估的核心动力
2008年,谷歌前首席执行官埃里克·施密特曾有句名言:“品牌是你在泥潭中脱颖而出的方式。”这句话描绘了在快速扩张、初期相对缺乏规范的互联网环境中,那些备受信任的品牌如何作为质量和可靠性的信号,帮助用户在海量可能虚假或低劣的内容中辨别方向。在他看来,品牌不是问题本身,而是解决在线信息“泥潭”挑战的关键,它提供了一种组织和信任可用内容的方式。
建立网站层面的质量评分,并非谷歌近年来的新概念。其源头可以追溯到2011年的“熊猫算法更新”(Google Panda update),这是谷歌首次尝试在全站范围内“降低低质量网站的排名”。如今的Q*系统(内部代号为Q-Star),正是这一早期尝试的直接继承者。它是一个综合性的评分体系,独立于具体的搜索查询,旨在反映一个网站的整体可信度和实用性。
在早年美国司法部与谷歌的诉讼中,谷歌搜索副总裁金亨镇在宣誓证词中强调了该系统举足轻重的作用。他指出:“Q*(页面质量,即信任度概念)极其重要”,并作证称“质量评分在今天依然至关重要。页面质量是人们抱怨最多的问题”。他回忆道,谷歌正是为了应对“内容农场”泛滥、充斥搜索结果的问题,才组建了页面质量团队,并开发出识别权威来源、降低低质量页面排名的方法。
这项质量评分“通常在多个查询中保持静态,与特定查询无关”,使其成为一个持续性的网站声誉指标,其权重“主要与网站本身而非查询相关”。简而言之,谷歌通过这套系统“持续奖励那些展现出经验、专业、权威和信任(E-E-A-T)的页面,并且这种良好声誉会在不同查询中得以维持”。
Q*评分并非基于单一因素,而是一个综合性指标,由多个关键输入参数共同决定:
- 链接基础权威(PageRank):Q*评分的一个关键输入是PageRank算法的现代升级版。如今,它被定义为衡量一个页面与“已知优质来源”之间的“距离”。该系统会针对特定主题,使用一组预设的“种子”信任网站,而那些在网络链接图中离这些种子网站越近的页面,将获得更高的PageRank得分,从而为更高的Q*评分做出贡献。
- 品牌权威与用户互动:对于那些拥有足够用户数据的老牌网站,Q*评分会受到真实世界中品牌权威信号的显著影响。谷歌通过考察“用户搜索您的品牌或域名名称的次数”、“他们选择在搜索结果中点击您网站的频率”,以及“品牌在锚文本中出现的频率”来衡量这一点。此外,来自NavBoost等系统(利用Chrome浏览器数据)的用户互动数据也为品牌权威提供了重要补充。
- 新网站的预测模型:当一个网站是全新上线或缺乏足够的用户数据时,谷歌会采用一种预测模型。它会分析网站内容,生成一个“短语模型”(即网站的数值表示),然后“根据其与已知可信实体的相似度,预测您的网站可能有多优秀”。
显然,Q*系统背后包含了大量精密的考量。
从内部技术文档曝光中洞察真相
这是一幅关于内容数据仓库模块和属性的可视化图,展示了它们如何协同工作:
解构“CompressedQualitySignals”模块
当这份内部技术文档曝光时,新媒网跨境了解到,业内人士最先寻找的就是一个关于质量评分的模块。如果说Q*系统是计算质量的“引擎”,那么2024年曝光的这份文件,则为我们提供了其官方的“零部件清单”。值得一提的是,针对这次事件,谷歌已证实其真实性,并在最近美国司法部与谷歌的反垄断诉讼中,通过宣誓证词对此做出了评论:“确实存在谷歌文件泄露事件,其中提到了谷歌排名系统中的某些组件,但这些文件并未深入阐述具体的曲线和阈值。仅凭这些文件不足以完全弄清楚其运作方式,但其中的数据可能确实如此。”
我们深入研究了一个名为 GoogleApi.ContentWarehouse.V1.Model.CompressedQualitySignals 的组件模块。根据其描述和属性,这正是“质量评分”概念在技术层面的确凿证据。其描述揭示了其关键作用:“一个包含每篇文档被压缩信号的消息,这些信号被包含在 Mustang 和 TeraGoogle 中。对于 TeraGoogle,此消息被包含在每文档数据中,这意味着它可以在初步评分中使用。”
让我们来详细解读。这些是用于“初步评分”的“压缩信号”。文档中还附带了一则醒目的警告:“注意:对于 TeraGoogle,这些数据以非常有限的服务器内存(闪存)形式存在,服务着海量文档。”这并非随机的数据集合,而是一篇文档至关重要的“核心档案”。它们是谷歌为了在应用更复杂的查询时计算之前,能够即时访问的、对于索引中的每一篇文档做出基础质量判断的少数关键信号。这个模块,正是为Q*系统提供数据的“速查表”。那么,它包含了哪些内容呢?简直就是一份详尽的质量因素“点名册”。这个模块存储着谷歌质量评分的输入数据,我们可以按主题将其归类:
- 核心质量与权威评分
siteAuthority:我们已经确认这是应用于Q*系统的网站级别评分属性。pqData:编码后的“页面质量”信号。unauthoritativeScore:针对非权威内容的特定信号。lowQuality:针对低质量页面的通用评分。vlqNsr:代表“超低质量神经网站排名”。文档指出,这是针对“视频”内容类型的特定质量评分。nsrConfidence:谷歌对其“中性网站排名”的置信度评分,这是一个关键的元信号。pairwiseqScoringData:来自“成对质量”模型的数据,这是一种通过比较文档对来对文档进行排名的机器学习方法(例如,“文档A是否优于文档B?”)。crapsAbsoluteHostSignals:来自Craps系统(谷歌的点击和曝光跟踪系统)的主机级别(全站范围)信号。这直接将用户点击行为与核心质量画像关联起来。
- 降权与惩罚
pandaDemotion和babyPandaV2Demotion:直接证实了“熊猫算法更新”的遗留影响,并作为核心质量信号捆绑在一起。scamness:一个衡量页面“欺诈性”程度的评分(0-1023)。serpDemotion:指示页面是否因搜索结果中用户的负面行为而被降权的信号。navDemotion:可能与网站导航不良相关的降权。exactMatchDomainDemotion:降权信号,可能旨在降低“完全匹配”关键词域名的排名。anchorMismatchDemotion:当入站链接的锚文本与页面内容不匹配时触发的降权。
- 提升与细粒度/主题评分
authorityPromotion:与降权相对,一个用于“权威提升”的整数。productReview... (group):一整组属性,显示了一个针对“产品评论”主题的细粒度评分系统。这包括:productReviewPDemoteSite:针对整个网站的降权置信度评分。productReviewPUhqPage:衡量“页面成为超高质量评论页面可能性”的评分。nsrOverrideBid:Q*系统中用于“紧急覆盖”的值,这是针对特定质量相关情况保留的强大操作。
- 主题与专题信号
topicEmbeddingsVersionedData:关于主题嵌入的数据,这是衡量网站主题权威性和专注度的关键信号。
- 一个“鲜活”的评分:实验性与版本化信号
experimentalQstarSignal,experimentalQstarSiteSignal:一组“实验性”信号,明确由“实验性Q*组件”用于“快速运行新组件的实时实验(LEs)”。nsrVersionedData:“版本化NSR评分”,用于“持续评估即将推出的NSR版本并评估质量影响”。
这个模块在技术层面验证了我们的论点。它并非最终评分,而是直接输入到Q*系统的原始数据。它集谷歌有机质量评分的“核心档案”、“速查表”和“测试实验室”于一体。
一项技术发现的启示
为了进一步证实网站级别质量评分的存在及其功能,外媒分析师马克·威廉姆斯-库克曾发现并分析了一个独立的谷歌API端点。这个技术发现实时揭示了谷歌如何对网站进行评分,其中一个名为 Site_Quality 的属性被揭示为决定网站可见性的关键“守门人”。威廉姆斯-库克的分析覆盖了超过9000万次查询,结果显示谷歌以0到1的范围,在子域名级别计算这个分数。
有趣的是,他发现了一个特定的阈值:质量评分低于0.4的网站,将没有资格获得“精选摘要”(Featured Snippets)和“人们还会问”(People Also Ask)等显著的搜索功能展示。这表明,一个网站必须通过基本的质量检查,其内容才有机会竞争这些高度可见的搜索结果页面(SERP)功能。他的研究证实,这个分数来源于与技术文档曝光和司法部诉讼中提及的相同类型的信号:品牌可见性(品牌搜索)、用户互动(点击)以及锚文本相关性。这些发现为“网站权威性”的概念提供了一个量化层面,表明它不仅是一个抽象的概念,而是一个可衡量的分数,对网站的排名潜力具有直接、基于阈值的后果。
实用内容更新:以算法强制执行信任
“实用内容更新”(Helpful Content Update,简称HCU)正是这些原则的主要算法强制执行机制。HCU最初是一个独立的系统,现在已完全整合到谷歌的核心排名算法中。正如谷歌搜索联络员丹尼·沙利文所言:“它现在已成为一个‘核心排名系统’的一部分,正在评估各种类型的实用性。”
HCU旨在奖励那些“以人为本”的内容,让访问者在浏览后感到“满意”。这种“满意体验”与“信任”有着内在的联系。该更新会惩罚那些侵蚀信任的内容,例如那些仅仅总结他人观点而未添加自身价值的页面。通过这种方式,HCU和E-E-A-T“紧密相连”,HCU的作用在于通过算法识别出人工评估员在QRG中寻找的实用性和可信度信号。
最终,Q*评分是这项基于信任的整体评估的技术体现。QRG中阐述并通过HCU强制执行的原则,正是Q*系统旨在衡量的输入。一个高Q*评分,是网站成功展示出谷歌指南优先考虑的信任、经验和专业信号的算法反映。
失效状态:“孤立实体”假说与QRG第2.5.2节
一个网站即使拥有优质内容和坚实的链接,为何有时仍然难以获得好的排名?“孤立实体”假说提供了一个令人信服的答案,其基础在于谷歌人工质量评估员收到的一项具体指令。该假说认为,谷歌的算法更新旨在打击“孤立实体”(Disconnected Entities)——即那些缺乏与可信赖的真实世界实体建立强大、可验证联系的网站。
这并非仅仅是理论推测,它基于QRG中明确的指示。具体而言,第2.5.2节指导评估员查明网站的拥有者和运营者,以及谁对内容负责。缺乏这些信息,正是“孤立实体”的定义。当一个网站未能通过这项基础的透明度测试时,其质量信号将无法依附于任何已知的实体。这会破坏整个E-E-A-T评估体系:没有已知的作者或组织,经验和专业性就无法核实;权威性会被削弱,因为链接和提及无法指向一个被认可的实体;信任更是从根本上缺失,从而在Q*评估中留下一个关键的空白。
一个“孤立实体”,即使内容撰写精良,也无法通过最基础的信任检查。正如“实用内容更新”的解释所暗示的,这样的网站从定义上来说就是“不实用”的,因为“缺乏信任是(至少是其中之一)扼杀任何网站排名的最大杠杆”。Q*系统无法为其授予高“Site_Quality”评分,因此该网站很可能会被过滤或抑制。
重新校准:核心更新的重要性
谷歌工程师加里·伊利耶斯在2016年曾表示:“我们发现该网站试图操纵我们的系统……所以我们会调整排名。我们会将该网站降级,以确保这种行为不再有效。”
谷歌的核心更新,正是整个质量评估系统进行重新校准的关键时刻。与信任、实体联系和实用性相关的信号需要时间来巩固。在两次更新之间,纯粹的链接权重有时可能会在高度竞争的领域占据主导地位。然而,在核心更新期间,Q*系统会重新平衡所有输入信号。E-E-A-T框架的全部权重“得以显现”,从而修正任何单一因素的影响。
这些更新旨在“纠正排名并终止和清除垃圾信息”,其中垃圾信息被定义为“一个未知、孤立、不健康的实体”。正是在这些时刻,那些成功地将自己打造成值得信赖、相互关联的实体的网站,其质量会得到认可,而那些孤立或不实用的网站,则可能会发现其可见度下降。
人工质量评估员的角色
整个质量框架的测试和完善,都离不开谷歌约16000名人工搜索质量评估员的贡献。这些评估员的任务是根据QRG中的详细指令来评估搜索结果的质量。他们的反馈随后被用于评估、训练和优化排名算法。尽管他们的评分不会直接改变特定页面的排名,但他们提供了“真实数据”,教会谷歌的机器学习系统人类认为什么是高质量、值得信赖的内容。
谷歌质量评估指南:Q*评分的蓝图
有理由推断,QRG中提到的所有其他因素,也同样被输入Q*评分(甚至可能是P*评分)的系统所衡量。自2014年最初的指南泄露以来,我们一直建议搜索引擎优化(SEO)专业人士将QRG视为谷歌算法试图复制的信号的技术蓝图。2024年的技术文档曝光,为这一长期以来的观点提供了技术层面的证实。QRG中指导人工评估员查找的一切,都可以与技术文档中揭示的 plausible 算法信号相连接。这些并非抽象概念,而是喂养Q*引擎的具体“原料”。
其他值得关注的例子包括:
- 信任(“何人、如何、为何”的考量):QRG信任评估的基础是透明度。谷歌自己的文档鼓励创作者通过提问“何人、如何、为何”来自我评估其内容:
- “何人”(Who):直接对应谷歌质量评估指南的第2.5.2节,该节指示评估员查找谁对网站负责。未能提供明确的作者和所有权信息是“孤立实体”的主要信号,这是Q*评分的基础。
- “如何”(How):关注内容的创作过程。谷歌想知道,“您是否使用了AI辅助?(如果使用了,如何使用的?)”。这不仅仅是一个哲学问题。技术文档曝光证实了与
contentEffort属性的直接技术关联,该属性被描述为“基于大语言模型的文章页面努力程度估算”。这个信号帮助谷歌判断一个页面复制的难易程度,这是低投入、可能由AI生成内容的关键指标。此外,QRG还指示评估员检查“典型的AI错误,例如虚构的参考文献或前后不一致的句子”,通过算法标记那些看似未经上下文处理而大规模生产的内容。 - “为何”(Why):评估内容的意图。评估员被要求判断内容的存在是“主要为了帮助人们”还是“主要为了吸引搜索流量”。这与“实用内容更新”的目标相符,该更新旨在惩罚那些侵蚀信任的内容。
技术文档中与AI相关的关键属性
技术文档中包含一些具体的属性,这些属性似乎与评估AI和低投入内容直接相关。这些并非仅仅是理论概念;它们是谷歌系统旨在捕捉的可衡量信号。
最重要的属性是 contentEffort。文档中将其描述为“基于大语言模型的文章页面努力程度估算”。这是至关重要的证据。它表明谷歌正在利用其自身的大语言模型(LLMs)来分析内容,并根据感知到的内容创作“努力程度”赋予一个分数。其目的很可能是识别那些易于复制的内容,这是低质量、大规模生产或AI生成文章的典型特征。除了 contentEffort,技术文档还提到了其他复杂的网站内容质量模型,例如 rhubarb,被描述为“基于网站URL增量信号的质量评分”。这表明存在一个多方面的系统,通过算法来评估内容质量,而不仅仅是简单的文本分析。
与质量评估指南的直接联系
这些技术证据是谷歌给人工评估员的指令和给内容创作者提供的指导的另一面。
- 惩罚低投入的AI内容:质量评估指南(QRG)对此有明确的规定。如果一个页面的主要内容是“自动或AI生成……投入极少或没有投入,原创性极低或没有原创性,且对访问者几乎没有附加价值”,那么它可能会获得“最低”的质量评分。
contentEffort属性似乎就是识别这种情况的直接算法工具。 - 识别AI特征:指南还培训评估员寻找“典型的AI错误,例如虚构的参考文献或前后不一致的句子”,并惩罚那些看起来像“未经上下文处理的大规模生产”内容。这表明人类和算法都肩负着识别未经编辑的、低质量AI输出的明显特征的任务。
- 内容创作的“如何”:所有这些都与谷歌“何人、如何、为何”框架中的“如何”部分直接相关。在他们为创作者提供的官方文档中,谷歌要求创作者通过询问有关自动化的问题进行自我评估:
- “自动化(包括AI生成)的使用是否通过披露或其他方式对访问者显而易见?”
- “您是否提供了关于如何使用自动化或AI生成内容背景信息?”
- “您是否解释了为何自动化或AI被认为对内容生产有用?”
contentEffort 信号的存在,结合这些明确的指导,证实了一个直接的因果联系。谷歌原则上不反对AI生成内容,但它建立了技术系统来衡量这些内容的投入、原创性和价值。同时,它也告诉创作者,创作过程的透明度(即“如何”)是建立信任的关键组成部分。关于AI使用的声明,直接回应了谷歌希望创作者解决的问题。
其他值得注意的方面包括:
- 广告体验:QRG指示评估员惩罚那些“广告数量过多,分散或干扰主要内容”的页面。技术文档通过
Interstitial等属性证实了这一点,Interstitial特指干扰性全屏广告。 - 移动友好性:QRG要求评估员考虑内容“在移动设备上查看时是否良好显示”。这直接反映在技术文档中
SmartphonePerDocData模块的存在,证实了一套专门针对移动设备可用性的质量信号。 - 页面布局和可用性:评估员被告知要评估“访问者是否能轻松导航到或找到页面的主要内容”。技术文档证实,谷歌衡量了这些方面的代理指标,例如文档中术语的平均字体大小,这有助于确定内容的视觉层次结构和可读性。
- 网站维护:QRG会惩罚那些看起来未经维护或废弃的网站,例如,拥有大量“死链”的网站。这通过技术健康信号进行算法衡量。一个拥有大量死链或服务器错误的网站,会向Q*评分系统发送负面信号。
这表明QRG不仅是一个哲学指导,更是我们所掌握的、决定网站基础质量评分输入的最详细的规范表。简而言之,Site_Quality是Q-Star的输出。而E-E-A-T,正是谷歌的有机质量评分。
新媒网跨境认为,在未来,随着人工智能技术的飞速发展,特别是大语言模型(LLMs)的广泛应用,内容创作的门槛可能会进一步降低。然而,谷歌等搜索引擎对内容质量的追求将永无止境。它所构建的这套复杂而精密的评估体系,正是在引导内容创作者回归本源:以人为本,提供真实、有价值、值得信赖的优质内容。只有坚持这样的创作理念,才能在数字世界的洪流中稳健前行,赢得用户的青睐和搜索引擎的持续认可。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/google-q-star-leak-04-site-death.html


粤公网安备 44011302004783号 













