HCU血洗!90%流量暴跌,谷歌实体信任是关键!

全球互联网生态正持续演进,对于众多致力于“出海”的中国企业和跨境从业者而言,深入理解海外主流搜索引擎(尤其是谷歌)的排名机制至关重要。近年来,随着行业动态的不断披露,我们对谷歌搜索排名系统的认知也变得更加清晰和具象化。这些信息不仅揭示了核心算法的构成,更指明了未来在海外市场获取数字流量和建立品牌影响力的关键方向。
1. 美国司法部与谷歌的诉讼及“内容仓库”文件披露,如何重塑我们对谷歌搜索排名的理解?
2023年在美国发生的司法部诉谷歌反垄断案,以及2024年初意外泄露的“内容仓库”内部文件,深刻地改变了我们对谷歌搜索排名机制的认知。此前,谷歌对内部排名因素保持高度保密,甚至对某些因素公开否认或语焉不详。然而,在司法部诉讼中,谷歌的高级工程师和高管们提供了宣誓证词,加之内部API文档的泄露,使得前所未有的信息得以公开。其中一些关键的发现包括:
核心排名系统的确认:诉讼揭示了一个模块化的、多阶段的排名流程,它由一系列独立的、手工打造的系统组成,例如“话题相关性(Topicality T*)”、“质量评分(Quality Score Q*)”和“导航提升(Navboost)”,而非单一的、庞大的AI算法。这表明谷歌的排名并非由一个“黑箱”系统全盘决定,而是多个精细化模块协同工作的结果。
用户互动数据的核心地位:尽管谷歌此前在公开场合对用户点击数据在排名中的作用有所保留,但本次披露确认,用户点击数据(包括停留时间、“好”点击与“坏”点击、以及“最终最长点击”)是“T*”和强大的“Navboost”系统的基础信号。“Navboost”系统尤其会分析长达13个月的用户聚合点击数据,来精细调整搜索结果的排名。这印证了用户行为对内容价值判断的重要性。
网站级别权威性分数的存在:谷歌长期以来否认存在“域名权重”或“网站权威度”的说法,但现在证实其内部存在一个名为“Q*”(质量评分)的、大致稳定且与查询无关的衡量指标。这个指标用于评估网站的整体可信度和质量。“PageRank”是“Q*”的一个关键输入,表明高质量的外部链接依然是评估网站信任度的重要标准。
机器学习的角色定位:像“RankBrain”和“DeepRank”这样的机器学习系统,主要用于处理特定的复杂任务,例如理解复杂和新颖的搜索查询,而不是作为无所不包的“排名大脑”。谷歌即便在这些复杂系统中,也积极追求透明度和可控性,更倾向于使用手工设定的信号作为基础排名元素。
新网站的“沙盒期”:此前被否认的“沙盒”概念,即新网站在获得良好排名之前会经历一个考察期,在这次披露中通过“hostAge”属性得到了验证。这个属性用于“沙盒化新发垃圾信息”,意味着新网站确实需要一个初始的信任建立期,才能充分参与排名竞争。
策略性模糊处理:此次集体证据表明,谷歌的公开叙述与其内部实际运作之间存在着有意的差距。这可能是一种策略,旨在保护搜索结果的公正性,例如不公开承认基于点击的排名,以防止不当操纵。对于跨境卖家而言,这提示我们不能仅仅依赖谷歌的公开声明,更要从实际的数据和机制中去理解其运作逻辑。
2. 这些披露揭示了谷歌搜索排名架构的哪些核心组成部分?
谷歌的搜索排名架构是一个复杂的多阶段流程,远非单一算法所能概括。通过这些披露,其核心组成部分得以浮现:
话题相关性 (Topicality T*):这是一个人工构建的系统,用于判断文档与查询词的直接相关性。它基于“ABC信号”:
- A (Anchors):源自指向该文档的超链接锚文本,表明其他网站认为该文档是关于什么的。
- B (Body):基于查询词在文档内容中的存在和显著性。
- C (Clicks):来自用户行为数据,特别是用户在点击某个页面后,返回搜索结果页面前的停留时间。
质量评分 (Quality Score Q*):这是一个内部的、相对静态且与查询无关的指标,用于评估网站或域名的整体可信度和质量。它是一个手工设定的评分,受“PageRank”(衡量“与已知优质来源”或可信“种子”网站的距离)以及其他网站声誉因素的影响。“Q*”作为网站级别的权威性评分,可以显著提升或抑制网站的排名表现。
导航提升 (Navboost):这个强大的、数据驱动的系统基于13个月的聚合历史用户满意度数据来调整排名。它分析各种点击指标,如“好点击”(成功的互动)、“坏点击”(跳出行为)和“最终最长点击”(搜索会话中最终令人满意的结果)。“Navboost”能将最初数万个相关的文档集筛选至数百个,是排名精细化的关键环节。
RankBrain:这是一个早期的机器学习(ML)系统,其主要功能是解释新颖、模棱两可和长尾的搜索查询。它通过历史搜索数据(非实时用户数据)进行训练,旨在理解用户意图,超越简单的关键词匹配。
BERT-based RankEmbed:这是一个更先进的深度学习模型,于2019年集成,显著增强了谷歌对语言上下文的理解能力。它将查询和文档转换为数学向量(embeddings),以确定语义相似性,对于复杂和对话式搜索尤为有效。
Twiddlers (调整器):这些是用于在“Mustang”等系统初始排名后,对搜索结果进行重新排序的功能。“Navboost”就是一个突出的“Twiddler”,但其他如“FreshnessTwiddler”(新鲜度调整器)、“QualityBoost”(质量提升)和“RealTimeBoost”(实时提升)等,也会根据各种标准对结果进行微调。
HostAge (主机年龄):这是一个验证“谷歌沙盒”理论的属性,表明新域名会受到算法的怀疑,并被“沙盒化”以阻止新鲜的垃圾信息,直到它们建立起可信度。
3. “断裂实体假说”是什么?它与谷歌的E-E-A-T及“有用内容更新”有何关联?

“断裂实体假说”(Disconnected Entity Hypothesis, DEH)认为,当网站缺乏足够的透明度和信任信号,无法将其与可信的现实世界实体(例如一个真实的个人、组织或品牌)关联起来时,谷歌会将其归类为“不健康”或“断裂”的实体。这可能导致这些网站的排名下降,即使它们的内容或链接在其他方面表现良好。此类网站会被视为谷歌无法为其“背书”的对象,从而限制其可见度。
这个假说与谷歌的E-E-A-T(Experience 经验、Expertise 专业性、Authoritativeness 权威性、Trustworthiness 可信赖性)框架以及**有用内容更新(Helpful Content Updates, HCU)**直接相关:
E-E-A-T与信任:谷歌的搜索质量评估指南(QRG)明确指出,“信任是E-E-A-T家族中最重要的成员”,因为不可信赖的页面无论其他品质如何,都会被视为低E-E-A-T页面。QRG强调需要“找到网站的负责人和页面内容的创作者”(2.5.2节)。当一个网站未能通过这个基本的透明度测试,缺乏关于其所有者、作者或目的的清晰信息时,它就成为了一个“断裂实体”。
有用内容更新 (HCU):HCU于2022年推出,并于2024年3月被整合到核心算法中,其目标是打击“搜索引擎优先”内容——即主要为排名而非真正帮助用户而创作的材料。“断裂实体假说”表明,网站背后实体缺乏信任,会导致其内容被谷歌系统判定为“无用”,即便内容本身撰写良好。谷歌的算法难以“检测”来自不受信任、匿名来源内容的真正价值。
对中小企业的影响:许多受HCU影响的小型发布商报告称,他们的内容质量良好,但流量仍出现严重下降。“断裂实体假说”暗示,这些网站之所以受到冲击,并非仅仅因为内容质量问题,更是因为它们缺乏强大、可验证的实体信号。谷歌优先显示“权威、可靠的搜索结果”,而没有明确的实体标识,网站就无法充分证明这些品质。
本质上,“断裂实体假说”认为,谷歌的排名系统在考虑链接或内容相关性等其他信号之前,可能会先应用一个“实体健康状态”过滤器。一个被视为“断裂实体”的网站在排名上将面临巨大挑战,因为谷歌越来越重视来自可识别、可负责来源的内容,以维护用户信任和自身声誉。对于中国跨境企业而言,这意味着在海外市场建立品牌,不仅要提供优质产品和服务,更要清晰地展示企业身份、专业性和公信力。
4. “零点击搜索”和“零点击营销”是什么?它们为何在行业内引发一场“数字讨论”?
零点击搜索 (Zero-Click Search, ZCS):这指的是用户在搜索结果页面(SERP)上直接获得完整答案,无需点击进入外部网站的用户行为。这种现象是由谷歌有意设计的功能驱动的,例如“精选摘要(Featured Snippets)”、“知识面板(Knowledge Panels)”、“直接答案框(Direct Answer Boxes)”、“本地包(Local Packs)”、“人们也问(People Also Ask, PAA)”以及2025年最新推出的“AI概览(AI Overviews)”。
零点击营销 (Zero-Click Marketing, ZCM):这是对ZCS的战略性应对。由兰德·菲什金(Rand Fishkin)倡导,ZCM的实践是在谷歌SERP、YouTube或社交媒体等平台内直接创造独立价值,目标是建立品牌知名度、影响力与社群,而不仅仅是为了引流到网站。它将重心从获取流量转移到成为用户所在之处的权威答案或资源。
这两种现象在行业内引发了一场深入的“数字讨论”,因为它触及了行业内在经济模式和战略选择上的深刻分歧:
内容发布者和流量驱动者的观点:许多出版商、内容创作者和业务模式依赖网站流量的企业,将ZCS视为生存威胁。他们认为,谷歌通过在SERP上直接提供答案,却不提供相应的补偿或引流点击,是在“吸取”他们的内容,并“蚕食网站访问量”,从而“扼杀自然流量”。这直接影响了他们的广告收入、潜在客户生成和联盟营销收益。他们担忧谷歌构建了一个“封闭花园”,将用户留在其生态系统内,并囤积收入。对他们来说,缺乏真正的退出选项(否则就会失去可见度)被视为一种强制性选择。
营销策略师和品牌建设者的观点:拥抱ZCM的营销人员和策略师则认为,对抗ZCS是徒劳的。他们将其视为不可避免的演变,认为影响力与品牌建设比单纯的点击量更为关键。他们主张,零点击功能实际上是一种过滤器,当用户最终点击网站时,能带来质量更高、意图更明确的流量,因为低意图用户已在SERP上得到满足。出现在“AI概览”或“精选摘要”中,即使没有点击,也能建立品牌熟悉度和可信度,将品牌定位为未来高意图行动的权威来源。他们提倡优化SERP上的可见度,并建立直接的受众关系(例如电子邮件列表),以减少对点击的依赖。
这场“数字讨论”反映了在开放网络未来以及信息发现和变现方式上,两种对立的经济模式和哲学观点的碰撞。对于中国跨境卖家而言,这提出了一个核心问题:是继续全力追逐网站点击,还是转向更注重品牌在海外平台生态系统内的直接影响力?平衡这两种策略,可能成为出海成功的关键。
5. 网站管理员应采取哪些实际步骤来提高“网站质量评分”,并遵循谷歌的E-E-A-T原则?
要提高网站的“网站质量评分”(Q*)并遵循谷歌的E-E-A-T(Experience 经验、Expertise 专业性、Authoritativeness 权威性、Trustworthiness 可信赖性)原则,网站管理员应侧重于建立真正的可信度和透明度:
审查并优化/删除低质量内容:识别并清除或显著改进“内容贫乏”、冗余或无用的页面。网站中存在的低质量内容会拉低整体质量评分。应专注于创作全面、独特且有价值的资源,确保每一个页面都能真正解决用户问题。
关注E-E-A-T(特别是信任):
- 清晰的身份信息:明确披露网站的所有者和运营者(例如,通过详细的“关于我们”页面,包含法律/编辑所有权、联系方式和公司注册详情)。对于跨境电商,明确的公司信息和海外运营资质尤为重要。
- 作者透明度:对于有明确作者的内容,应包含清晰的作者署名,并链接到专门的作者页面,详细介绍其背景、资历和经验。避免匿名或虚假身份。
- 联系方式:提供易于获取的联系方式(电子邮件、电话,如果适用,还包括实体地址),特别是对于**YMYL(Your Money or Your Life,你的金钱或你的人生)**类主题或电子商务网站,以表明责任归属。
- 内容准确性与透明度:确保内容事实准确、来源可靠并引用证据。对于评论,披露测试方法。如果使用了AI工具,应在适当处透明声明(例如,使用AI免责声明)。
- 用户安全:实施HTTPS协议,使用安全的支付系统(适用于电子商务),并制定清晰的隐私政策,以展示网站的安全性和专业性。
提供实质性、有价值的内容:每个页面都应提供独特的价值,提供原创研究、深入分析和全面描述,而不是简单地重复现有信息。旨在彻底满足用户的查询需求。对于跨境内容,这意味着要深入了解目标市场用户的痛点,提供差异化的解决方案。
改善用户体验 (UX):优化页面加载速度、直观的导航和简洁的布局。避免过多或侵入性广告,这些会分散用户对内容的注意力。良好的UX会带来更长的停留时间和更少的“坏点击”,向“Navboost”系统传递积极的用户满意度信号。
建立外部声誉:鼓励在权威平台(如谷歌商家资料(Google Business Profile)、行业特定网站)获得积极提及和评价。获取来自受尊重网站的合法反向链接,这不仅仅是为了“链接权重”,更是作为第三方认可和可信度的信号。中国跨境企业需要积极在海外建立行业影响力,获取权威媒体或合作方的推荐。
实施结构化数据:使用Schema.org标记(例如Organization、Person、LocalBusiness)明确定义您的实体,以便搜索引擎理解。包含sameAs链接到官方资料(社交媒体、Crunchbase、Wikidata),以帮助谷歌在网络上证实您的身份。
保持耐心和一致性:从质量问题中恢复或建立信任需要时间。持续实施这些最佳实践,并预期算法重新评估(通常与核心更新同步)可能需要数周或数月才能体现改进。对于跨境出海业务,这是一个长期投入的过程。
这些步骤共同解决了“断裂实体假说”的问题,使谷歌清楚地了解您的身份、专业领域以及您的内容为何值得信赖。
6. “实体SEO”是什么?它为何对企业,特别是中小企业,变得越来越重要?
“实体SEO”是指优化您的在线存在,以帮助谷歌将您的业务、品牌、个人或概念识别并理解为知识图谱中一个独特的、可识别的“实体”。一个实体在谷歌的数据库中有一个ID号,这使得谷歌能够将词语与现实世界的概念联系起来。实体SEO对企业,尤其是中小企业,变得越来越重要,原因如下:
建立信任 (E-E-A-T):谷歌的算法(如Q*)和质量评估员优先考虑来自可信、权威实体的内容。如果谷歌无法自信地识别您网站背后的现实世界实体(例如,一个具有可验证凭据的个人或公司),它就不太可能信任和排名您的内容。实体SEO提供了谷歌“背书”您的业务所需的信号,有助于克服“断裂实体假说”。
语义理解:谷歌已经从“字符串”(关键词)转向“事物”(实体)。要语义化地理解您的内容,就需要识别其中讨论的实体。通过使您的业务成为一个已知实体,谷歌可以更好地理解您在特定利基市场中的话题权威性。
竞争均衡器:对于中小企业,实体SEO可以与拥有更大预算或已建立域名权威的大品牌在竞争中实现公平。通过清晰地定义您的身份、专业知识和可信度,您可以向谷歌发出信号,表明您在特定利基市场中是一个合法、权威的来源,而不仅仅依赖传统的指标。
提升可见度:被识别为实体可以增强您在谷歌SERP功能中的可见度,例如“知识面板”、“精选摘要”和“AI概览”,这些功能可以直接提供答案,并在用户不点击的情况下产生影响力。
算法更新的韧性:具有强大、可验证实体状态的网站,通常对那些惩罚无用或不可信内容的宽泛核心更新(如“有用内容更新”)更具韧性。谷歌的目标是奖励那些具有清晰“信任轨迹”的“健康”实体。
实体SEO的实际步骤包括在权威数据库(如Google Business Profile、Wikidata、行业注册机构)中建立存在感,在您的网站上通过Schema标记(Organization、Person、sameAs链接)指定一个“实体之家”,构建连贯的话题内容结构,语义化地优化页面内容(涵盖相关实体和用户意图),并突出作者和E-E-A-T信号。对于中国跨境企业,这意味着需要积极在国际舞台上“数字化地”定义和展示自己的品牌实体,提升其在全球用户和搜索引擎中的识别度与信任度。
7. “有用内容更新”(HCU)如何影响内容策略和中小企业?从中可以吸取哪些教训?
“有用内容更新 (Helpful Content Update, HCU)”于2022年8月推出,并于2024年3月整合到谷歌的核心算法中,它对内容策略和许多中小企业产生了深远且往往是毁灭性的影响,标志着谷歌优先级的重大转变。
主要影响:
“搜索引擎优先”内容的降级:HCU明确针对那些主要为排名而非真正帮助用户而创作的内容。这导致许多生产通用、低价值或匿名化SEO驱动文章的网站(包括大量联盟博客和内容农场)的流量显著下降(自然流量损失20%-90%)。
全站效应:HCU是一个全站范围的信号。如果网站的大部分内容被认为是“无用”的,即使是网站上的优质页面,其整体排名也可能受到影响。
恢复困难:从HCU中恢复是一个有意的缓慢且具有挑战性的过程。谷歌的立场是,这需要对网站的整体内容理念和方法进行根本性改变,而不仅仅是小的修补。许多受影响的发布商报告称,即使经过数月甚至数年的努力,也鲜有恢复,这导致了巨大的挫败感甚至网站被放弃。
优先信任和E-E-A-T:HCU强烈强调E-E-A-T,特别是“信任”。那些对其所有权、作者或目的缺乏透明度(即“断裂实体”)的网站,很可能被标记为无用,无论其内容质量如何。
排名偏好的转变:HCU隐性偏向真正的专家网站、社区论坛(如Reddit)以及展示第一手经验的内容,而非匿名或通用内容。
吸取的教训:
“以人为本”的内容至关重要:核心教训是为用户创作真正有价值的内容,解决他们的问题并提供满意的体验,而不是仅仅为了搜索引擎。
信任和实体是基础:网站必须清晰地建立内容背后的实体(作者、组织),并展示可验证的专业知识和权威性。缺乏身份透明度是“信任杀手”。
质量优先于数量:大规模生产低价值内容是失败的策略。应专注于创作数量更少、质量更高、更全面的内容,真正在您的利基市场中脱颖而出。
用户体验就是SEO:除了内容,良好的UX(快速加载、清晰设计、低广告密度)能让用户保持参与,向谷歌的“Navboost”系统发送积极信号。
多样化是关键:仅依赖谷歌自然流量风险很高。中小企业需要多样化其流量来源(例如,电子邮件列表、社交媒体、其他平台),以建立有韧性的在线存在。
耐心与坚持:对于受HCU影响的网站,恢复是一个长期的承诺,需要持续努力以符合谷歌更新后的质量预期。
最终,HCU标志着谷歌致力于展示来自真实、负责和有益来源的内容,这从根本上重塑了对网络发布者的期望。对于中国跨境从业者,这要求我们更加注重品牌和产品的真实价值传递,而非仅仅是SEO技巧。
8. 谷歌对使用受版权保护材料进行AI训练的态度是什么?为何这是一场重要的法律之争?
谷歌对其AI模型(特别是针对“AI概览”等功能)使用受版权保护材料进行训练的态度,植根于美国法律中的“合理使用”(fair use)原则。
谷歌的立场:
“并非窃取”:谷歌明确主张,“使用公开信息进行学习并非窃取。也不是侵犯隐私、侵占、过失、不正当竞争或版权侵犯。”
“转化性使用”:他们认为,利用受版权保护的材料训练AI模型构成了“转化性使用”。根据美国版权法,转化性使用是指以一种改变原始作品的方式,创造出新的表达、意义或目的,从而使其符合合理使用抗辩的条件。谷歌坚称,它并非简单地再版原始作品,而是将其作为原材料,用于创造根本性的新事物——一个能够生成新颖回应的AI模型。
现有控制机制:谷歌还指出,现有的技术工具,如robots.txt文件和摘要控制元标签(nosnippet, max-snippet),可以作为发布商控制其内容如何被谷歌使用的机制。
为何这是一场重要的法律之争:
这是一场高风险的法律冲突,对数字经济和创意产业的未来具有巨大的、深远的影响:
未获补偿的摄取:出版商和内容创作者(包括新闻机构和像Chegg这样的教育科技公司)正在提起诉讼,指控谷歌未经授权抓取他们的作品进行AI训练构成大规模版权侵犯和“不当得利”。他们认为,谷歌正在从他们的内容中获利,却未提供补偿或有意义的署名。
“别无选择”的困境:批评者强调,谷歌曾明确考虑为出版商提供AI训练的真正退出选项,但最终决定不予提供,划下了一条“硬红线”。这让出版商面临“霍布森选择”:要么允许他们的内容被用于训练谷歌的AI(并可能出现在零点击的“AI概览”中,从而减少直接流量),要么阻止谷歌的爬虫,这实际上意味着在全球最大的搜索平台上变得不可见。这被视为由平台方强加的反竞争捆绑安排。
经济影响:如果法院支持谷歌,这将合法化整个AI行业基于无偿使用公开数据的商业模式。这可能会加速AI发展,但也可能对创意产业(新闻、出版、内容创作)造成毁灭性打击,这些产业的经济模式依赖于流量和内容变现。如果出版商无法通过其作品盈利,网络上公开内容的质量和数量可能会下降。
财产权的未来:这些“合理使用”案件的结果将定义数字时代的基本财产权,决定谁将从互联网上庞大的人类知识库中受益。这可能迫使AI公司签订广泛的许可协议,为创作者创造新的收入来源,但也可能减缓AI创新。
本质上,这场法律之争关乎在AI驱动的数字环境中,内容创作的补偿、控制和可行性的先例确立。对于中国跨境企业而言,理解这一趋势至关重要,它将影响未来海外内容营销、知识产权保护以及与国际平台的合作模式。
通过深入了解谷歌搜索排名机制的最新动态,包括其模块化的系统构成、对用户行为的重视、实体化与信任度的要求,以及由AI发展引发的行业讨论,中国跨境从业者可以更精准地调整海外数字营销策略。在出海浪潮中,适应平台规则的演变,构建可信赖的品牌实体,并持续提供“以人为本”的优质内容,将是获取海外市场青睐的关键。国内相关从业人员应持续关注此类动态,将其转化为自身在全球市场竞争中的优势。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/hcu-90-traffic-drop-entity-trust-key.html


粤公网安备 44011302004783号 













