领英算法“兄弟化”!女性改男,帖子暴增238%引争议。

去年十一月,一位我们称之为米歇尔(化名)的产品策略师登录她的领英(LinkedIn)账户,将性别改成了男性。据外媒报道,她同时将自己的名字也改为迈克尔。这一举动是她参与一项名为“#穿上裤子”(#WearthePants)的社会实验的一部分,该实验旨在测试领英平台新算法是否存在对女性用户的偏见。
数月以来,一些领英的重度用户反映,他们在这一职业社交网络上的帖子互动量和展示量出现了明显下降。此前,领英工程副总裁蒂姆·朱尔卡在八月份曾表示,平台“最近”引入了大语言模型(LLM)技术,以帮助用户发现更有价值的内容。
米歇尔(其真实身份已为外媒所知)对这些变化心存疑虑,因为她拥有超过一万名粉丝,并且常为她仅有约两千名粉丝的丈夫代笔发布内容。然而,尽管她的粉丝基数远大于丈夫,但两人帖子的展示量却大致相同。她指出:“唯一的显著变量就是性别。”
另一位创始人玛丽琳·乔伊纳也修改了她的个人资料性别。她持续在领英上发布内容已有两年,并在最近几个月注意到其帖子可见性下降。她对外媒表示:“我将个人资料中的性别从女性改为男性后,帖子展示量在一天内跃升了238%。” 梅根·康尼什、罗西·泰勒、杰西卡·多伊尔·梅克斯、艾比·尼达姆、费利西蒂·门兹、露西·弗格森等众多女性用户也报告了类似的结果。
领英方面对此回应称,其“算法和人工智能系统不会将年龄、种族或性别等人口统计学信息作为决定内容、个人资料或帖子在信息流中可见度的信号”,并强调“您的信息流更新的并排快照,如果无法完美代表所有情况或触及率不均等,并不意味着信息流中存在不公平待遇或偏见”。
社会算法专家普遍认为,明确的性别歧视可能并非主因,但隐含偏见或许正在发挥作用。 布兰代斯·马歇尔,一位数据伦理顾问,对外媒表示,平台是“一个错综复杂的算法交响乐,同时不断地拉动特定的数学和社会杠杆”。她补充说,更改个人资料照片和姓名只是其中一个杠杆。算法还受到用户过去和当前如何与其它内容互动等因素的影响。马歇尔指出:“我们不知道的是,还有所有其他杠杆使得这个算法优先显示某个人的内容而非另一个。这是一个比人们想象的更复杂的问题。”
算法的“兄弟化”偏向
“#穿上裤子”实验最初由两位企业家辛迪·加洛普和简·埃文斯发起。她们邀请了两名男性发布与她们完全相同的内容,旨在探究性别是否是导致众多女性用户感到互动量下降的原因。加洛普和埃文斯两人合计拥有超过15万粉丝,而当时这两名男性仅有约9400名粉丝。
加洛普报告称,她的帖子仅触及了801人,而发布相同内容的男性则触及了10408人,这一数字超过了他的粉丝总数百分之百。随后,更多女性用户参与了这项实验。其中一些女性,例如利用领英推广业务的乔伊纳,对此表达了担忧。乔伊纳表示:“我非常希望领英能够对其算法中可能存在的任何偏见承担责任。”
然而,领英与许多依赖大语言模型的搜索和社交媒体平台一样,对其内容选择模型的训练方式鲜有披露。马歇尔表示,由于模型训练者组成的原因,这些平台中的大多数“天生就嵌入了白人、男性、以西方为中心的世界观”。研究人员发现,在流行的大语言模型中存在人类偏见的证据,例如性别歧视和种族歧视,这是因为这些模型是基于人类生成的内容进行训练的,而人类往往直接参与到后期训练或强化学习过程中。新媒网跨境了解到,这种训练数据偏见可能导致模型在处理某些群体的信息时,无意中延续甚至放大了社会中的刻板印象。
尽管如此,任何一家公司如何实施其人工智能系统,仍然被算法“黑箱”的秘密所笼罩。
领英方面表示,“#穿上裤子”实验并不能证明其存在针对女性的性别偏见。朱尔卡在八月份的声明中曾指出,领英的负责任人工智能与治理主管萨克希·杰恩也在十一月的一篇帖子中重申,领英的系统并未将人口统计学信息作为内容可见度的信号。
相反,领英对外媒表示,它会测试数百万个帖子,以将用户与机会联系起来。该公司称,人口统计数据仅用于此类测试,例如观察“不同创作者的帖子是否在同等条件下竞争,以及信息流中的滚动体验在不同受众之间是否一致”。领英一直致力于研究和调整其算法,以努力为用户提供更少偏见的体验。马歇尔认为,那些未知的变量可能解释了为什么一些女性在将个人资料性别改为男性后,帖子展示量增加了。例如,参与热门趋势可能带来互动量的提升;一些账号是长期以来首次发帖,算法可能因此给予奖励。
发帖的语气和写作风格也可能起到作用。例如,米歇尔表示,在她以“迈克尔”的身份发帖的那一周,她稍微调整了语气,采用了更简洁、直接的写作风格,就像她为丈夫代笔时那样。她说,在那之后,帖子展示量跃升了200%,互动量增加了27%。她得出的结论是,系统并非“明确的性别歧视”,但似乎将通常与女性相关的沟通风格视为“价值较低的替代品”。
刻板印象中,男性的写作风格被认为是更简洁的,而女性的写作风格则被认为是更柔和、更情绪化的。如果一个大语言模型被训练成优先推广符合男性刻板印象的写作风格,那么这便是一种微妙的、隐含的偏见。正如我们此前报道的,研究人员已经确定,大多数大语言模型都充满了此类偏见。美国康奈尔大学计算机科学助理教授莎拉·迪恩指出,像领英这样的平台,除了用户行为外,通常还会使用完整的用户资料来决定推广哪些内容。这包括用户资料中的职业以及他们通常参与的内容类型。迪恩表示:“一个人的人口统计学信息可以影响算法的‘两端’——他们看到什么以及谁看到他们发布的内容。”
领英对外媒表示,其人工智能系统会参考数百个信号来决定向用户推送什么内容,包括来自个人资料、社交网络和活动洞察。
该公司发言人表示:“我们正在进行持续测试,以了解什么能帮助人们找到与其职业最相关、最及时的内容。”“会员行为也影响着信息流,人们每天点击、保存和互动的内容,以及他们喜欢或不喜欢的内容形式都在变化。这些行为自然也会影响信息流中显示的内容,以及我们进行的任何更新。” 在领英上活跃的销售专家查德·约翰逊将这些变化描述为降低了点赞、评论和转发的优先级。约翰逊在一篇帖子中写道,大语言模型系统“不再关心你发帖的频率或时间”,而是“关心你的文字是否展现出理解力、清晰度和价值”。所有这些因素都使得我们难以确定“#穿上裤子”实验结果的真正原因。
用户对算法普遍不满
尽管如此,无论性别,许多人似乎都不喜欢或不理解领英的新算法——无论它究竟是什么。
数据科学家沙伊尔维·瓦胡卢对外媒表示,她五年多来平均每天至少发布一条帖子,过去常能看到数千的展示量。现在,她和她的丈夫能看到几百个就已算幸运。她感叹:“这对于拥有大量忠实粉丝的内容创作者来说,非常打击积极性。” 一位男性用户告诉外媒,他在过去几个月里,互动量下降了约50%。然而,另一位男性用户表示,他在相似的时间段内,帖子展示量和触及率增加了100%以上。他对外媒补充说:“这主要是因为我针对特定受众撰写特定主题的内容,这正是新算法所奖励的。”他还提到,他的客户也看到了类似的增长。
然而,在马歇尔的经验中,她,作为一位非裔女性,认为她谈论个人经历的帖子表现不如她谈论种族相关话题的帖子。她表示:“如果黑人女性只有在谈论黑人女性时才能获得互动,而不是在谈论她们的专业知识时,那么这就是一种偏见。”新媒网跨境获悉,这种现象揭示了平台算法在内容主题和创作者身份之间可能存在的复杂互动。
研究员迪恩认为,该算法可能仅仅是在放大“已经存在的任何信号”。它奖励某些帖子,不是因为作者的人口统计学特征,而是因为这些帖子在平台上有更多的互动历史。尽管马歇尔可能无意中触及了另一个隐含偏见领域,但她的个人经验不足以确定这一点。领英提供了一些关于当前哪些内容表现良好的洞察。该公司表示,用户基数已经增长,因此年同比增长发帖量15%,评论量同比增长24%。“这意味着信息流中的竞争更加激烈,”该公司指出。关于专业洞察和职业经验、行业新闻和分析,以及围绕工作、商业和经济的教育或信息性内容都表现良好。
无论如何,人们普遍感到困惑。米歇尔表示:“我需要透明度。”
然而,由于内容选择算法一直是公司严密守护的秘密,且透明度可能导致用户钻空子,这是一个巨大的请求。它很可能永远无法得到满足。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/linkedin-bias-women-238-percent-post-gain.html


粤公网安备 44011302004783号 













