Kellogg Insight - 用不透明的算法对自由工作者进行评级的情形与日俱增,使自由工作者提心吊胆。
Skip to content
The Insightful Leader Live: How to Talk about Your Work (and Yourself) So People Listen | Register
Data Analytics Organizations 8月 2, 2021

用不透明的算法对自由工作者进行评级的情形与日俱增,使自由工作者提心吊胆。

这些系统可能会给自由工作者建造“看不见的笼子”。

Gig worker weighed down by star ratings

Michael Meier

Based on the research of

Hatim Rahman

在互联网的某个角落,你可能已经被评级过。

这些评级帮助各种各样的公司做决定,诸如在哪些地方冒险,以及如何改善运营等等。然而评级对被评级者有着什么样的影响?凯洛格学院的哈提姆·拉曼新研究显示,尽管这些算法不透明,而正是由于这种不透明性,它们以意想不到的方式塑造人们的行为。

拉曼是凯洛格学院的管理与组织学助理教授,他研究了一个网上自由工作者劳动力平台的算法影响。拉曼说道:“目前有许多关于未来工作及其表现形式的探讨。这类平台是下一个前沿领域的组成部分。”

拉曼研究的那个网站与许多承诺为自由工作者和付费客户牵线建立合作关系的网站(如Upwork、TopCoder、TaskRabbit等等)一样,也是采用一种复杂的算法对自由工作者进行评分,潜在客户即可根据这个分数分类并选择可能的人选。

为了了解这种不透明的评估系统如何影响自由工作者,拉曼加入了这个平台(化名“TalentFinder”)并且采访了自由工作者和雇用他们的客户。此外,他还解析了TalentFinder上面的书面交流和自由工作者讨论板上的贴子。

所有跟他谈过的工作者,都对分数突然莫名下降的可能性感到惶惶不安。对于这种心慌,他们的反应方式主要取决于自己之前是否经历过评分降低的情况,而与他们的评分高低关系较小,另外很重要的一点是他们对该平台带来收入的依赖程度。

拉曼解释说,传统上学者将工作表现评估描述为能够帮助收紧工作者周围的“铁笼”,因为这些评估能让雇主约束行为并设定成功的标准。用算法进行评估则有一种不同的、可能带有破坏性的影响。

“不透明的第三方评估可能为工作者产生一个‘看不见的笼子’,因为他们对这种评估的感受是一种控制形式但却无法解释或了解这些评估标准进而取得成功。”拉曼写道。

当然,如同拉曼指出,不仅我们许多人或多或少也住在某种看不见的笼子里,而且我们还在构建笼子方面提供一些帮助。每当我们为从亚马逊商城购买的商品或Lyft司机做出评级时,我们都可能正在影响他人的生计。

“使用这些平台的人多半没有意识到自己在影响这些系统及其算法方面所扮演的重要角色,觉得那只不过是一种交易式关系。”他说道。

让评估标准变成一个谜

“TalentFinder”是同类网站中规模最大的平台之一。在2015年,有超过一千两百万自由职业者在该网站注册,客户数有五百万,分布在全球一百多个国家。这些客户可以挑选各种各样的自由工作者,从助理到营销人员到软件工程师,应有尽有。

2013年,当拉曼在TalentFinder注册并开始进行研究时,该平台根据一套显示项目分数和整体分数的透明系统来对自由职业者进行评级。项目完成时,客户会用一个1到5的评分量尺在几个方面评价自由职业者,包括“技能”、“工作质量”以及“遵守预定的完成进度”。这些分数汇总后得到项目总分,将这些项目分数汇总(根据每个项目的金额加权)后即产生一个满分为五星的总评级,该评级包含在自由职业者的个人简介中。

虽然这套评估系统直截了当,但它给TalentFinder带来一个问题,那就是自由职业者的评级普遍过高,缺乏差异性,而差异性对客户会有帮助。该网站曾一度有超过90%的自由职业者在五星中得到四星评级,80%的自由职业者则获得几近完美的评级。

解决之道:算法。从2015年开始,该网站根据刻意保持神秘的标准,改用一个1到100的评分量尺对自由职业者进行评分。

该算法推出三个月后,TalentFinder在一篇公开博文中写道:“我们不透漏您分数的确切计算方式,因为这样做会使某些用户更容易进行操作来人为提高他们的分数。”新算法实施后,仅有大约5%的自由职业者得到90分以上的评分。

为了研究这个自由职业者新评估系统的效果,拉曼在2015年到2018年之间从以下三个来源收集数据:与自由职业者进行的80次访谈和与客户进行的18次访谈;书面交流内容,包括TalentFinder社区讨论板上超过两千条与算法有关的信息和TalentFinder上有关这个主题的公开贴子;还有他作为一名注册客户的自身观察。

普遍存在的担心害怕

拉曼在整理他的访问和书面内容时,赫然发现他听到的抱怨相当一致。所有他访谈的自由职业者都担心害怕自己的分数可能突然下降,并且对于无法从分数变化中学习并改进而感到挫折。

“最让我惊讶的是平台上业绩最优秀和经验最丰富的自由职业者在了解算法如何运作方面未必能取得任何优势。”他说道。“一般来说,在一个系统中成绩出色的人在某种程度上能够推断出系统是如何运作的。而在这个环境中,即使是分数没有改变的人一样担心害怕。”

拉曼对这种害怕与挫折感观察到两种截然不同的反应。其中一种反应他称为“试验性反应”,自由职业者会不断通过反复试验来试图提高自己的分数,例如只接合约期较短的项目或主动要求客户对工作表现提供反馈。

另一种反应是自由职业者试图通过拉曼称为“限制性活动”的行为来保护自己的分数。自由职业者试图通过不同的方式限制自己在评估算法的曝光度,他们有时要求在TalentFinder上认识的客户在平台以外的地方联系及付款,以便使其评级不受影响。其他人则不采取任何行动,希望以此保持评级。

拉曼找到两个主要因素,它们决定了哪些自由职业者会试验,哪些人会离开平台私下交易或干脆不采取行动。这两个因素是自由职业者对该平台带来收入的依赖度,以及他们是否经历过分数下降的情况。

这根据自由职业者的分数高低而有所不同。

获得高评级并且对平台依赖度高的自由职业者根据最近分数是否下降来选择他们的应对策略。看到自己分数下降的人会试验不同的策略来提高分数;如果他们的分数没有下降,他们则限制自己在平台上的活动以努力保护分数。对平台依赖度低的业绩优异者无论是否有过分数下降都会限制自己在TalentFinder上的时间。

分数较低的自由职业者对平台的依赖度似乎决定了他们的行动方向。如果他们依赖平台,他们就会采取试验法,即使分数继续波动。如果他们不觉得自己的收入与平台息息相关,他们则逐渐限缩自己在平台上的活动。

拉曼解释说,工作者的处境在这些平台似乎比起传统工作环境更让人感到岌岌可危,因为确实如此。传统的雇主评估大多旨在帮助员工改进,但是像TalentFinder这类由算法进行评估的网站主要是为了帮助平台从众多人选中自动挑选出“最佳”工作者,从而让客户满意。

“对平台来说,重点是优化平台的整体活力,平台的主要目标并非帮助工作者改进。”拉曼说道。“对于人们的日常生活经验而言,尤其是当他们依赖平台的工作机会时,这就可能非常挫折和困难。”

住在笼子里,并且塑造它

拉曼说,从他开始从事这项研究以来,他对我们多数人住的各种各样看不见的笼子越来越了解。例如,他指出近期报告详细说明了从我们的电视吸尘器到我们用来处理处方汽车保险的手机应用,所有这些都在收集我们的资料并且以我们基本上看不到的方式训练专属算法。

“我认为当我们进入这个系统,我们所有言行以及互动情况都全部输入到我们未必了解其存在的算法时,看不见的笼子比喻的适用范围便更加广泛。”他说道。

他指出,有些人退出这些平台的自由度更高,归根结底就看他们对平台的依赖度如何。拉曼表示,未来研究有一个可能成果相当丰硕的领域,那就是探讨种族、性别和收入等特征与对平台依赖度以及其算法评估之间的关联性。例如,了解某些种族群体的人是否更可能先被算法“评估”(并被列入可能的黑名单)后才能去租公寓、申请信用卡或参加健康保险,这一点很重要。

“让这个看不见的笼子的比喻浮出台面是希望大家注意到这个现象,并且希望用一种人们可以起共鸣的方式呈现。”拉曼说道。“当然,即使我们都意识到这个现象,要知道怎么做还是很难,因为这些系统很复杂而且算法改变的速度很快。

立法机构开始对这个基本上没有法律规范的领域提供某种程度的监督。2020年的加州消费者隐私权法案是美国国内这类立法中最强大的法案,它建立了网上用户对于个人资料收集的知晓、删除和选择的权利。欧盟在2018年通过了更积极的立法。拉曼说道:“这是一个鼓舞人心的迹象,不过仅有法规远远不能解决问题。”

Featured Faculty

Assistant Professor of Management and Organizations

About the Writer

Katie Gilbert is a freelance writer in Philadelphia.

About the Research

Rahman, Hatim. 2021. “The Invisible Cage: Workers’ Reactivity to Opaque Algorithmic Evaluations.” Administrative Science Quarterly.

Read the original

Add Insight to your inbox.
More in Data Analytics