Kellogg Insight - As avaliações numéricas de desempenho podem ser tendenciosas contra as mulheres
Skip to content
Organizations Careers ago. 1, 2019

As avaliações numéricas de desempenho podem ser tendenciosas contra as mulheres

Em algumas situações, a escala de dez pontos favorece os homens. Porém, uma simples mudança no sistema de avaliação pode igualar a situação.

Women are subject to greater gender bias when evaluated using certain ratings scales.

Lisa Röper

Based on the research of

Lauren Rivera

András Tilcsik

Em uma escala de um a dez, o quanto você ficaria surpreso ao saber que uma ferramenta de avaliação profissional comum tende a desfavorecer as mulheres? Dadas as muitas desigualdades no ambiente de trabalho moderno, desde a disparidade salarial até as salas de conferências com ar condicionado no último grau, algumas pessoas podem classificar com zero a sua total descrença a mais uma desigualdade.

O culpado desta vez? A própria escala de avaliação de dez pontos.

As avaliações numéricas de desempenho dos funcionários são consideradas uma "necessidade básica do ambiente de trabalho moderno", diz Lauren Rivera, da Kellogg School. Em alguns setores, como consultoria, é normal os funcionários serem avaliados após cada projeto concluído. E os riscos são altos. A avaliação que o trabalhador recebe pode influenciar decisões de remuneração de curto prazo e trajetórias de carreira de longo prazo.

Estudos anteriores mostram que, em geral, os homens levam vantagem nas avaliações de desempenho e são consistentemente considerados mais capazes, simpáticos e valiosos do que as mulheres, mesmo quando as funções são idênticas. Porém, ninguém examinou se os próprios sistemas de avaliação numérica - o que Rivera chama de “a arquitetura da avaliação” - poderiam estar contribuindo para o problema. Assim, Rivera e o coautor András Tilcsik, da Universidade de Toronto, decidiram explorar esta questão.

Os autores descobriram que o sistema de avaliação pode tender a desfavorecer as mulheres. A escala de dez pontos coloca as mulheres em grande desvantagem, especialmente nas áreas dominadas por homens. No entanto, fundamentalmente, essa desvantagem desaparece quando homens e mulheres são avaliados em uma escala de seis pontos.

Embora considerarmos esses sistemas objetivos, Rivera explica: "eles não são instrumentos neutros". Para qualquer empregador que use avaliações numéricas, "o sistema de avaliação escolhido é importante, portanto, escolha com sabedoria".

Entendendo quando o viés de gênero surge nas avaliações de desempenho


Rivera e Tilcsik tiveram uma sorte inesperada quando começaram a realizar sua pesquisa: descobriram que a faculdade de pós-graduação em profissões liberais de uma universidade norte-americana planejava mudar o sistema de avaliação de seus instrutores de uma escala de dez para seis pontos.

A decisão da escola não teve nada a ver com gênero. Os administradores suspeitavam que os alunos convertiam mentalmente a escala de dez pontos em porcentagens e notas alfabéticas, fazendo com que hesitassem em atribuir notas abaixo de sete para seus instrutores. Os líderes da escola teorizaram que uma escala diferente poderia produzir resultados mais variados e precisos.

A mudança deu asas a um experimento natural ideal. Rivera e Tilcsik poderiam comparar como os mesmos instrutores que ministram os mesmos cursos se saem diante de diferentes sistemas de avaliação numérica. Não tinham a menor ideia sobre o que iriam encontrar.

Por causa dos estereótipos que associam homens, mas não mulheres, ao brilhantismo e excelência, é mais difícil para as mulheres obter a melhor nota em qualquer avaliação. Por esse motivo, parecia possível que escalas com menos pontos pudessem, em última análise, prejudicar as mulheres, uma vez que uma nota cinco na escala de seis pontos é uma avaliação inferior de que uma nota nove na escala de dez pontos. No entanto, os autores do estudo também se perguntavam se a onipresença da escala de dez pontos e a forte associação cultural do número dez com a excelência poderiam fazer da escala de dez pontos um instrumento particularmente desequilibrado.

Os pesquisadores coletaram avaliações de cursos para 29 períodos acadêmicos: 20 antes da mudança de uma escala de dez para seis pontos e nove após a mudança. A amostra incluiu 105.304 avaliações de 369 instrutores. Os pesquisadores também identificaram quatro áreas de estudo que eram tipicamente dominadas por homens, nas quais as mulheres representavam menos de 15% dos instrutores.

Ficaram animados ao descobrir que mulheres que ensinam em áreas não dominadas por homens foram avaliadas da mesma forma que os homens nos dois sistemas de avaliação. Eles descobriram que a avaliação média e a distribuição das avaliações para homens e mulheres eram quase idênticas no sistema de dez pontos. E a alteração para uma escala de seis pontos não afetou a frequência ou a distribuição das avaliações nessas áreas, nem afetou a probabilidade de as mulheres receberem uma avaliação perfeita.

Mas a história realmente mudou para as mulheres nas áreas dominadas por homens.

Nessas áreas, 31,4% das avaliações de homens instrutores eram nota dez, e apenas 19,5% das avaliações de mulheres instrutoras recebiam a nota máxima. De fato, para os homens em áreas dominadas por homens, dez foi a avaliação mais comum. A avaliação mais comum das mulheres foi oito. Os instrutores do sexo masculino tiveram uma avaliação média de 8,2; para as mulheres, a avaliação média foi meio ponto mais baixa, em 7,7.

No entanto, essas diferenças desapareceram com a escala de avaliação de seis pontos. Instrutores masculinos e femininos receberam nota seis quase na mesma frequência: 41,2% para homens e 41,7% para mulheres. A diferença nas avaliações médias de homens e mulheres também diminuiu: 4,91 para homens e 5,01 para mulheres.

Isso surpreendeu Rivera e Tilcsik. “Eu esperava que a diferença entre homens e mulheres diminuísse, mas foi impressionante como a diferença de gênero nas avaliações foi eliminada", diz Rivera.

Os autores ficaram especialmente impressionados com a diferença observada quando as mulheres eram avaliadas em áreas dominadas por homens. “O que isso sugeriu para nós é que, potencialmente, a verdadeira oportunidade de intervenção está nas áreas estereotipadas de dominação masculina, e não nas que podem ter um maior mix de gênero", diz Rivera.

Por que "John" é brilhante, mas "Julie" só é inteligente


Embora Rivera e Tilcsik estivessem curiosos com o resultado do experimento natural, queriam ter certeza que isso não se limitado à única escola que estudaram. Por isso, realizaram uma pesquisa complementar on-line.

Eles recrutaram 400 alunos de faculdades de pós-graduação em profissões liberais de todos os Estados Unidos, que leram a mesma palestra sobre as implicações sociais e econômicas das mudanças tecnológicas. Alguns participantes foram informados de que a palestra havia sido proferida pelo professor John Anderson, enquanto os demais foram informados que a palestrante era a professora Julie Anderson. Em seguida, os participantes foram solicitados a avaliar o instrutor em uma escala de dez ou seis pontos e listar as palavras que vieram à mente quando pensaram no desempenho do instrutor.

Os resultados ecoaram o que os pesquisadores viram no experimento de campo. Na escala de dez pontos, o professor John recebeu uma avaliação média de 7,8, enquanto a média da professora Julie foi de 7,1. Mais uma vez, a diferença nas avaliações médias diminuiu quando os instrutores foram avaliados em uma escala de seis pontos - 4,9 para John e 4,8 para Julie.

E, assim como os pesquisadores notaram no experimento de campo, os participantes estavam mais dispostos a dar às instrutoras a melhor avaliação na escala de seis pontos do que na escala de dez pontos. Julie recebeu nota dez na escala de dez pontos em apenas 13% dos casos, enquanto John obteve nota dez em 22% das vezes. Mas eles obtiveram notas seis na escala de seis pontos em porcentagens quase idênticas - 25% para John e 24% para Julie.

Ainda assim, houve diferenças visíveis na forma como os participantes descreveram os professores. Superlativos como "brilhante", "gênio" e "incrível" foram aplicados com muito mais frequência a John do que a Julie, cujo ensino era mais frequentemente caracterizado pelos participantes como simplesmente bom.

Ficou claro para Rivera e Tilcsik que os participantes pareciam ter expectativas diferentes para um "dez perfeito" e um "seis perfeito": entre os participantes que deram uma nota dez na escala de dez pontos, 54,2% usaram linguagem superlativa para descrever o professor. Entre os participantes que deram nota seis na escala de seis pontos, apenas 28,6% usaram essa linguagem.

A não tão perfeita nota dez


Então, por que a escala de dez pontos prejudica as mulheres? Rivera acha que a culpa pode ser parcialmente atribuída à linguagem cultural carregada da "nota dez" perfeita.

“O número dez carrega uma conotação cultural de perfeição", diz ela. “Pesquisas mostram que, devido aos estereótipos de competência de gênero, simplesmente não pensamos que as mulheres sejam perfeitas. É mais provável que, em se tratando de mulheres e seu desempenho, seja maior o escrutínio”.

Essa diferença ajuda a explicar por que o efeito da escala de dez pontos foi tão acentuado nas áreas dominadas por homens, onde os estereótipos do brilhantismo masculino são especialmente fortes. Quando as pessoas imaginam os destaques em uma área estereotipada masculina - as notas dez - as imagens que vêm à mente mais rapidamente são os homens. Portanto, é muito mais fácil para os avaliadores associar um homem e não uma mulher a essa ideia preconcebida de excelência.

Obviamente, não há nada mágico nas escalas de seis pontos. Mas Rivera acredita que a mudança de dez para seis pontos pode ser útil em qualquer área que use avaliações numéricas. Ela pode atuar como um "interruptor de viés": removendo o conceito familiar e culturalmente carregado da "nota dez" perfeita e criando uma mentalidade mais neutra para os avaliadores, "estamos descobrindo uma maneira de diminuir a intensidade dos estereótipos de gênero", ela diz.

No entanto, afastar-se das escalas de dez pontos nas avaliações de desempenho não é uma panaceia, aponta Rivera.

“Devemos trabalhar para mudar as imagens que as pessoas constroem desde muito jovens, a forma como o trabalho é estruturado, a maneira como reconhecemos os outros, as mensagens que vemos na mídia", diz ela. Mas, enquanto empreendemos o longo e lento trabalho de mudança cultural, é importante implementar mudanças pequenas e significativas. "Acredito que intervenções como essa são muito poderosas para reduzir o efeito de avaliações tendenciosas nas oportunidades de carreira das pessoas".

Featured Faculty

Professor of Management & Organizations; Professor of Sociology, Weinberg College of Arts & Sciences (Courtesy)

About the Writer
Susie Allen is a freelance writer in Chicago.
About the Research
Rivera, Lauren A., and András Tilcsik. 2019. “Scaling Down Inequality: Rating Scales, Gender Bias, and the Architecture of Evaluation.” American Sociological Review. 84(2): 248–274. https://journals.sagepub.com/doi/10.1177/0003122419833601
More in Organizations