Conteúdo

Crie sua própria pesquisa hoje

Criador de pesquisas grátis e fácil de usar sem limite de respostas. Comece a coletar feedback em minutos.

Comece grátis
Logo SurveyNinja

Alfa de Cronbach

Você colocou 10 afirmações sobre o desempenho de um gestor em uma pesquisa para construir um índice geral de qualidade da liderança.

Você calcula a média — 6,8 de 10. Mas e se essas 10 afirmações não estiverem relacionadas entre si e cada respondente as interpretar à sua maneira? Então o seu "índice de liderança" não é uma métrica única, e sim uma soma de ruído. O alfa de Cronbach é um coeficiente que verifica uma única coisa: as suas perguntas realmente medem a mesma coisa?

Definição

Alfa de Cronbach (α) é um coeficiente de consistência interna de uma escala que mede o quão fortemente os itens de uma mesma escala ou índice estão relacionados entre si. Os valores vão de 0 a 1: quanto mais alto, mais homogêneas são as perguntas e mais confiável a medição. É calculado a partir das correlações entre todos os pares de perguntas da escala. É usado na validação de questionários, em psicometria e sempre que várias perguntas são combinadas em um único índice.

Para que serve o alfa de Cronbach

Quando você combina várias perguntas em um índice, faz uma suposição: todas medem o mesmo conceito. Por exemplo, 6 perguntas sobre satisfação no trabalho devem produzir respostas relacionadas — uma pessoa satisfeita com o trabalho em uma pergunta provavelmente estará satisfeita nas demais.

Se essa suposição não se sustenta, combiná-las em um índice é incorreto. Uma média sobre perguntas não relacionadas é uma operação matemática sem sentido substantivo. O alfa de Cronbach testa formalmente essa suposição: existe um construto comum dentro da escala ou não?

Interpretação dos valores

Limiares comumente aceitos:

  • α ≥ 0,9 — consistência excelente. Mas um alfa alto demais (0,95+) pode sinalizar redundância: as perguntas perguntam quase a mesma coisa.
  • 0,8 ≤ α < 0,9 — boa. O padrão para questionários maduros e validados.
  • 0,7 ≤ α < 0,8 — aceitável. O mínimo para fins de pesquisa.
  • 0,6 ≤ α < 0,7 — questionável. Tolerável para pesquisa exploratória, não para tomada de decisão.
  • α < 0,6 — baixa. A escala não pode ser usada como um único índice.

Os limiares são orientações, não dogmas. Um questionário maduro e validado (MBI, escalas no estilo NPS) exige 0,8+. Para um novo instrumento de pesquisa, 0,65-0,70 é aceitável na fase piloto, com aprimoramento posterior.

Fórmula e cálculo

A fórmula simplificada:

α = (k / (k-1)) × (1 - Σσ²ᵢ / σ²total)

Onde k é o número de perguntas da escala, σ²ᵢ é a variância de cada pergunta e σ²total é a variância da soma de todas as perguntas.

A ideia: se as perguntas estão fortemente relacionadas, a variância da soma será maior que a soma das variâncias individuais — as flutuações comuns se reforçam. Se as perguntas são independentes, essas grandezas são aproximadamente iguais e α fica próximo de zero.

Na prática, calcula-se em R, Python, SPSS ou por meio de uma calculadora do alfa de Cronbach — fazer isso à mão com mais de 10 perguntas é trabalhoso.

Exemplo: validação de uma escala de satisfação no trabalho

O RH montou uma pesquisa com 6 afirmações em uma escala Likert de 1 a 5:

  1. Eu gosto do meu trabalho
  2. Venho com prazer ao escritório
  3. O trabalho corresponde às minhas expectativas
  4. Eu gosto do meu gestor
  5. Eu recomendaria a empresa a amigos
  6. A temperatura do escritório é agradável

Aplicaram a pesquisa a 200 funcionários e calcularam o alfa: α = 0,58. Insatisfatório. Ao analisar as correlações item-total, descobriram que as perguntas 4 (sobre o gestor) e 6 (sobre a temperatura) correlacionam-se fracamente com as demais. Elas foram removidas. Recalculando nas 4 perguntas restantes: α = 0,81 — boa. A conclusão: a satisfação geral no trabalho é uma coisa, a atitude em relação ao gestor é outra e o conforto no escritório é uma terceira. Elas não podem ser combinadas em um único índice.

O alfa e o comprimento da escala

O alfa depende do número de perguntas. Em igualdade de condições, uma escala mais longa produz um alfa mais alto — isso é uma propriedade matemática da fórmula, não uma confiabilidade substantiva.

  • 3 perguntas com correlação média de 0,3 → α ≈ 0,56
  • 5 perguntas com correlação média de 0,3 → α ≈ 0,68
  • 10 perguntas com correlação média de 0,3 → α ≈ 0,81

Isso significa: ao dobrar a escala você obtém um alfa mais alto — mesmo que as correlações não tenham mudado. Para avaliar adequadamente a consistência em escalas longas, convém olhar não só o alfa, mas também a correlação média entre itens (inter-item correlation) — ótima na faixa de 0,15-0,50.

Limitações do alfa de Cronbach

O alfa não é um indicador universal da qualidade de uma escala.

Não prova unidimensionalidade. Um alfa alto não garante que a escala meça um único construto. Uma escala pode ter duas subescalas que se correlacionam fortemente entre si — o alfa será alto, mas não há unidimensionalidade. Para verificar a unidimensionalidade é preciso uma análise fatorial.

Não para escalas curtas. Para escalas de 2-3 perguntas, o alfa fornece estimativas subestimadas. Nesses casos é melhor usar o coeficiente de Spearman-Brown ou a confiabilidade composta.

Sensível a dados faltantes. Respostas incompletas distorcem o cálculo. Antes da análise, os dados precisam ser limpos ou métodos de imputação devem ser aplicados.

Não substitui a confiabilidade teste-reteste. O alfa fala sobre a consistência interna em uma única medição. Ele não responde se a escala dará os mesmos resultados uma semana depois na mesma pessoa.

Quando aplicar o alfa

Aplique-o ao desenvolver ou validar qualquer questionário de vários itens: escalas de satisfação, de engajamento ou de qualidade de atendimento, testes psicológicos, índices de marca. Calcule-o em uma amostra piloto antes do lançamento completo — isso permite aprimorar ou descartar as perguntas que não funcionam.

No SurveyNinja, após coletar as respostas, você pode usar a exportação de dados para baixar as respostas brutas das perguntas de escala e calcular o alfa no Excel, no R ou em uma calculadora pronta. Além disso, acompanhe a correlação item-total de cada pergunta: perguntas com correlação abaixo de 0,3 são candidatas à remoção.

O alfa de Cronbach é uma verificação de se as suas perguntas realmente medem a mesma coisa. Abaixo de 0,7 — combiná-las em um índice é incorreto. Acima de 0,9 — pode haver formulações duplicadas demais. Calcular o alfa antes de interpretar os resultados agregados é um passo obrigatório ao trabalhar com escalas de vários itens.

Perguntas frequentes

É possível calcular o alfa para uma única pergunta?

Não. O alfa é uma medida de consistência entre várias perguntas de uma escala. Uma única pergunta não tem estrutura interna a verificar. O mínimo é 2 perguntas, mas para uma estimativa estável são necessárias 4-6 ou mais.

O que fazer se o alfa for baixo demais?

Olhe a correlação item-total de cada pergunta: uma correlação baixa (abaixo de 0,3) significa que a pergunta está fracamente relacionada com o resto da escala. Essas perguntas são candidatas à reformulação ou remoção. Após remover uma, recalcule o alfa: se ele subiu, a pergunta realmente era "estranha" a esta escala.

Um alfa de 0,95 é bom?

Nem sempre. Um alfa muito alto pode significar que as perguntas quase se duplicam — "Você gosta do seu trabalho?", "Você está satisfeito com o trabalho?", "O trabalho lhe dá prazer?". Isso é redundância, que aumenta o comprimento do questionário sem acrescentar informação. A faixa ótima é 0,80-0,90.

Preciso do alfa se a escala já está validada?

Sim — porque a validação é feita sobre uma população específica. Se uma escala foi desenvolvida para estudantes norte-americanos e você a aplica a funcionários de outro país, o alfa pode ser diferente. Ao usar qualquer escala em um novo público, faz sentido recalcular o alfa para confirmar a sua confiabilidade no novo contexto.

É possível usar o alfa para escalas com várias subescalas?

Sim, mas para cada subescala separadamente. Se um questionário sobre o clima de trabalho contém três subescalas — "relações com os colegas", "relações com a gestão", "condições de trabalho" — o alfa é calculado para cada subescala separadamente. Um alfa global sobre todas as perguntas juntas não é informativo e pode induzir ao erro.

1