Conteúdo

Crie sua própria pesquisa hoje

Criador de pesquisas grátis e fácil de usar sem limite de respostas. Comece a coletar feedback em minutos.

Comece grátis
Logo SurveyNinja

Validade convergente (validade de construto)

Você criou um novo índice de "satisfação do cliente" a partir de 5 perguntas. Coletou os dados. Mas como saber que o índice realmente mede a satisfação e não, digamos, o humor geral do respondente no momento da pesquisa?

Uma forma de verificar é comparar o seu índice com outras medições do mesmo construto que já tenham sido validadas. Se elas se correlacionam fortemente, ambas estão captando a mesma coisa. Isso é a validade convergente: a evidência de que diferentes abordagens para medir um mesmo conceito produzem resultados consistentes.

Definição

Validade convergente é um tipo de validade em que as medições de um mesmo construto, feitas com diferentes métodos ou instrumentos, mostram uma alta correlação entre si. É uma das formas da validade de construto. Comprova que um instrumento mede de fato o conceito que afirma medir, e não outra coisa. É avaliada por meio da correlação com indicadores externos validados. Uma alta validade convergente é uma condição necessária (mas não suficiente) para a qualidade de um instrumento de medição.

Por que a validade convergente importa

Toda medição exige uma verificação: ela realmente capta o que afirma captar? O resultado de um questionário por si só não diz nada — são apenas números que podem ser interpretados de maneiras diferentes. Três razões para verificar a validade convergente:

Prova de que a métrica faz sentido. Se o seu "índice de engajamento" não se correlaciona com outras métricas de engajamento reconhecidas, ele pode estar medindo outra coisa completamente, ou apenas ruído. Sem uma verificação, você não sabe a que equivalem os dados que coletou.

Justificativa para usar um novo instrumento. Ao criar a sua própria escala (por exemplo, uma versão curta de um questionário longo validado), você precisa comprovar que a versão curta produz resultados consistentes com a longa. Caso contrário, trata-se de um instrumento diferente, não de um substituto.

Verificação de uma adaptação cultural. Ao traduzir e adaptar um instrumento validado para outro idioma, a validade convergente mostra se ele preserva sua relação com os indicadores externos esperados no novo contexto.

Como a validade convergente é medida

O procedimento:

1. Escolher um "padrão-ouro" para a comparação. Deve ser uma métrica já validada do mesmo construto: outro questionário, um indicador comportamental, uma avaliação de especialistas. Exemplos: para a satisfação, o clássico CSAT; para o engajamento dos funcionários, eNPS e Gallup Q12; para a qualidade do serviço, SERVQUAL.

2. Realizar ambas as medições na mesma amostra. O mesmo grupo de respondentes preenche tanto o seu instrumento quanto o "padrão-ouro". A ordem das medições é aleatorizada para evitar o viés de contexto.

3. Calcular a correlação. O coeficiente de Pearson entre os resultados dos dois instrumentos é o indicador principal. Para variáveis binárias, usam-se outros coeficientes (phi, correlação de Matthews).

4. Interpretar a magnitude da correlação. Limiares típicos:

  • r > 0,7 — validade convergente alta
  • 0,5-0,7 — moderada
  • 0,3-0,5 — fraca, mas às vezes aceitável para construtos próximos, mas não idênticos
  • < 0,3 — baixa; o instrumento pode estar medindo outra coisa

Os limiares são orientativos. O valor absoluto depende do contexto: se dois instrumentos afirmam medir exatamente a mesma coisa, espera-se r > 0,6-0,7. Se os construtos são próximos, mas não idênticos, 0,4-0,5 pode ser o normal.

Exemplo: validar uma escala curta de engajamento

Uma equipe de RH está desenvolvendo uma escala curta de 3 perguntas para uma pesquisa de pulso mensal de engajamento. O "padrão-ouro" é a escala completa Gallup Q12, de 12 perguntas. O objetivo: a escala curta deve produzir resultados consistentes com a completa.

O procedimento:

  • Ambas as escalas foram aplicadas a uma amostra de 250 funcionários em ordem aleatorizada
  • Foi calculada uma pontuação total para cada escala
  • Correlação entre as pontuações: r = 0,78

Conclusão: a escala curta tem boa validade convergente em relação ao Q12. Pode ser usada para acompanhamento regular com a confiança de que mede o mesmo construto. Dito isso, a versão curta não substitui a completa: o Q12 oferece um quadro detalhado de 12 aspectos, enquanto a escala curta oferece apenas um valor agregado.

Se r tivesse resultado em 0,4, a conclusão teria sido diferente: a escala curta mede algo semelhante, mas não suficientemente consistente com o Q12. Seria preciso reformular as perguntas ou incluir mais itens.

A validade convergente e outros tipos de validade

A validade convergente é uma das várias formas de validade. O quadro completo inclui:

  • Validade de conteúdo — se o instrumento cobre todos os aspectos do construto (revisão por especialistas)
  • Validade convergente — consistência com outras medições do mesmo construto
  • Validade discriminante — distinguibilidade em relação às medições de outros construtos
  • Validade preditiva — a capacidade do instrumento de prever eventos ou resultados futuros
  • Validade de critério — a relação com um "padrão-ouro" de comportamento ou resultado

A validade convergente e a discriminante costumam ser consideradas em par. A convergente diz "parece-se com aquilo com que deveria parecer-se", a discriminante diz "difere daquilo com que não deveria parecer-se". Ambas são necessárias: uma alta correlação com "qualquer coisa" pode significar que o instrumento mede um fator geral (o humor, a tendência a concordar) em vez de um construto específico.

O que pode reduzir a validade convergente

Definições diferentes do construto. Dois instrumentos podem ter o mesmo nome ("engajamento"), mas medir coisas um pouco diferentes. O Gallup Q12 foca nas condições organizacionais, o eNPS na disposição de recomendar. Eles são relacionados, mas não idênticos — por isso sua correlação não pode ser muito alta.

Modalidades de medição diferentes. Um questionário versus um indicador comportamental (por exemplo, um índice de engajamento versus o número real de horas extras voluntárias) costuma produzir correlações moderadas — não por causa da má qualidade dos instrumentos, mas porque atitudes e comportamentos são relacionados, mas não coincidem.

Erros sistemáticos em um dos instrumentos. Se um dos questionários tem problemas de formulação ou de desejabilidade social, a correlação será mais baixa por causa do ruído que ele introduz. Verifique a qualidade de todos os instrumentos comparados.

Uma faixa de medição estreita. Se todos os respondentes dão respostas semelhantes (efeito teto ou piso), a correlação é estatisticamente subestimada mesmo que a relação real seja forte. São necessárias amostras com variabilidade suficiente.

A validade convergente no trabalho aplicado

Para tarefas aplicadas, uma verificação completa da validade convergente com publicação de resultados é exagerada. Mas uma versão simplificada é útil:

Antes de implantar um novo índice — compare-o com as métricas que você já utiliza. Se o novo índice pretende medir a "satisfação do cliente", sua correlação com o seu CSAT existente deve ser forte. Se não for, algo está errado.

Ao traduzir um questionário — compare os resultados da versão traduzida com os do original em respondentes bilíngues. Uma correlação fraca aponta para problemas de tradução.

Ao migrar para versões curtas — valide a escala curta em relação à completa em uma amostra de teste antes da implantação em massa.

Verificações relacionadas à qualidade da medição: a confiabilidade teste-reteste para a estabilidade ao longo do tempo, o alfa de Cronbach para a consistência interna, a validade convergente para a relação com indicadores externos. Juntos, esses três indicadores dão uma confiança básica na qualidade de um instrumento — e devem ser verificados como parte do desenho de qualquer estudo sério.

A validade convergente é uma forma de garantir que o seu instrumento mede o que afirma medir. Uma alta correlação com métricas externas validadas do mesmo construto é uma condição necessária para que os dados façam sentido. Sem essa verificação, um índice ou uma escala continua sendo uma "caixa-preta" cujos resultados podem ser interpretados em qualquer direção. Para o trabalho aplicado, basta verificar a correlação com as métricas existentes; para pesquisas sérias, um procedimento formal com os coeficientes reportados.

Perguntas frequentes

Qual é o tamanho mínimo de amostra para a verificação?

Para uma estimativa confiável da correlação, um mínimo de 100-150 pessoas. Com 30-50, o intervalo de confiança do coeficiente de correlação é muito amplo: r = 0,6 pode, na verdade, estar entre 0,3 e 0,8. Para verificações aplicadas, 50-100 é admissível; para publicar resultados, 150 ou mais.

É obrigatório comparar com um "padrão-ouro"?

É desejável, mas nem sempre possível. Se não há um "padrão-ouro", você pode comparar com vários instrumentos existentes e observar o padrão. Uma alta correlação com várias medições próximas em significado é evidência de validade convergente, mesmo sem um único referente.

A validade convergente pode ser alta demais?

Sim: se r > 0,9, talvez os dois instrumentos simplesmente estejam duplicando um ao outro. Isso não é um problema de validade, mas uma questão de necessidade prática: para que usar dois instrumentos que dão resultados quase idênticos? Um novo instrumento deve ser ou mais curto/conveniente, ou fornecer informação adicional. Se não fizer nenhuma das duas coisas, há pouco sentido nele.

O que fazer se a correlação for mais baixa do que o esperado?

Analisar as causas: definições diferentes do construto, problemas de formulação, uma faixa de respostas estreita demais, modalidades diferentes. Verificar as perguntas individuais: pode ser que a maior parte dos itens funcione bem e que um ou dois reduzam a correlação geral. Talvez seja preciso reconsiderar o próprio "padrão-ouro" — ele também nem sempre é perfeito.

É preciso validade convergente para escalas validadas padrão?

Ao aplicá-las em sua forma original a um público comparável, geralmente não — considera-se que a validação foi feita pelos autores da escala. Ao adaptá-las (tradução, mudanças, um novo contexto cultural), vale a pena verificar de novo, mesmo para instrumentos conhecidos. A validação não se transfere automaticamente entre contextos.

1