Conteúdo

Crie sua própria pesquisa hoje

Criador de pesquisas grátis e fácil de usar sem limite de respostas. Comece a coletar feedback em minutos.

Comece grátis
Logo SurveyNinja

Escala (escala de avaliação)

Uma situação familiar: você abre uma pesquisa e vê a pergunta «Avalie a qualidade do atendimento de 1 a 5». Você dá um 4, porque «no geral foi bom, mas não perfeito».

Seu colega também dá um 4, mas na cabeça dele isso significa «quase tudo foi ruim, só dou 5 para o que é perfeito». O mesmo número, um significado completamente diferente. Como isso aconteceu? Tudo se resume à escala, ou mais precisamente, ao fato de que a escala foi escolhida de forma descuidada: sem rótulos, sem calibração, sem entender o que exatamente ela mede. Uma escala não é só «uma faixa de 1 a 5». É um instrumento de medição, e da sua qualidade depende se você vai obter dados precisos ou um conjunto de números aleatórios.

O que é uma escala

Uma escala é um sistema de gradações por meio do qual um respondente expressa sua avaliação, atitude, grau de concordância ou a intensidade de um atributo. Uma escala traduz a experiência subjetiva de uma pessoa («gostei», «discordo um pouco», «muito conveniente») em um valor numérico ou categórico adequado para análise.

Sem escalas, as pesquisas seriam compostas apenas de perguntas abertas, e analisar à mão centenas de respostas de texto livre é lento e pouco confiável. As escalas resolvem esse problema: padronizam as respostas, tornam-nas comparáveis entre si e adequadas para o processamento estatístico. Mas a padronização só funciona quando a escala é escolhida corretamente; caso contrário, ela não ajuda, e sim mascara o quadro real.

Níveis de medição: o fundamento de qualquer escala

Antes de analisar escalas concretas, vale a pena entender os quatro níveis de medição: uma classificação proposta por Stanley Stevens em 1946, e que ainda define as regras para trabalhar com dados.

Escala nominal (Nominal Scale). O nível mais simples: categorias sem ordem. «Qual navegador você usa: Chrome / Firefox / Safari / Outro?». As categorias podem ser contadas (quantas pessoas escolheram cada opção), mas não podem ser ordenadas por classificação: o Chrome não é «maior» nem «melhor» que o Firefox no sentido de uma escala. Operações permitidas: contagem de frequências, moda.

Escala ordinal (Ordinal Scale). As categorias estão ordenadas, mas as distâncias entre elas são desconhecidas. «Iniciante → Intermediário → Avançado → Especialista». Avançado é «maior» que intermediário, mas em que medida exatamente é desconhecido. A diferença entre iniciante e intermediário pode ser enorme, enquanto a diferença entre avançado e especialista pode ser mínima. Operações permitidas: mediana, correlações de classificação.

Escala de intervalo (Interval Scale). As distâncias entre as divisões são iguais, mas o ponto zero é arbitrário. O exemplo clássico é a temperatura em graus Celsius: a diferença entre 10° e 20° é a mesma que entre 20° e 30°, mas 0° não significa «ausência de temperatura». Nas pesquisas, a escala de Likert é considerada de intervalo (com ressalvas, mais sobre isso abaixo). Operações permitidas: média, desvio padrão.

Escala de razão (Ratio Scale). Como a escala de intervalo, mas com um zero absoluto. Renda, idade, número de compras: o zero significa a ausência do atributo, e «40 anos» é exatamente o dobro de «20 anos». Na sua forma pura, é rara nas escalas de questionário; aparece com mais frequência em perguntas quantitativas («Quantas vezes você usou o serviço?»).

O nível de medição determina quais operações matemáticas são admissíveis. Calcular uma média em uma escala nominal (por exemplo, «o sexo médio é 1,4») é um absurdo. Calcular uma média em uma avaliação de satisfação de 5 pontos é discutível, mas amplamente praticado. Compreender esses limites ajuda a não apresentar artefatos como conclusões.

Escalas populares nas pesquisas

Escala de Likert (Likert Scale)

A escala mais difundida no mundo das pesquisas. Ao respondente é apresentada uma afirmação, e ele expressa seu grau de concordância: «Discordo totalmente — Discordo — Neutro — Concordo — Concordo totalmente». A versão clássica tem 5 pontos, mas também se usam versões de 7 pontos e de 4 pontos (sem opção neutra).

Quando usá-la: medir atitudes, opiniões, grau de satisfação. Uma ferramenta universal para pesquisas de RH, pesquisa de mercado e a medição do CSAT.

Armadilhas: tendência para o centro (os respondentes escolhem em massa «neutro» para não ter que pensar), respostas socialmente desejáveis (marcam «concordo» porque parece «mais correto»). Leia mais sobre as propriedades dessa escala no artigo Likert Scale.

Escala de classificação numérica (Numeric Rating Scale)

«Avalie de 0 a 10» ou «de 1 a 5». O respondente coloca um número. Visualmente pode ser apresentada como uma fileira de algarismos, um controle deslizante ou estrelas.

Quando usá-la: quando se precisa de uma medição numérica rápida. A métrica NPS baseia-se em uma escala numérica de 11 pontos (0–10). A avaliação com estrelas no CSAT baseia-se em uma escala de 5 pontos.

Armadilhas: sem rótulos para os valores, os respondentes interpretam a escala de formas diferentes. Para uma pessoa «7 de 10» é bom, para outra é medíocre. Sempre rotule os pontos extremos («1 = Muito ruim», «5 = Excelente») e, no caso ideal, cada ponto.

Diferencial semântico (Semantic Differential)

Dois polos opostos com uma escala entre eles. «Caro ——— Barato», «Moderno ——— Ultrapassado», «Amigável ——— Frio». O respondente marca sua posição nesse espectro.

Quando usá-lo: avaliar a percepção de marcas, produtos, interfaces. Funciona bem para comparar vários objetos segundo os mesmos parâmetros. As escalas UEQ e SUS para avaliar a usabilidade são parentes próximos do diferencial semântico.

Armadilhas: a formulação dos polos deve ser realmente oposta. «Rápido — Pouco confiável» não são antônimos, e uma escala assim induzirá os respondentes ao erro.

Escala visual analógica (Visual Analogue Scale, VAS)

Uma linha contínua sem divisões: o respondente coloca uma marca em qualquer ponto dela. A linha costuma ter 100 mm, o que permite converter a posição da marca em um número de 0 a 100. É usada em pesquisa médica (avaliação da dor), psicologia e testes de UX. Leia mais no artigo VAS.

Escala de Guttman (Guttman Scale)

Um conjunto de afirmações organizadas por dificuldade ou intensidade crescente. Se um respondente concorda com uma afirmação «mais forte», subentende-se que ele também concorda com todas as anteriores. Exemplo: «Uso o aplicativo uma vez por mês» → «Uso o aplicativo uma vez por semana» → «Uso todos os dias» → «Recomendo o aplicativo aos amigos». Leia mais no artigo Guttman Scale.

Quantos pontos em uma escala são ideais

A eterna pergunta: 5, 7, 10 ou outra coisa? Não há uma resposta única, mas há orientações.

Menos de 4 pontos é grosseiro demais. Uma escala binária («Sim / Não») não capta as nuances. Uma escala de 3 pontos («Ruim / Normal / Bom») perde a maior parte da informação. Só é adequada para as medições mais simples.

5 pontos é o clássico. Granularidade suficiente para a maioria das tarefas, sem sobrecarregar o respondente. O padrão para o CSAT, o CES e as avaliações gerais de satisfação.

7 pontos é um pouco mais preciso que 5, especialmente para a pesquisa acadêmica e a medição de atitudes. Os estudos mostram que uma escala de 7 pontos dá resultados mais confiáveis que uma de 5, mas a diferença é pequena.

10–11 pontos é uma granularidade alta. O NPS usa uma escala de 0 a 10. A vantagem: maior variabilidade das respostas. A desvantagem: é mais difícil para o respondente distinguir «6» de «7», e a escolha se torna menos consciente.

Número par vs. ímpar de pontos. Um número ímpar de pontos (5, 7) admite uma posição neutra: o respondente pode «se esquivar». Um número par (4, 6) o obriga a tomar partido. Se obter uma resposta definida é importante para você, use um número par. Se quiser conceder o direito à neutralidade, use um ímpar.

Recomendações práticas para trabalhar com escalas

Rotule cada ponto. «1 — 2 — 3 — 4 — 5» sem explicações é adivinhar com números. «1 = Discordo totalmente, 2 = Discordo um pouco, 3 = Neutro, 4 = Concordo um pouco, 5 = Concordo totalmente» é medição. Os rótulos reduzem a dispersão das interpretações e aumentam a confiabilidade dos dados.

Use uma só escala para um bloco de perguntas. Se em um bloco de 10 perguntas as três primeiras usam uma escala de 5 pontos, as duas seguintes uma de 7 pontos e as últimas cinco uma de 10 pontos, o respondente vai se confundir e os dados serão incomparáveis. A uniformidade é a chave para resultados limpos.

Evite rótulos ambíguos. «Satisfatório» significa «aceitável» para uns e «mal e mal suficiente» para outros. Quanto mais concreta for a formulação, menor será a dispersão. «Gostei de tudo» é mais preciso que «Bom».

Leve em conta o contexto cultural. Em algumas culturas, as avaliações extremas (1 e 5) são dadas raramente: são consideradas «indelicadas» ou «categóricas». Em outras, pelo contrário, os valores intermediários são pouco populares. Se o seu público é internacional, teste a escala em diferentes grupos.

Adicione uma opção «Não posso avaliar» / «Não se aplica». Se um respondente não usou um recurso, obrigá-lo a dar uma avaliação não faz sentido. Ele colocará um número aleatório que vai poluir os dados. Uma opção «N/A» filtra as respostas irrelevantes e deixa as médias mais limpas.

Escalas no SurveyNinja

No construtor do SurveyNinja estão disponíveis todos os principais tipos de escalas.

Avaliação com estrelas e números. Uma escala configurável de 1 a N: estrelas, números, emojis. Os rótulos para cada valor são opcionais. Adequada para avaliações rápidas de satisfação e para o CSAT.

Controle deslizante (Slider). Uma escala contínua com um intervalo e um passo configuráveis. O respondente arrasta um marcador: visualmente lembra uma VAS, mas com um valor numérico. Conveniente para perguntas do tipo «Qual a probabilidade de você nos recomendar?».

Matriz. Várias afirmações com a mesma escala, reunidas em uma tabela. Economiza espaço na tela e agiliza o preenchimento. Ideal para blocos de escalas de Likert. Leia mais sobre a configuração das perguntas no artigo de ajuda sobre elementos.

Pergunta NPS. Um elemento pronto para usar com uma escala de 0 a 10, divisão automática em promotores, neutros e detratores, e o cálculo do índice na análise.

Uma escala não é uma decoração do questionário, mas o seu instrumento de medição. Uma escala ruim produz dados que parecem convincentes, mas que não significam nada. Uma boa transforma as sensações subjetivas dos respondentes em números nos quais se pode confiar. Escolha a escala antes de redigir as perguntas, rotule cada ponto e não mude a escala no meio do questionário.

1