Conteúdo

Crie sua própria pesquisa hoje

Criador de pesquisas grátis e fácil de usar sem limite de respostas. Comece a coletar feedback em minutos.

Comece grátis
Logo SurveyNinja

Amostra (amostragem)

Imagine a seguinte situação: uma rede de cafeterias quer saber se os clientes estão satisfeitos com o novo cardápio. A rede tem 200.000 clientes por mês. Entrevistar todos é impossível: levaria meses e custaria uma fortuna. Entrevistar os 15 amigos do fundador não faz sentido: a opinião deles não reflete a da audiência.

Em algum ponto entre «todos» e «quinze conhecidos» está o meio-termo: uma amostra grande o suficiente para fornecer dados confiáveis e compacta o suficiente para que o estudo seja viável. Saber construir essa amostra corretamente é a habilidade que distingue uma pesquisa profissional de ler borra de café.

O que é uma amostra

Amostra é um subconjunto de pessoas (ou objetos) selecionadas de um grupo mais amplo — a população — para participar de um estudo. Os resultados obtidos com a amostra são extrapolados para toda a população. A qualidade dessa extrapolação é determinada por quão representativa é a amostra, ou seja, por quão fielmente ela reflete a estrutura e as características do grupo-alvo.

Uma analogia culinária: para saber se uma panela de sopa tem sal suficiente não é preciso beber a panela inteira; basta mexer e provar uma única colher. A colher é a amostra, a panela é a população, e mexer é a forma de garantir a representatividade (para que a colher pegue não só o caldo da superfície, mas uma mistura de todos os ingredientes).

Amostra e população

Esses dois conceitos sempre trabalham em dupla.

População é todo o grupo sobre o qual você quer tirar conclusões. Pode ser qualquer coisa: todos os clientes de uma loja online, todos os moradores de uma cidade com mais de 18 anos, todos os funcionários de uma empresa, todos os usuários de um aplicativo móvel.

Amostra é a parte desse grupo que você de fato entrevista.

O objetivo é que as conclusões tiradas a partir da amostra sejam válidas para toda a população. Isso só é possível se a amostra for grande o suficiente e estiver bem construída. Se 70% dos clientes da rede de cafeterias são mulheres de 25 a 35 anos, mas 90% da sua amostra são homens com mais de 50, os dados serão inúteis mesmo que você entreviste mil pessoas.

Tipos de amostra

Todos os métodos de amostragem se dividem em dois grandes grupos: probabilísticos e não probabilísticos.

Amostragem probabilística

Cada elemento da população tem uma probabilidade conhecida e diferente de zero de ser incluído na amostra. Esse é o padrão ouro: os resultados podem ser generalizados para toda a população com uma precisão mensurável.

Amostragem aleatória simples. N pessoas são selecionadas aleatoriamente de uma lista completa de todos os membros da população. Cada um tem a mesma chance de ser escolhido. Exemplo: um gerador de números aleatórios escolhe 500 de uma base de 10.000 clientes. O requisito é ter uma lista completa da população, o que nem sempre é realista.

Amostragem estratificada. A população é dividida em subgrupos (estratos) por um atributo importante: sexo, idade, região, nível de renda. De cada estrato extrai-se uma subamostra aleatória proporcional à sua parcela na população. Assim se garante a representação de todos os grupos-chave.

Exemplo. Uma empresa entrevista seus funcionários. Do quadro, 60% trabalham no escritório e 40% remotamente. Com uma amostra aleatória simples de 100 pessoas, poderiam sair por acaso 80 do escritório e 20 remotos: um viés. A amostragem estratificada garante: 60 do escritório + 40 remotos.

Amostragem por conglomerados. A população é dividida em conglomerados (geralmente por critério geográfico ou organizacional), escolhem-se aleatoriamente vários conglomerados e, dentro deles, entrevistam-se todos os participantes ou um conjunto selecionado aleatoriamente. É prática para populações grandes e geograficamente dispersas.

Amostragem sistemática. Seleciona-se cada N-ésimo elemento de uma lista (por exemplo, a cada décimo cliente). Um método simples e rápido, mas que pode gerar distorções se a lista contiver uma periodicidade oculta.

Amostragem não probabilística

A probabilidade de ser incluído na amostra é desconhecida ou desigual. Os resultados não podem ser estritamente generalizados para toda a população, mas o método é mais barato, mais rápido e, muitas vezes, o único disponível.

Amostragem por conveniência. Entrevista-se quem está «à mão»: visitantes do site, assinantes da newsletter, transeuntes na rua. É o método mais comum em pesquisas online e o mais arriscado em termos de representatividade. Se você colocou uma pesquisa no seu site, só vão respondê-la quem visitou o site, e essa não é toda a sua audiência.

Amostragem por cotas. O entrevistador recruta os respondentes de acordo com cotas definidas: «precisamos de 50 mulheres e 50 homens», «30% de 18 a 25 anos, 40% de 26 a 40, 30% acima de 40». Por fora, parece-se com a amostragem estratificada, mas dentro de cada cota a seleção não é aleatória: o entrevistador decide quem incluir.

Amostragem bola de neve. Um respondente convida outros respondentes: «Preencheu o formulário? Encaminhe para seus colegas». O método é usado quando o grupo-alvo é difícil de alcançar por meios comuns, por exemplo, ao pesquisar profissões raras, comunidades fechadas ou grupos estigmatizados.

Amostragem intencional (por especialistas). O pesquisador seleciona deliberadamente os respondentes que atendem a certos critérios, por exemplo, apenas aqueles que fizeram uma compra no último mês. Permite obter informações aprofundadas de uma audiência relevante, mas não pretende ser generalizável.

Como calcular o tamanho da amostra

Uma das perguntas mais frequentes é: «Quantas pessoas é preciso entrevistar?». A resposta depende de quatro parâmetros.

Tamanho da população (N). Quantas pessoas há ao todo no grupo que você estuda? Para populações grandes (acima de 100.000) esse parâmetro influencia pouco o cálculo, o que é surpreendente, mas está matematicamente comprovado.

Intervalo de confiança (margem de erro). Quanto erro é admissível? Se o intervalo de confiança for de ±5% e 60% dos respondentes responderam «sim», então o valor real na população está na faixa de 55 a 65%. Quanto mais estreito o intervalo, maior precisa ser a amostra.

Nível de confiança. Com que probabilidade o resultado cai dentro do intervalo indicado? O padrão é 95%: isso significa que, se você repetir o estudo 100 vezes, o resultado cairá na faixa dada em 95 ocasiões. Para decisões críticas usa-se 99%; para a triagem, às vezes basta 90%.

Proporção esperada (p). Se você não sabe de antemão como as respostas serão distribuídas, use p = 50%: isso dá o tamanho máximo da amostra (o pior cenário).

Para uma pesquisa de marketing típica, com intervalo de confiança de ±5% e nível de confiança de 95%, são necessários cerca de 385 respondentes, independentemente de você estudar 10.000 clientes ou 10 milhões. Esse fato contraintuitivo é explicado pelo princípio de que a precisão estatística é determinada pelo tamanho absoluto da amostra, e não pela sua proporção em relação à população.

Para um cálculo rápido, use a fórmula de Cochran ou uma calculadora online. Mais importante que a fórmula é entender o princípio: dobrar a amostra não dobra a precisão. Ir de 100 para 400 respondentes dá um salto brusco de confiabilidade. Ir de 1.000 para 4.000, um salto bem menor.

Erros de amostragem: o que pode dar errado

Erro de cobertura. Sua lista da população está incompleta. Exemplo: você entrevista os clientes por e-mail, mas 30% dos clientes nunca deixaram um e-mail: estão fora do seu alcance. O resultado refletirá apenas a opinião de quem deixou o e-mail, e esse pode ser um grupo sistematicamente diferente (mais fiel, mais jovem).

Viés de autosseleção. A pesquisa está aberta a todos, mas só a respondem quem não tem preguiça, e esse é um tipo específico de pessoa. Clientes extremamente satisfeitos e extremamente insatisfeitos preenchem os formulários com mais frequência do que os «medianos». Como resultado, os dados ficam enviesados em direção aos extremos.

Viés de não resposta. Parte dos respondentes selecionados não responde. Se quem não responde difere sistematicamente de quem responde, os dados ficam distorcidos. Exemplo: uma pesquisa de satisfação no trabalho; quem está esgotado e pensando em pedir demissão tem menos probabilidade de gastar tempo com um formulário corporativo.

Amostra pequena demais. Vinte respostas não dão conclusões estatisticamente significativas, mesmo que pareça a você que «a tendência é óbvia». Com uma amostra pequena, as flutuações aleatórias são grandes, e uma única resposta atípica pode deslocar todo o panorama.

Recomendações práticas

Defina a população antes de começar o estudo. «Nossos clientes» é vago demais. «Clientes que fizeram pelo menos uma compra nos últimos 6 meses» é preciso e operacionalizável. Sem uma definição clara da população, é impossível avaliar se a amostra é representativa.

Use perguntas de triagem. Se a pesquisa está aberta a todos, mas você só precisa de certas pessoas, adicione um filtro no início: «Você comprou nosso produto nos últimos 3 meses?». Não: obrigado, a pesquisa terminou. Isso ajuda a limpar a amostra de respondentes irrelevantes.

Compare a estrutura da amostra com dados conhecidos. Se você sabe que 55% dos seus clientes são mulheres, mas na amostra elas representam 80%, isso é um sinal de viés. Você pode corrigir os resultados com ponderação estatística, mas é melhor controlar a distribuição desde o início.

Lute pela taxa de resposta. Quanto mais pessoas da amostra inicialmente selecionada de fato responderem, menor será o erro de não resposta. Formulários curtos, convites claros, lembretes, incentivos (um presente, um desconto): tudo isso funciona. No SurveyNinja você pode configurar lembretes automáticos e uma campanha por e-mail para alcançar novamente quem não respondeu.

Documente seu método de amostragem. Quem entrou na amostra, como foram selecionados, qual porcentagem respondeu: essa informação é necessária para interpretar os dados e para que os colegas (ou você mesmo daqui a meio ano) possam avaliar a confiabilidade dos resultados.

A amostra é o alicerce de qualquer estudo. Um erro nessa etapa não é compensado nem por perguntas excelentes nem por uma análise avançada. Se a amostra não for representativa, você obterá uma resposta precisa para a pergunta errada. Dedique tempo ao planejamento da amostra antes de lançar a pesquisa: é o investimento mais rentável de todo o projeto.

1