Conteúdo

Crie sua própria pesquisa hoje

Criador de pesquisas grátis e fácil de usar sem limite de respostas. Comece a coletar feedback em minutos.

Comece grátis
Logo SurveyNinja

IQR (intervalo interquartil)

O tempo médio de conclusão de uma pesquisa é de 4 minutos. O desvio padrão é de 18 minutos. O mínimo é de 30 segundos, o máximo de 4 horas (alguém deixou uma aba aberta a noite toda).

A média e o DP são distorcidos por alguns valores anômalos. A mediana é de 3 minutos, o IQR de 2 minutos. Esses dois números pintam um quadro verdadeiro: a maior parte dos respondentes termina em 2-4 minutos. O IQR é uma medida de dispersão que não reage a valores discrepantes e mostra onde estão os dados reais.

Definição

IQR (intervalo interquartil) é a diferença entre o terceiro quartil (Q3) e o primeiro quartil (Q1) de uma amostra. Mostra o intervalo que contém os 50% centrais das observações. Ao contrário do desvio padrão, o IQR é robusto a valores discrepantes - valores extremos não afetam sua magnitude. É usado em estatística descritiva, para construir diagramas de caixa e para a detecção formal de valores discrepantes pela regra do 1,5×IQR.

O que são quartis

Os quartis dividem os dados ordenados em quatro partes iguais:

  • Q1 (percentil 25) - 25% das observações ficam abaixo desse valor
  • Q2 (percentil 50) - é a mediana, com 50% das observações abaixo dela
  • Q3 (percentil 75) - 75% das observações ficam abaixo desse valor

IQR = Q3 - Q1. Ou seja, a diferença entre o percentil 25 e o percentil 75. É o intervalo que abrange os 50% centrais dos respondentes - sem os 25% inferiores e sem os 25% superiores.

Por que o IQR é robusto a valores discrepantes

Imagine uma amostra de tempos de conclusão de uma pesquisa: 2, 3, 3, 4, 4, 5, 6, 7, 8, 240 minutos. Um valor discrepante - alguém deixou uma aba aberta por 4 horas.

  • Média: 28,2 minutos (distorcida por um único valor)
  • Desvio padrão: 74,7 (enorme por causa do valor discrepante)
  • Mediana: 4,5 minutos
  • Q1 = 3, Q3 = 7, IQR = 4 minutos

A mediana e o IQR dizem a verdade: um respondente típico termina em 3-7 minutos. A média e o DP não são informativos. Essa é a principal vantagem do IQR: ele caracteriza a maior parte dos dados, e não os valores extremos.

A regra do 1,5×IQR para encontrar valores discrepantes

Um método formal para detectar valores discrepantes:

  • Limite inferior: Q1 - 1,5 × IQR
  • Limite superior: Q3 + 1,5 × IQR
  • Tudo o que estiver além desses limites é um valor discrepante em potencial

Para o exemplo do tempo: Q1 = 3, Q3 = 7, IQR = 4. Limite inferior: 3 - 6 = -3 (negativo, então não há valores discrepantes na parte inferior). Superior: 7 + 6 = 13. O valor de 240 minutos ultrapassa em muito o 13 - formalmente, um valor discrepante.

A regra do 1,5×IQR é o padrão para diagramas de caixa. Uma versão mais rígida - o 3×IQR - é usada para valores discrepantes "extremos". Ambos os métodos ajudam a sinalizar automaticamente anomalias nos dados de pesquisa: conclusões suspeitosamente rápidas ou lentas, respostas irrealistas a perguntas numéricas (idade de 150 anos, renda de um bilhão).

Diagrama de caixa e o IQR

Um diagrama de caixa (diagrama de caixa e bigodes) é uma visualização em que o IQR desempenha um papel central:

  • A "caixa" - os limites de Q1 a Q3 (os 50% centrais)
  • A linha dentro da caixa - a mediana
  • Os "bigodes" - até 1,5×IQR a partir das bordas da caixa
  • Os pontos além dos bigodes - valores discrepantes

Comparar as distribuições de dois grupos por meio de diagramas de caixa é uma forma rápida de ver a diferença no centro (um deslocamento da mediana) e a dispersão (a largura da caixa) sem calcular nenhuma estatística. Isso é especialmente útil ao analisar os dados de pesquisa por segmento: por exemplo, comparar as pontuações de satisfação de diferentes regiões em um único gráfico.

IQR versus desvio padrão

O desvio padrão e o IQR são ambos medidas de dispersão, mas medem coisas diferentes.

O DP usa todos os valores em seu cálculo - cada desvio em relação à média é elevado ao quadrado. Os valores discrepantes têm uma influência quadrática: um único valor a 10 desvios padrão da média contribui 100 vezes mais do que um valor típico.

O IQR usa apenas dois valores - Q1 e Q3. Tudo o que estiver acima de Q3 ou abaixo de Q1 não afeta a magnitude do IQR. Adicionar um valor discrepante extremo à amostra não mudará o IQR.

Quando usar cada um:

  • Os dados estão próximos de uma distribuição normal e não há valores discrepantes -> DP + média
  • A distribuição é assimétrica ou há valores discrepantes -> mediana + IQR
  • Em relatórios para um público geral, o IQR é mais intuitivo (cai dentro do intervalo dos "50% medianos")

Exemplo: o IQR na análise de pontuações de satisfação

Resultados de uma pesquisa CSAT em uma escala de 1 a 10 em dois produtos:

Produto A: 7, 7, 8, 8, 8, 9, 9, 9, 9, 10. Mediana = 8,5, Q1 = 8, Q3 = 9, IQR = 1.

Produto B: 2, 4, 7, 7, 8, 8, 9, 9, 10, 10. Mediana = 8, Q1 = 7, Q3 = 9, IQR = 2.

As medianas são próximas: 8,5 e 8. Mas o IQR revela que no Produto A a maior parte dos clientes cai no estreito intervalo 8-9 - alta homogeneidade. No Produto B o intervalo é mais amplo: 7-9 e, além disso, há valores de 2 e 4 (possíveis valores discrepantes pela regra do 1,5×IQR). Isso significa que o Produto B tem um segmento de clientes insatisfeitos. O Produto A não tem esse segmento - uma pontuação alta e consistente. Essa é uma conclusão direta e prática para a equipe de produto.

Erros comuns ao trabalhar com o IQR

Remover automaticamente todos os valores discrepantes pela regra do 1,5×IQR. Isso é um limite estatístico, não um diagnóstico. Alguns "valores discrepantes" são casos reais que vale a pena estudar separadamente, em vez de descartar. Isso importa especialmente em amostras pequenas: remover 2-3 pontos de 30 altera substancialmente o quadro.

Usar o IQR para amostras pequenas. Quando n < 10, os quartis são estimados com grande erro, e o IQR se torna instável. Para amostras muito pequenas, é melhor usar todos os valores brutos ou o intervalo (máx. - mín.).

Comparar IQRs de escalas diferentes. Um IQR de 2 em uma escala de 1 a 10 é uma dispersão considerável. Um IQR de 2 em uma escala de 1 a 100 é minúsculo. Para comparar, use uma medida relativa: IQR / mediana.

O IQR na análise de dados de pesquisa

O IQR é aplicado na estatística descritiva do tempo de conclusão de uma pesquisa, das pontuações em escalas e das respostas quantitativas (idade, renda, frequência de uso). É útil na segmentação: comparar o IQR entre segmentos mostra em quais grupos as respostas são homogêneas e em quais variam muito.

Para sinalizar respostas suspeitas e controlar a qualidade dos dados, a regra do 1,5×IQR ajuda a encontrar automaticamente anomalias no tempo de conclusão, nas respostas numéricas e no número de ações. Exporte seus dados por meio da exportação de dados e calcule o IQR no Excel com a função QUARTILE.INC.

O IQR é a dispersão sem a influência dos extremos. Quando a média e o DP mentem por causa dos valores discrepantes, a mediana e o IQR mostram o quadro real. A regra do 1,5×IQR oferece uma maneira formal de procurar anomalias. Para distribuições assimétricas e dados com valores discrepantes, esse par (mediana + IQR) é a escolha padrão na estatística descritiva.

Perguntas frequentes

Qual a diferença entre o IQR e a amplitude?

A amplitude é a diferença entre o máximo e o mínimo. O IQR é a diferença entre Q3 e Q1. A amplitude usa os valores extremos e depende muito dos valores discrepantes. O IQR usa apenas os quartis centrais e é robusto a valores discrepantes. Para dados reais, o IQR é quase sempre mais informativo do que a amplitude.

Como calcular os quartis no Excel?

A função QUARTILE.INC(intervalo; 1) retorna Q1, e QUARTILE.INC(intervalo; 3) retorna Q3. IQR = Q3 - Q1. Como alternativa: PERCENTILE.INC(intervalo; 0,25) e PERCENTILE.INC(intervalo; 0,75).

Os valores além dos limites do 1,5×IQR devem ser sempre removidos?

Não. A regra do 1,5×IQR é uma forma de sinalizar observações incomuns, não um critério automático de remoção. Antes de removê-las, é preciso entender a natureza do valor discrepante: é um erro de digitação, um comportamento anômalo (um bot, um respondente desatento) ou um caso raro genuíno? Neste último caso, a remoção distorce o quadro em vez de melhorá-lo.

Quando o IQR é melhor do que o desvio padrão?

Quando os dados são assimétricos ou contêm valores discrepantes. Para dados distribuídos normalmente sem valores discrepantes, o DP é mais informativo - usa todos os valores. Para tempos de conclusão de pesquisas, renda e número de ações (sempre distribuições assimétricas à direita com valores discrepantes), o IQR é mais apropriado.

O IQR pode ser zero?

Sim - quando Q1 e Q3 coincidem. Isso significa que pelo menos metade das respostas tem o mesmo valor. Ocorre em distribuições binárias ou muito assimétricas - por exemplo, se 60% dos respondentes escolheram "sim" e Q1 = Q3 = 1. Nesses casos, o IQR não é informativo, e são necessários outros métodos de descrição (proporções, frequências).

1