Contenidos

Crea tu propia encuesta hoy

Constructor de encuestas gratis y fácil de usar sin límites de respuestas. Comienza a recopilar comentarios en minutos.

Empezar gratis
Logo SurveyNinja

Desviación estándar

La puntuación media de satisfacción es 4,2. Pero ¿qué significa eso: todos respondieron "4" y "5", o la mitad puso un "1" y la mitad un "7"? Para entender cuánto se "dispersan" las respuestas alrededor de la media, se usa la desviación estándar. Muestra la distancia típica entre la media y un valor individual: cuanto mayor es, más amplia es la dispersión. En las encuestas, la desviación estándar ayuda a evaluar lo consistentes que son las respuestas, a construir intervalos de confianza y a entender lo "típica" que es realmente la media.

La desviación estándar es una de las medidas de dispersión de la estadística descriptiva. Sin ella, la media puede inducir a error: una misma "puntuación media de 3,5" puede provenir de un consenso (todos alrededor de 3-4) o de una polarización (la mitad puntuaciones bajas, la mitad altas).

Qué es la desviación estándar en palabras sencillas

La desviación estándar (SD) es una medida de cuán dispersos están los datos alrededor de la media aritmética. Muestra cuánto se desvían, en promedio, los valores respecto de la media: si la desviación estándar es pequeña, los datos están "agrupados" cerca del centro; si es grande, están muy dispersos. Se calcula como la raíz cuadrada de la varianza (la media de las desviaciones al cuadrado respecto de la media). En una distribución simétrica, aproximadamente dos tercios de las observaciones caen dentro de la banda "media más o menos una desviación estándar".

Dicho de forma sencilla: la desviación estándar responde a la pregunta "cuánto difieren, en promedio, las respuestas respecto de la media". Si en una escala de 1 a 5 la media es 4 y la desviación estándar es 0,3, casi todos respondieron "4"; si la desviación estándar es 1,5, las respuestas están dispersas de "1" a "5".

Cómo se calcula

Fórmula. Primero se calcula la media aritmética de todos los valores. Luego, para cada valor se halla su desviación respecto de la media (valor menos media), se eleva al cuadrado y se promedian esos cuadrados: esto da la varianza. La desviación estándar es la raíz cuadrada de la varianza. En programas y hojas de cálculo esto se hace automáticamente con la función STDEV o equivalente.

Ejemplo resuelto. Cinco respuestas: 3, 4, 4, 4, 5. Media = (3+4+4+4+5)/5 = 4. Desviaciones: -1, 0, 0, 0, 1. Cuadrados: 1, 0, 0, 0, 1. Media de los cuadrados (varianza) = 0,4. Desviación estándar = raíz(0,4) ~ 0,63. Las respuestas están cerca de la media: la dispersión es pequeña.

Si las respuestas hubieran sido 1, 2, 4, 6, 7 (media también 4), la desviación estándar sería de unos 2,3: la dispersión es notablemente mayor.

Para una muestra y para una población. En las fórmulas a veces se divide por N (el número de observaciones) o por N-1 (corrección de Bessel). Dividir por N-1 da una estimación insesgada de la desviación estándar de la población a partir de una muestra; para describir la propia muestra se puede usar cualquiera de las dos versiones, pero N-1 es más habitual. En Excel la función STDEV.S usa N-1, mientras que STDEV.P usa N.

Cuándo la necesitas

Evaluar lo consistentes que son las respuestas. Una desviación estándar baja (por ejemplo, 0,5 en una escala de 1 a 5) significa que los encuestados respondieron de forma parecida; una alta (por ejemplo, 1,8) significa que las opiniones difieren mucho. Esto es útil al interpretar la media: "una media de 4,2 con una desviación estándar de 0,4" indica consenso, mientras que "una media de 4,2 con una desviación estándar de 1,6" indica polarización.

Intervalos de confianza. Para construir un intervalo de confianza alrededor de la media necesitas conocer el error estándar de la media (la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra). Cuanto mayor es la desviación estándar, más amplio es el intervalo: la incertidumbre es mayor.

Comparar grupos. Al comparar medias entre dos grupos (por ejemplo, por segmentos), importa mirar no solo la diferencia de medias, sino también las desviaciones estándar. Si el grupo A tiene una media de 4,5 (desviación estándar 0,3) y el grupo B una media de 4,2 (desviación estándar 1,2), los grupos difieren no solo en su media, sino también en lo consistentes que son las respuestas.

Comprobar la calidad de los datos. Una desviación estándar inusualmente grande puede señalar problemas: errores de introducción de datos, una pregunta ambigua, una audiencia mixta. Por ejemplo, si para la pregunta "Valora del 1 al 5" la desviación estándar se acerca a 2,0 con una media de 3,0, esto puede significar que la pregunta se entendió de maneras distintas o que la muestra es heterogénea.

Interpretación en las encuestas

Por escalas. Para una escala de 1 a 5, una desviación estándar de alrededor de 0,5-0,8 suele indicar alta consistencia; 1,0-1,3 indica dispersión moderada; por encima de 1,5 indica dispersión fuerte o polarización. Pero importa leerla en el contexto de la media: con una media de 4,5 una desviación estándar de 0,6 puede significar "sobre todo 4 y 5", mientras que con una media de 3,0 la misma desviación estándar significa "sobre todo 2, 3 y 4".

Comparación con el rango. El rango (máximo menos mínimo) muestra la amplitud total, pero no capta cómo se distribuyen los valores dentro de él. La desviación estándar tiene en cuenta todos los valores y sus frecuencias. Por ejemplo, con respuestas 1, 1, 5, 5 el rango = 4 y la desviación estándar ~ 2,0 (polarización). Con respuestas 2, 3, 3, 4, 4 el rango también es 2, pero la desviación estándar ~ 0,8 (consenso).

Relación con la mediana. En una distribución simétrica la media y la mediana están próximas, y la desviación estándar describe la dispersión alrededor de ambas. Con asimetría, la mediana es más robusta frente a los valores atípicos, mientras que la desviación estándar puede verse inflada por valores extremos aislados. Por eso, con asimetría, a veces se mira la mediana y el rango intercuartílico (IQR) como alternativa a la media y la desviación estándar.

Ejemplos en cifras

Escenario 1: alta consistencia. Pregunta "Valora el servicio del 1 al 5": 100 respuestas, 80% son "4", 15% son "5", 5% son "3". Media ~ 4,1, desviación estándar ~ 0,4. Casi todos están satisfechos, la dispersión es mínima. En el informe puedes escribir: "una puntuación media de 4,1 (desviación estándar 0,4), lo que indica un alto nivel de acuerdo en las opiniones".

Escenario 2: polarización. Las mismas 100 respuestas, pero 40% son "1", 20% son "3", 40% son "5". La media también es de unos 3,0, pero la desviación estándar ~ 1,8. Aquí la media no refleja la respuesta "típica": hay dos "bandos". En el informe es adecuado señalar: "una media de 3,0 con una desviación estándar de 1,8 apunta a opiniones polarizadas; se recomienda un análisis por segmentos".

Escenario 3: dispersión moderada. Distribución: 10% son "1", 20% son "2", 30% son "3", 25% son "4", 15% son "5". Media ~ 3,2, desviación estándar ~ 1,2. Hay dispersión, pero sin una polarización clara. Es una imagen típica de muchas encuestas.

Relación con otras métricas

Varianza. La desviación estándar es la raíz cuadrada de la varianza. La varianza se mide en unidades al cuadrado (por ejemplo, si las puntuaciones están en puntos, la varianza está en "puntos al cuadrado"), mientras que la desviación estándar está en las mismas unidades que los datos originales. Por eso la desviación estándar es más cómoda para la interpretación.

Media aritmética. La media y la desviación estándar describen juntas el centro y la dispersión. Sin la desviación estándar la media puede ser engañosa: una "media de 3,5" con una desviación estándar de 0,3 y con una de 1,8 son situaciones distintas. Los informes de encuestas suelen presentar ambas cifras: "una media de 4,2 (SD = 0,7)".

Intervalos de confianza. Para construir un intervalo alrededor de la media se usa el error estándar de la media (desviación estándar / raíz(N)). Cuanto mayor es la desviación estándar y menor la muestra, más amplio es el intervalo. Más información en el artículo sobre intervalos de confianza.

La distribución normal. En la distribución normal, alrededor del 68% de los valores caen dentro de "media +/- 1 desviación estándar", y el 95% dentro de "media +/- 2 desviaciones estándar". Esta regla de las "tres sigmas" ayuda a estimar cuántas respuestas caen en un rango dado cuando la distribución es cercana a la normal.

Coeficiente de variación. La razón entre la desviación estándar y la media (CV = SD / media) muestra la dispersión relativa. Es útil al comparar variables en distintas unidades o con medias distintas. Por ejemplo, si la media es 4,0 y la desviación estándar es 0,8, entonces CV = 0,2 (20% de dispersión respecto de la media).

Errores habituales

Ignorar la desviación estándar al interpretar la media. Una "media de 3,8" sin una medida de dispersión no da la imagen completa. Indica siempre la desviación estándar junto a la media o, al menos, menciona la dispersión con palabras ("las respuestas variaron de 1 a 5").

Calcular una desviación estándar para variables categóricas. Para variables nominales (región, tipo de cliente) no se calcula una desviación estándar: ahí solo son adecuadas las frecuencias y las proporciones. Para escalas ordinales (por ejemplo, una escala de Likert) la desviación estándar sí tiene sentido, pero se interpreta teniendo en cuenta las limitaciones de la escala.

Comparar desviaciones estándar sin tener en cuenta las medias. Una desviación estándar de 1,0 con una media de 2,0 y con una media de 4,5 son situaciones distintas. Con una media de 2,0 una dispersión de 1,0 es relativamente grande (50% de la media), mientras que con una media de 4,5 es moderada (alrededor del 22%). Usa el coeficiente de variación para comparar la dispersión relativa.

Confundir la desviación estándar con el error estándar. La desviación estándar describe la dispersión de los datos originales; el error estándar de la media (SD / raíz(N)) describe la incertidumbre en la estimación de la media. Para los intervalos de confianza necesitas el error estándar, no la propia desviación estándar.

Esperar normalidad. La regla "68% dentro de una desviación estándar" funciona para la distribución normal. En las encuestas, las distribuciones a menudo son asimétricas o están acotadas por la escala: en ese caso esta regla es solo aproximada. Mira el histograma y usa la desviación estándar como medida descriptiva, no como una regla estricta.

Por segmentos y subgrupos

La desviación estándar se calcula no solo para toda la muestra, sino también dentro de los segmentos: por región, tipo de cliente, edad. Esto ayuda a entender en qué grupos las opiniones son consistentes y en cuáles están polarizadas. Por ejemplo, si en el segmento A la media es 4,5 (SD = 0,4) y en el segmento B la media es 3,8 (SD = 1,5), los grupos difieren tanto en nivel como en consistencia. En el informe es adecuado indicar las desviaciones estándar de cada subgrupo junto a las medias.

Cómo se ve esto en SurveyNinja

En los informes, la media se muestra por defecto para las preguntas de escala; la desviación estándar no se muestra en la interfaz. Puedes obtenerla tras exportar las respuestas a CSV/XLSX y calcularla en Excel (la función STDEV.S) o en otro paquete estadístico. Al preparar un informe para un cliente, es cómodo añadir la desviación estándar junto a la media: esto da una imagen más completa de cómo están dispersas las respuestas.

Recomendaciones prácticas

Indica siempre la desviación estándar junto a la media. En lugar de "una puntuación media de 4,2", escribe "una puntuación media de 4,2 (SD = 0,7)" o "una puntuación media de 4,2, desviación estándar 0,7". Esto ayuda al lector a evaluar lo consistentes que son las respuestas.

Interprétala en el contexto de la escala. Para una escala de 1 a 5 una desviación estándar de 0,5 significa alta consistencia; para una escala de 0 a 100 la misma desviación estándar de 0,5 significa un acuerdo casi total. Ten siempre en cuenta el rango de la escala.

Cuando haya polarización, amplía el análisis. Si la desviación estándar es grande (por ejemplo, más de la mitad del rango de la escala), tiene sentido mirar la distribución y hacer un análisis por segmentos: puede haber grupos con opiniones distintas dentro de la muestra.

Al comparar grupos, indica las desviaciones estándar. Al comparar medias entre dos grupos, indica la desviación estándar de cada grupo. Esto ayuda a entender si los grupos difieren solo en su media o también en lo consistentes que son las respuestas.

Qué escribir en el informe. En la sección de resultados, indica la media y la desviación estándar para las preguntas de escala clave. Si la desviación estándar es inusualmente grande o pequeña, comenta brevemente: "un alto nivel de acuerdo en las opiniones" o "se observan respuestas polarizadas, se recomienda un análisis por segmentos".

La desviación estándar muestra la dispersión de los datos alrededor de la media y ayuda a entender lo consistentes que son las respuestas. Sin ella la media puede inducir a error; juntas dan una imagen completa de la tendencia central y la dispersión, la base para interpretar los resultados de una encuesta.

1