Contenidos

Crea tu propia encuesta hoy

Constructor de encuestas gratis y fácil de usar sin límites de respuestas. Comienza a recopilar comentarios en minutos.

Empezar gratis
Logo SurveyNinja

Estadística descriptiva

Las respuestas ya están: 300 encuestados, decenas de preguntas. Antes de contrastar hipótesis o construir modelos, hay que entender cómo «se ven» los datos en conjunto: cuál es el valor típico, cuánto varían las respuestas y cómo se distribuyen entre las opciones.

De esto se ocupa la estadística descriptiva: medidas resumen que comprimen una muestra en unos pocos números comprensibles: media, mediana, proporciones, dispersión. Sin ella es difícil interpretar tanto la significancia estadística como las propias cifras del informe.

La estadística descriptiva no saca conclusiones sobre la población y no contrasta hipótesis: solo caracteriza lo que ya recopilaste. Para generalizar a la población se necesitan intervalos de confianza, pruebas y el margen de error. Pero el primer paso de cualquier análisis es describir los datos.

Qué es la estadística descriptiva en palabras sencillas

La estadística descriptiva es el conjunto de métodos y medidas que resumen y caracterizan los datos de una muestra: la tendencia central (media, mediana, moda), la dispersión (varianza, desviación estándar, rango), la forma de la distribución, así como las frecuencias y proporciones por categoría. El objetivo es presentar de forma compacta «cómo» están estructurados los datos recopilados, sin sacar conclusiones sobre las causas y sin extrapolar a una población más amplia.

Dicho de manera simple: a partir de los datos calculas el valor «típico», la «dispersión» y las proporciones por grupos, y con base en este panorama decides qué hacer a continuación (comparar grupos, construir una regresión, revisar las preguntas).

Qué medidas incluye

  • Tendencia central. La media aritmética, la mediana y la moda: «en torno a qué» se concentran las respuestas. Para datos ordinales y de escala a menudo se observan tanto la media como la mediana: ante valores atípicos, la mediana es más robusta. Más detalles en el artículo aparte sobre las escalas y su interpretación.
  • Dispersión. Desviación estándar, varianza, rango (mín.–máx.), rango intercuartílico. Muestran cuánto se «separan» los valores en torno al centro. Sin la dispersión, una misma puntuación media puede significar «todos respondieron 4» o «la mitad respondió 1 y la mitad 7».
  • Frecuencias y proporciones. Cuántas personas eligieron cada opción (frecuencias absolutas) y qué porcentaje (proporciones). La base para tablas y gráficos de variables categóricas y ordinales.
  • Distribución. Histogramas, proporciones por intervalos y, cuando hace falta, una comprobación de normalidad. Ayuda a entender si los datos son simétricos y si hay valores atípicos.

Los informes de encuestas suelen presentar las medias por escala, las proporciones de «de acuerdo / en desacuerdo», un desglose por segmentos y tablas cruzadas. Esto es la estadística descriptiva en acción.

Un ejemplo breve. La pregunta «Valore la calidad del servicio del 1 al 5»: 200 respuestas. La estadística descriptiva da: media 3,8, mediana 4, moda 4, desviación estándar 0,9. Proporciones: «1» — 2%, «2» — 5%, «3» — 20%, «4» — 48%, «5» — 25%. Estas cifras muestran que la mayoría se inclina hacia las valoraciones positivas y que la dispersión es moderada; si la media también fuera 3,8 pero con un 50% de «1» y un 50% de «5», el panorama sería completamente distinto, y sin la dispersión y las proporciones no se vería.

Cuándo se necesita

La primera etapa de cualquier análisis. Antes de contrastar hipótesis, ejecutar una regresión o comparar grupos, conviene observar las medias, la dispersión y la distribución. Los valores atípicos y las distribuciones extrañas es mejor detectarlos de inmediato.

Informes para el cliente. La dirección y los colegas suelen necesitar «cifras en una sola línea»: la puntuación media de satisfacción, la proporción de quienes recomiendan, un desglose por regiones. Todo esto es estadística descriptiva.

Control de calidad de los datos. Las proporciones por sexo y edad, el número de valores faltantes, el tiempo de cumplimentación: estos resúmenes ayudan a saber si hay fallos en la recopilación o sesgos en la muestra.

La estadística descriptiva no responde a preguntas como «¿difiere la media del grupo A respecto al grupo B de forma estadísticamente significativa?» o «¿cuál es la estimación poblacional con una precisión dada?». Para ello se necesitan los métodos de la estadística inferencial (pruebas, intervalos de confianza).

Descripción por segmentos y subgrupos

A menudo los resúmenes generales por sí solos no bastan: hay que entender cómo lucen las medidas en distintos grupos —por sexo, edad, región, tipo de cliente—. Se calculan las mismas medias, proporciones y dispersión, pero por separado para cada subgrupo. Así se obtienen tablas cruzadas y perfiles de segmentos. Es importante indicar el tamaño de cada subgrupo: una media sobre 15 encuestados y otra sobre 150 tienen distinto grado de confianza. Si un subgrupo es muy pequeño, lo mejor es acompañar sus cifras descriptivas con una advertencia, o no sacar conclusiones firmes de él.

Errores típicos

Fijarse solo en la media. En datos ordinales y de escala, ante asimetría o valores atípicos, la mediana y la moda suelen ser más informativas. Además, observa la dispersión: una misma «puntuación media de 3,5» puede darse tanto con «todos 3–4» como con «la mitad 1, la mitad 6».

Confundirla con la estadística inferencial. La estadística descriptiva caracteriza únicamente tu muestra. Afirmaciones como «la media de la población es 4,2» o «la diferencia entre grupos es significativa» requieren intervalos de confianza y pruebas: eso ya es el siguiente nivel.

Ignorar el tamaño de la muestra. Una media sobre 30 encuestados y otra sobre 3.000 tienen distinta estabilidad. En el informe, indica siempre el tamaño de la muestra y, cuando sea posible, la dispersión (por ejemplo, la desviación estándar o un intervalo de confianza para la media).

Mezclar escalas. Una media sobre categorías nominales (tipo de cliente, región) no tiene sentido. Para variables categóricas, solo frecuencias y proporciones; para las ordinales e intervalares, media, mediana y dispersión teniendo en cuenta el tipo de escala.

Comparar grupos sin tener en cuenta el tamaño. «En el grupo A la media es 4,2 y en el grupo B es 3,9» es correcto desde el punto de vista descriptivo, pero sin indicar N y sin comprobar la significancia de la diferencia es solo una constatación. Para concluir que «los grupos difieren» se necesitan pruebas e intervalos de confianza; la estadística descriptiva conduce a la pregunta, pero no la responde.

Cómo se ve en SurveyNinja

En la sección «Informes y respuestas» se muestran por defecto los resúmenes de cada pregunta: el número de respuestas, las proporciones por opción y, para las escalas, la media. Esto es la estadística descriptiva básica. Para tablas cruzadas por segmento, o para calcular la mediana o la desviación estándar, los datos se pueden exportar a CSV/XLSX y calcular en una hoja de cálculo o en un paquete estadístico. Al exportar, resulta cómodo usar filtros para describir solo la submuestra que necesitas (por ejemplo, quienes completaron la encuesta o una región concreta).

Recomendaciones prácticas

Indica siempre la N. Junto a la media y las proporciones, escribe sobre cuántas respuestas se calcularon. Para los subgrupos, indica el tamaño del subgrupo; de lo contrario el lector no podrá juzgar la fiabilidad de las cifras.

Añade una medida de dispersión. Al menos la desviación estándar para las medias, o un intervalo de confianza: así se ven tanto el valor «típico» como su incertidumbre.

Antes de un análisis complejo, explora. Los histogramas y los resúmenes por variable ayudan a detectar valores atípicos, faltantes y distribuciones inesperadas antes de una regresión o de las pruebas.

No te limites a una sola medida de centro. Para datos simétricos, la media y la mediana son cercanas; ante asimetría o valores atípicos, la mediana es más robusta. Tiene sentido observar ambas y, cuando haga falta, explicar en el informe por qué elegiste una u otra (por ejemplo, «se presenta la mediana debido a la marcada asimetría de la distribución»).

Relación con otros tipos de análisis

La estadística descriptiva es el fundamento. Sobre su base se construyen el análisis de correlación y el análisis de regresión (primero se observan las medias y la dispersión de las variables), se contrastan las diferencias entre grupos (comparando medias y proporciones con ayuda de pruebas) y se interpretan los resultados de las encuestas cuantitativas. Las medidas individuales —media, mediana, moda, desviación estándar— se tratan en sus propios artículos del glosario; aquí lo importante es dejar establecido que la descripción de los datos siempre va primero, y las conclusiones y generalizaciones, después.

La estadística descriptiva es el primer paso del análisis: comprime los datos en medidas comprensibles (media, mediana, proporciones, dispersión) y no saca conclusiones más allá de la muestra. Sin ella es difícil interpretar tanto el informe como los posteriores contrastes de hipótesis; con ella, el panorama de los datos se vuelve claro antes de cualquier generalización.

1