Contenidos

Crea tu propia encuesta hoy

Constructor de encuestas gratis y fácil de usar sin límites de respuestas. Comienza a recopilar comentarios en minutos.

Empezar gratis
Logo SurveyNinja

Muestra (muestreo)

Imagina esta situación: una cadena de cafeterías quiere saber si los clientes están satisfechos con el nuevo menú. La cadena tiene 200.000 clientes al mes. Encuestarlos a todos es imposible: llevaría meses y costaría una fortuna. Encuestar a los 15 amigos del fundador no tiene sentido: su opinión no refleja la de la audiencia.

En algún punto entre «todos» y «quince conocidos» está el justo medio: una muestra lo bastante grande como para ofrecer datos fiables, y lo bastante compacta como para que el estudio sea viable. Saber construir esa muestra correctamente es la habilidad que distingue una investigación profesional de leer los posos del café.

Qué es una muestra

Muestra es un subconjunto de personas (u objetos) seleccionadas de un grupo más amplio — la población — para participar en un estudio. Los resultados obtenidos de la muestra se extrapolan a toda la población. La calidad de esa extrapolación depende de cuán representativa sea la muestra, es decir, de con qué precisión refleja la estructura y las características del grupo objetivo.

Una analogía culinaria: para saber si una olla de sopa tiene suficiente sal no hace falta beberse toda la olla; basta con removerla y probar una sola cucharada. La cuchara es la muestra, la olla es la población, y remover es la forma de garantizar la representatividad (para que la cuchara recoja no solo el caldo de la superficie, sino una mezcla de todos los ingredientes).

Muestra y población

Estos dos conceptos siempre trabajan en pareja.

Población es todo el grupo sobre el que quieres sacar conclusiones. Puede ser cualquier cosa: todos los clientes de una tienda online, todos los habitantes de una ciudad mayores de 18 años, todos los empleados de una empresa, todos los usuarios de una aplicación móvil.

Muestra es la parte de ese grupo que realmente encuestas.

El objetivo es que las conclusiones obtenidas a partir de la muestra sean válidas para toda la población. Esto solo es posible si la muestra es lo bastante grande y está bien construida. Si el 70% de los clientes de la cadena de cafeterías son mujeres de 25 a 35 años, pero el 90% de tu muestra son hombres mayores de 50, los datos serán inútiles aunque encuestes a mil personas.

Tipos de muestras

Todos los métodos de muestreo se dividen en dos grandes grupos: probabilísticos y no probabilísticos.

Muestreo probabilístico

Cada elemento de la población tiene una probabilidad conocida y distinta de cero de ser incluido en la muestra. Es el estándar de oro: los resultados pueden generalizarse a toda la población con una precisión medible.

Muestreo aleatorio simple. Se seleccionan al azar N personas de una lista completa de todos los miembros de la población. Cada uno tiene la misma probabilidad de ser elegido. Ejemplo: un generador de números aleatorios elige 500 de una base de 10.000 clientes. El requisito es disponer de una lista completa de la población, lo que no siempre es realista.

Muestreo estratificado. La población se divide en subgrupos (estratos) según un atributo importante: sexo, edad, región, nivel de ingresos. De cada estrato se extrae una submuestra aleatoria proporcional a su peso en la población. Así se garantiza la representación de todos los grupos clave.

Ejemplo. Una empresa encuesta a sus empleados. De la plantilla, el 60% trabaja en la oficina y el 40% en remoto. Con una muestra aleatoria simple de 100 personas podrían salir por azar 80 de oficina y 20 en remoto: un sesgo. El muestreo estratificado garantiza: 60 de oficina + 40 en remoto.

Muestreo por conglomerados. La población se divide en conglomerados (normalmente por criterio geográfico u organizativo), se eligen al azar varios conglomerados y dentro de ellos se encuesta a todos los participantes o a un conjunto seleccionado al azar. Es cómodo para poblaciones grandes y geográficamente dispersas.

Muestreo sistemático. Se selecciona cada N-ésimo elemento de una lista (por ejemplo, cada décimo cliente). Un método simple y rápido, pero puede generar distorsiones si la lista contiene una periodicidad oculta.

Muestreo no probabilístico

La probabilidad de ser incluido en la muestra es desconocida o desigual. Los resultados no pueden generalizarse de forma estricta a toda la población, pero el método es más barato, más rápido y a menudo el único disponible.

Muestreo por conveniencia. Se encuesta a quien está «a mano»: visitantes del sitio web, suscriptores del boletín, transeúntes en la calle. Es el método más común en las encuestas online y el más arriesgado en cuanto a representatividad. Si colocaste una encuesta en tu sitio web, solo la responderán quienes visitaron el sitio, y esa no es toda tu audiencia.

Muestreo por cuotas. El entrevistador recluta a los encuestados según cuotas establecidas: «se necesitan 50 mujeres y 50 hombres», «30% de 18 a 25 años, 40% de 26 a 40, 30% mayores de 40». Por fuera se parece al muestreo estratificado, pero dentro de cada cuota la selección no es aleatoria: el entrevistador decide a quién incluir.

Muestreo de bola de nieve. Un encuestado invita a otros encuestados: «¿Has rellenado el formulario? Reenvíalo a tus colegas». El método se utiliza cuando es difícil llegar al grupo objetivo por medios habituales, por ejemplo al investigar profesiones poco frecuentes, comunidades cerradas o grupos estigmatizados.

Muestreo intencional (experto). El investigador selecciona deliberadamente a los encuestados que cumplen ciertos criterios, por ejemplo, solo a quienes hicieron una compra en el último mes. Permite obtener información profunda de una audiencia relevante, pero no pretende ser generalizable.

Cómo calcular el tamaño de la muestra

Una de las preguntas más frecuentes es: «¿A cuántas personas hay que encuestar?». La respuesta depende de cuatro parámetros.

Tamaño de la población (N). ¿Cuántas personas hay en total en el grupo que estudias? Para poblaciones grandes (más de 100.000) este parámetro influye poco en el cálculo, lo cual resulta sorprendente, pero está matemáticamente demostrado.

Intervalo de confianza (margen de error). ¿Cuánto error es admisible? Si el intervalo de confianza es de ±5% y el 60% de los encuestados respondió «sí», entonces el valor real en la población se sitúa en el rango del 55 al 65%. Cuanto más estrecho sea el intervalo, mayor deberá ser la muestra.

Nivel de confianza. ¿Con qué probabilidad cae el resultado dentro del intervalo indicado? El estándar es el 95%: significa que, si repites el estudio 100 veces, el resultado caerá en el rango dado en 95 ocasiones. Para decisiones críticas se usa el 99%; para el cribado, a veces basta con el 90%.

Proporción esperada (p). Si no sabes de antemano cómo se distribuirán las respuestas, usa p = 50%: esto da el tamaño máximo de la muestra (el peor de los casos).

Para una encuesta de marketing típica con un intervalo de confianza de ±5% y un nivel de confianza del 95%, se necesitan unos 385 encuestados, independientemente de si estudias a 10.000 clientes o a 10 millones. Este hecho contraintuitivo se explica porque la precisión estadística viene determinada por el tamaño absoluto de la muestra, no por su proporción respecto a la población.

Para un cálculo rápido, usa la fórmula de Cochran o una calculadora en línea. Más importante que la fórmula es entender el principio: duplicar la muestra no duplica la precisión. Pasar de 100 a 400 encuestados da un salto brusco de fiabilidad. Pasar de 1.000 a 4.000, uno notablemente menor.

Errores de muestreo: qué puede salir mal

Error de cobertura. Tu lista de la población es incompleta. Ejemplo: encuestas a los clientes por correo electrónico, pero el 30% de los clientes nunca dejó su email: están fuera de tu alcance. El resultado reflejará solo la opinión de quienes dejaron su email, y ese puede ser un grupo sistemáticamente distinto (más fiel, más joven).

Sesgo de autoselección. La encuesta está abierta a todos, pero solo la responden quienes no tienen pereza, y eso es un tipo determinado de persona. Los clientes extremadamente satisfechos y los extremadamente insatisfechos rellenan los formularios con más frecuencia que los «medios». Como resultado, los datos se sesgan hacia los extremos.

Sesgo de no respuesta. Parte de los encuestados seleccionados no responde. Si quienes no responden difieren sistemáticamente de quienes sí lo hacen, los datos quedan distorsionados. Ejemplo: una encuesta de satisfacción laboral; quienes están quemados y piensan en marcharse tienen menos probabilidades de dedicar tiempo a un formulario corporativo.

Muestra demasiado pequeña. Veinte respuestas no dan conclusiones estadísticamente significativas, aunque te parezca que «la tendencia es obvia». Con una muestra pequeña, las fluctuaciones aleatorias son grandes, y una sola respuesta atípica puede desplazar todo el panorama.

Recomendaciones prácticas

Define la población antes de empezar el estudio. «Nuestros clientes» es demasiado vago. «Clientes que hicieron al menos una compra en los últimos 6 meses» es preciso y operacionalizable. Sin una definición clara de la población es imposible evaluar si la muestra es representativa.

Usa preguntas de cribado. Si la encuesta está abierta a todos pero solo necesitas a ciertas personas, añade un filtro al principio: «¿Compraste nuestro producto en los últimos 3 meses?». No: gracias, la encuesta ha terminado. Esto ayuda a depurar la muestra de encuestados irrelevantes.

Compara la estructura de la muestra con datos conocidos. Si sabes que el 55% de tus clientes son mujeres, pero en la muestra representan el 80%, eso es una señal de sesgo. Puedes corregir los resultados con una ponderación estadística, pero es mejor controlar la distribución desde el principio.

Lucha por la tasa de respuesta. Cuantas más personas de la muestra inicialmente seleccionada respondan realmente, menor será el error de no respuesta. Formularios cortos, invitaciones claras, recordatorios, incentivos (un regalo, un descuento): todo eso funciona. En SurveyNinja puedes configurar recordatorios automáticos y una campaña por correo electrónico para volver a alcanzar a quienes no respondieron.

Documenta tu método de muestreo. Quién entró en la muestra, cómo se seleccionó, qué porcentaje respondió: esta información es necesaria para interpretar los datos y para que tus colegas (o tú mismo dentro de medio año) puedan evaluar la fiabilidad de los resultados.

La muestra es el cimiento de cualquier estudio. Un error en esta etapa no se compensa ni con preguntas excelentes ni con una analítica avanzada. Si la muestra no es representativa, obtendrás una respuesta precisa a la pregunta equivocada. Dedica tiempo a planificar la muestra antes de lanzar la encuesta: es la inversión más rentable de todo el proyecto.

1