Sesgo de selección
31 may. 2026 Tiempo de lectura ≈ 12 min
Una encuesta mostró que el 80% de los clientes está satisfecho con el servicio. Pero si la encuesta solo se envió a clientes activos que realizaron una compra recientemente, el resultado puede no reflejar la opinión de todos los clientes: los insatisfechos pueden haberse ido y no haber recibido la encuesta. Esto es el sesgo de selección: la muestra no es representativa porque acabaron en ella las personas equivocadas, o no en las proporciones correctas respecto a la población general. El sesgo de selección es una de las principales fuentes de sesgo en la investigación.
El sesgo de selección surge en la etapa de muestreo, antes de que los encuestados empiecen a responder las preguntas. Se diferencia del sesgo de respuesta, que está relacionado con la distorsión de las propias respuestas. Ambos tipos de sesgo son peligrosos, pero requieren métodos de mitigación distintos.
Qué significa el sesgo de selección en palabras sencillas
El sesgo de selección es una desviación sistemática de la muestra respecto a la población general debida a errores en el proceso de selección de los encuestados. Se produce cuando algunos grupos de personas tienen una probabilidad mayor o menor de acabar en la muestra que otros, lo que lleva a una sobrerrepresentación o subrepresentación de ciertos grupos. En las encuestas, el sesgo de selección puede surgir por una selección no aleatoria de los encuestados, una baja tasa de respuesta, la autoselección de los participantes u otros factores que hacen que la muestra no sea representativa.
Dicho de forma sencilla: el sesgo de selección ocurre cuando encuestas a las personas equivocadas, o no en las proporciones que necesitas. Si la población general es 50% hombres y 50% mujeres, pero tu muestra es 80% hombres y 20% mujeres, eso es sesgo de selección. Los resultados quedarán sesgados hacia la opinión de los hombres.
Cómo surge el sesgo de selección
Muestreo no probabilístico. Si los encuestados se seleccionan de forma no aleatoria (por ejemplo, solo quienes aceptaron participar, o solo quienes están disponibles en un momento determinado), la muestra puede no ser representativa. El muestreo probabilístico minimiza el sesgo de selección, pero no garantiza su ausencia.
Baja tasa de respuesta. Si solo el 20% de los invitados responde a la encuesta, surge el riesgo de sesgo de selección: quienes respondieron pueden diferir sistemáticamente de quienes no lo hicieron. Esto se relaciona con el sesgo de no respuesta.
Autoselección de los participantes. Si la participación en la encuesta es voluntaria y los encuestados deciden por sí mismos si participar o no, se produce la autoselección: a la encuesta llegan quienes están más motivados, interesados o tienen ciertas características. Por ejemplo, en las encuestas de satisfacción responden con más frecuencia los clientes muy satisfechos o muy insatisfechos.
Limitaciones del método de distribución. Distintos métodos de distribución alcanzan a grupos distintos. Las encuestas en línea pueden sobrerrepresentar a los jóvenes y a las personas con conocimientos tecnológicos, las encuestas telefónicas a las personas mayores y las encuestas en redes sociales a los usuarios activos de esas plataformas.
Limitaciones de tiempo. Si la encuesta solo está disponible en un momento determinado (por ejemplo, solo en horario laboral), puede no llegar a personas con otro horario de trabajo o de otras zonas horarias.
Barreras lingüísticas. Si la encuesta solo está disponible en un idioma, excluye a hablantes de otros idiomas, lo que puede crear sesgo de selección en poblaciones multilingües.
Tipos de sesgo de selección
Sesgo de cobertura. Algunos grupos de personas no tienen ninguna posibilidad de acabar en la muestra debido a las limitaciones del método de distribución. Por ejemplo, las encuestas en línea no llegan a personas sin acceso a internet, y las encuestas telefónicas no llegan a personas sin teléfono.
Sesgo de no respuesta. Quienes no respondieron a la encuesta difieren sistemáticamente de quienes lo hicieron. Por ejemplo, los clientes insatisfechos pueden ignorar con más frecuencia las encuestas de satisfacción, lo que infla las puntuaciones medias.
Sesgo de autoselección. La participación en la encuesta es voluntaria y los encuestados deciden por sí mismos si participar o no. A la encuesta llegan quienes están más motivados o tienen ciertas características, lo que hace que la muestra no sea representativa.
Sesgo del superviviente. Analizar solo los casos «exitosos» e ignorar a quienes abandonaron el proceso. En las encuestas, esto puede significar analizar solo las encuestas completadas sin tener en cuenta a quienes empezaron pero no terminaron.
Sesgo temporal. La encuesta se realiza en un momento determinado que puede no ser representativo. Por ejemplo, una encuesta en un día laborable puede excluir a las personas que trabajan en ese momento, o una encuesta en una estación concreta puede no reflejar las opiniones de otros periodos.
Cuándo el sesgo de selección es especialmente peligroso
Muestras pequeñas. Con un número reducido de encuestados, incluso un pequeño sesgo de selección puede distorsionar mucho los resultados. Pero es importante recordar: aumentar el tamaño de la muestra no resuelve el problema del sesgo de selección si este es sistemático.
Población general heterogénea. Si la población general varía mucho en características importantes (edad, ingresos, región), el sesgo de selección puede llevar a una sobrerrepresentación de unos grupos y una subrepresentación de otros.
Baja tasa de respuesta. Si responde a la encuesta menos del 30-40% de los invitados, el riesgo de sesgo de selección es alto. Es importante analizar quién no respondió y en qué podrían diferir de quienes sí lo hicieron.
Participación voluntaria. Si la participación en la encuesta es totalmente voluntaria y no hay incentivos ni recordatorios, se produce la autoselección: solo participan los encuestados más motivados.
Ejemplos de sesgo de selección
Encuesta de clientes en línea. La encuesta se envía por correo electrónico solo a clientes activos que realizaron una compra recientemente. Los clientes inactivos o quienes se pasaron a la competencia no reciben la encuesta. El resultado: una puntuación de satisfacción inflada, porque los clientes insatisfechos están subrepresentados.
Encuesta a empleados en horario laboral. La encuesta se realiza solo entre quienes están en la oficina en un momento determinado. Los empleados remotos, los empleados de viaje de trabajo o los que tienen otro horario no acaban en la muestra. El resultado: la opinión de solo una parte de los empleados, que puede no reflejar el panorama general.
Encuesta en redes sociales. La encuesta se publica solo en una red social. Los usuarios de otras plataformas o quienes no usan redes sociales no acaban en la muestra. El resultado: una sobrerrepresentación de los usuarios de esa red y de sus características.
Encuesta en un solo idioma. En un país multiétnico, la encuesta solo está disponible en un idioma. Los hablantes de otros idiomas quedan excluidos de la muestra. El resultado: una subrepresentación de ciertos grupos étnicos o lingüísticos.
Analizar solo las encuestas completadas. Se analizan solo las encuestas que los encuestados completaron por completo. Quienes empezaron pero abandonaron a la mitad quedan excluidos. El resultado: una sobrerrepresentación de los encuestados motivados y un posible sesgo del superviviente.
Cómo minimizar el sesgo de selección
Muestreo probabilístico. Usa métodos de muestreo probabilístico (muestreo aleatorio simple, muestreo sistemático, muestreo estratificado), en los que cada elemento de la población general tiene una probabilidad conocida de acabar en la muestra. Esto minimiza el sesgo de selección, pero no garantiza su ausencia.
Muestreo estratificado. Si la población general es heterogénea, usa el muestreo estratificado: divide la población en grupos (estratos) según características importantes y selecciona encuestados de cada estrato de forma proporcional a su peso en la población.
Múltiples canales de distribución. Usa distintas formas de distribuir la encuesta (correo electrónico, SMS, redes sociales, sitio web) para alcanzar a distintos grupos de encuestados y minimizar el sesgo de cobertura.
Aumentar la tasa de respuesta. Usa recordatorios, incentivos para participar, encuestas cortas y una interfaz cómoda para elevar la tasa de respuesta y reducir el sesgo de no respuesta. Cuanto mayor sea la tasa de respuesta, menor será el riesgo de sesgo de selección.
Análisis de los no respondientes. Haz un seguimiento de quién no respondió a la encuesta y, en la medida de lo posible, recopila información básica sobre los no respondientes (datos demográficos, estado del cliente) para evaluar el sesgo de selección y, si es necesario, corregir los resultados.
Ponderación de los datos. Si la muestra no es representativa, puedes usar la ponderación: asignar a los encuestados pesos inversamente proporcionales a su probabilidad de ser seleccionados en la muestra, para corregir el sesgo de selección.
Grupos de control. En la investigación experimental, usa grupos de control que se seleccionen con los mismos métodos que los experimentales, para asegurarte de que las diferencias entre los grupos no se deban al sesgo de selección.
Indicación explícita de las limitaciones. Si la muestra no es aleatoria o tiene limitaciones, indícalo de forma explícita en la metodología y describe el posible sesgo de selección. Esto ayuda a los lectores a interpretar correctamente los resultados.
Relación con la representatividad
El sesgo de selección socava la representatividad de la muestra: la capacidad de la muestra para reflejar las características de la población general. Una muestra representativa minimiza el sesgo de selección, pero no garantiza su ausencia: incluso con una muestra representativa puede haber sesgo de no respuesta u otros tipos de sesgo.
Es importante distinguir la representatividad por características demográficas (edad, género, región) de la representatividad por las características relevantes para la investigación (satisfacción, comportamiento, opiniones). Una muestra puede ser representativa por demografía pero no representativa por opiniones si hay sesgo de autoselección o sesgo de no respuesta.
Errores típicos
Ignorar el sesgo de selección. Suponer que una muestra grande o la significación estadística garantizan la fiabilidad de los resultados, sin tener en cuenta el posible sesgo de selección. Esto puede llevar a conclusiones erróneas.
Creer que las encuestas en línea siempre son no representativas. Las encuestas en línea pueden ser representativas si la población general son los usuarios de internet o si se usan métodos para compensar el sesgo de cobertura (múltiples canales, ponderación).
Confundir el sesgo de selección y el sesgo de respuesta. El sesgo de selección surge en la etapa de muestreo; el sesgo de respuesta, en la etapa de recopilación de respuestas. Es importante distinguirlos y aplicar métodos de mitigación distintos.
No analizar a los no respondientes. Ignorar a quienes no respondieron a la encuesta y no analizar en qué podrían diferir de quienes sí lo hicieron. Esto puede ocultar el sesgo de selección.
Cómo funciona esto en SurveyNinja
En SurveyNinja puedes usar distintas formas de distribuir las encuestas (correo electrónico, enlace, código QR, incrustación en un sitio web), lo que ayuda a minimizar el sesgo de cobertura. Puedes configurar recordatorios para los no respondientes y así elevar la tasa de respuesta y reducir el sesgo de no respuesta. Al analizar los resultados, es importante tener en cuenta el método de distribución y el posible sesgo de selección: si la encuesta se distribuyó solo por correo electrónico a clientes activos, los resultados pueden no reflejar la opinión de todos los clientes. En el informe conviene indicar el método de distribución y las posibles limitaciones de la muestra.
Recomendaciones prácticas
Ten siempre en cuenta el sesgo de selección al planificar. En la etapa de diseño de la encuesta, piensa cómo se formará la muestra, qué grupos pueden quedar sobrerrepresentados o subrepresentados, y toma medidas para minimizar el sesgo: muestreo probabilístico, múltiples canales, aumento de la tasa de respuesta.
Analiza a los no respondientes. Haz un seguimiento de quién no respondió a la encuesta y, en la medida de lo posible, recopila información básica sobre los no respondientes para evaluar el sesgo de selección y, si es necesario, corregir los resultados.
Usa múltiples canales. Distribuye la encuesta a través de distintos canales (correo electrónico, SMS, redes sociales, sitio web) para alcanzar a distintos grupos de encuestados y minimizar el sesgo de cobertura.
Eleva la tasa de respuesta. Usa recordatorios, incentivos, encuestas cortas y una interfaz cómoda para elevar la tasa de respuesta y reducir el sesgo de no respuesta.
Indica las limitaciones en el informe. En la metodología, indica de forma explícita el método de formación de la muestra, la tasa de respuesta, el posible sesgo de selección y las medidas tomadas para minimizarlo. Esto aumenta la transparencia y ayuda a los lectores a interpretar correctamente los resultados.
Qué escribir en el informe. En la sección de metodología, indica: «La muestra se formó mediante [muestreo aleatorio simple / muestreo estratificado / muestreo por conveniencia]. La encuesta se distribuyó a través de [correo electrónico / SMS / redes sociales]. La tasa de respuesta fue del [X]%. Posibles limitaciones: sesgo de cobertura por usar solo un canal en línea (minimizado mediante múltiples canales de distribución) y sesgo de no respuesta (evaluado como bajo a partir de la comparación entre respondientes y no respondientes)».
El sesgo de selección es una desviación sistemática de la muestra respecto a la población general debida a errores en el proceso de selección de los encuestados. Surge en la etapa de muestreo y puede distorsionar los resultados de la investigación. Minimizar el sesgo de selección requiere atención a los métodos de selección, a las formas de distribuir las encuestas, a la tasa de respuesta y al análisis de los no respondientes: solo así se puede obtener una muestra representativa y resultados fiables.
Publicado: 31 may. 2026
Mike Taylor