Escala (escala de valoración)
31 may. 2026 Tiempo de lectura ≈ 9 min
Una situación familiar: abres una encuesta y ves la pregunta «Califica la calidad del servicio del 1 al 5». Pones un 4, porque «en general estuvo bien, pero no perfecto».
Tu colega también pone un 4, pero en su mente significa «casi todo estuvo mal, solo doy un 5 a lo perfecto». El mismo número, un significado completamente distinto. ¿Cómo ocurrió esto? Todo se reduce a la escala, o más exactamente, al hecho de que la escala se eligió con descuido: sin etiquetas, sin calibración, sin entender qué mide exactamente. Una escala no es solo «una franja del 1 al 5». Es un instrumento de medición, y de su calidad depende que obtengas datos precisos o un conjunto de números aleatorios.
Qué es una escala
Una escala es un sistema de gradaciones mediante el cual un encuestado expresa su evaluación, actitud, grado de acuerdo o la intensidad de un atributo. Una escala traduce la experiencia subjetiva de una persona («me gustó», «estoy más bien en desacuerdo», «muy cómodo») en un valor numérico o categórico apto para el análisis.
Sin escalas, las encuestas constarían solo de preguntas abiertas, y analizar a mano cientos de respuestas de texto libre es lento y poco fiable. Las escalas resuelven este problema: estandarizan las respuestas, las hacen comparables entre sí y aptas para el procesamiento estadístico. Pero la estandarización funciona solo cuando la escala se elige correctamente; de lo contrario, no ayuda, sino que enmascara la imagen real.
Niveles de medición: el fundamento de cualquier escala
Antes de analizar escalas concretas, conviene entender los cuatro niveles de medición: una clasificación propuesta por Stanley Stevens en 1946, y que todavía define las reglas para trabajar con datos.
Escala nominal (Nominal Scale). El nivel más simple: categorías sin orden. «¿Qué navegador usas: Chrome / Firefox / Safari / Otro?». Las categorías se pueden contar (cuántas personas eligieron cada opción), pero no se pueden ordenar por rango: Chrome no es «mayor» ni «mejor» que Firefox en el sentido de una escala. Operaciones permitidas: recuento de frecuencias, moda.
Escala ordinal (Ordinal Scale). Las categorías están ordenadas, pero las distancias entre ellas son desconocidas. «Principiante → Intermedio → Avanzado → Experto». Avanzado es «mayor» que intermedio, pero exactamente en qué medida se desconoce. La brecha entre principiante e intermedio puede ser enorme, mientras que la brecha entre avanzado y experto puede ser mínima. Operaciones permitidas: mediana, correlaciones de rango.
Escala de intervalo (Interval Scale). Las distancias entre las divisiones son iguales, pero el punto cero es arbitrario. El ejemplo clásico es la temperatura en grados Celsius: la diferencia entre 10° y 20° es la misma que entre 20° y 30°, pero 0° no significa «ausencia de temperatura». En las encuestas, la escala de Likert se considera de intervalo (con matices, más sobre esto abajo). Operaciones permitidas: media, desviación estándar.
Escala de razón (Ratio Scale). Como la escala de intervalo, pero con un cero absoluto. Ingresos, edad, número de compras: el cero significa la ausencia del atributo, y «40 años» es exactamente el doble que «20 años». En su forma pura es poco frecuente en las escalas de cuestionario; aparece más a menudo en preguntas cuantitativas («¿Cuántas veces has usado el servicio?»).
El nivel de medición determina qué operaciones matemáticas son admisibles. Calcular una media en una escala nominal (por ejemplo, «el sexo medio es 1,4») es un sinsentido. Calcular una media en una valoración de satisfacción de 5 puntos es discutible, pero se practica de forma generalizada. Comprender estos límites ayuda a no presentar artefactos como conclusiones.
Escalas populares en las encuestas
Escala de Likert (Likert Scale)
La escala más extendida en el mundo de las encuestas. Al encuestado se le presenta una afirmación y este expresa su grado de acuerdo: «Totalmente en desacuerdo — En desacuerdo — Neutral — De acuerdo — Totalmente de acuerdo». La versión clásica tiene 5 puntos, pero también se usan versiones de 7 puntos y de 4 puntos (sin opción neutral).
Cuándo usarla: medir actitudes, opiniones, grado de satisfacción. Una herramienta universal para encuestas de RR. HH., investigación de mercado y la medición del CSAT.
Trampas: tendencia hacia el centro (los encuestados eligen masivamente «neutral» para no tener que pensar), respuestas socialmente deseables (marcan «de acuerdo» porque parece «más correcto»). Lee más sobre las propiedades de esta escala en el artículo Likert Scale.
Escala de valoración numérica (Numeric Rating Scale)
«Califica del 0 al 10» o «del 1 al 5». El encuestado pone un número. Visualmente puede presentarse como una fila de cifras, un control deslizante o estrellas.
Cuándo usarla: cuando se necesita una medición numérica rápida. La métrica NPS se basa en una escala numérica de 11 puntos (0–10). La valoración con estrellas en el CSAT se basa en una escala de 5 puntos.
Trampas: sin etiquetas para los valores, los encuestados interpretan la escala de forma diferente. Para una persona «7 de 10» es bueno, para otra es mediocre. Etiqueta siempre los puntos extremos («1 = Muy malo», «5 = Excelente») y, en el caso ideal, cada punto.
Diferencial semántico (Semantic Differential)
Dos polos opuestos con una escala entre ellos. «Caro ——— Barato», «Moderno ——— Anticuado», «Amable ——— Frío». El encuestado marca su posición en este espectro.
Cuándo usarlo: evaluar la percepción de marcas, productos, interfaces. Funciona bien para comparar varios objetos según los mismos parámetros. Las escalas UEQ y SUS para evaluar la usabilidad son parientes cercanos del diferencial semántico.
Trampas: la formulación de los polos debe ser realmente opuesta. «Rápido — Poco fiable» no son antónimos, y una escala así inducirá a error a los encuestados.
Escala visual analógica (Visual Analogue Scale, VAS)
Una línea continua sin divisiones: el encuestado coloca una marca en cualquier punto de ella. La línea suele medir 100 mm, lo que permite convertir la posición de la marca en un número del 0 al 100. Se usa en investigación médica (evaluación del dolor), psicología y pruebas de UX. Lee más en el artículo VAS.
Escala de Guttman (Guttman Scale)
Un conjunto de afirmaciones ordenadas por dificultad o intensidad creciente. Si un encuestado está de acuerdo con una afirmación «más fuerte», se da por hecho que también está de acuerdo con todas las anteriores. Ejemplo: «Uso la aplicación una vez al mes» → «Uso la aplicación una vez a la semana» → «La uso todos los días» → «Recomiendo la aplicación a mis amigos». Lee más en el artículo Guttman Scale.
Cuántos puntos en una escala son óptimos
La eterna pregunta: ¿5, 7, 10 o algo distinto? No hay una respuesta única, pero sí hay orientaciones.
Menos de 4 puntos es demasiado tosco. Una escala binaria («Sí / No») no capta los matices. Una escala de 3 puntos («Malo / Normal / Bueno») pierde la mayor parte de la información. Solo es adecuada para las mediciones más simples.
5 puntos es lo clásico. Suficiente granularidad para la mayoría de las tareas, sin sobrecargar al encuestado. El estándar para el CSAT, el CES y las valoraciones generales de satisfacción.
7 puntos es un poco más preciso que 5, especialmente para la investigación académica y la medición de actitudes. Los estudios muestran que una escala de 7 puntos da resultados más fiables que una de 5, pero la diferencia es pequeña.
10–11 puntos es una granularidad alta. El NPS usa una escala de 0 a 10. La ventaja: mayor variabilidad de las respuestas. El inconveniente: al encuestado le cuesta más distinguir «6» de «7», y la elección se vuelve menos consciente.
Número par vs. impar de puntos. Un número impar de puntos (5, 7) admite una posición neutral: el encuestado puede «escabullirse». Un número par (4, 6) lo obliga a tomar partido. Si te importa obtener una respuesta definida, usa un número par. Si quieres conceder el derecho a la neutralidad, usa uno impar.
Recomendaciones prácticas para trabajar con escalas
Etiqueta cada punto. «1 — 2 — 3 — 4 — 5» sin explicaciones es adivinar con números. «1 = Totalmente en desacuerdo, 2 = Más bien en desacuerdo, 3 = Neutral, 4 = Más bien de acuerdo, 5 = Totalmente de acuerdo» es medición. Las etiquetas reducen la dispersión de las interpretaciones y aumentan la fiabilidad de los datos.
Usa una sola escala para un bloque de preguntas. Si en un bloque de 10 preguntas las tres primeras usan una escala de 5 puntos, las dos siguientes una de 7 puntos y las últimas cinco una de 10 puntos, el encuestado se confundirá y los datos serán incomparables. La uniformidad es la clave de unos resultados limpios.
Evita las etiquetas ambiguas. «Satisfactorio» significa «aceptable» para unos y «apenas suficiente» para otros. Cuanto más concreta sea la formulación, menor será la dispersión. «Me gustó todo» es más preciso que «Bueno».
Ten en cuenta el contexto cultural. En algunas culturas, las valoraciones extremas (1 y 5) se dan rara vez: se consideran «descorteses» o «categóricas». En otras, por el contrario, los valores intermedios son poco populares. Si tu público es internacional, prueba la escala en distintos grupos.
Añade una opción «No puedo valorar» / «No aplica». Si un encuestado no ha usado una función, obligarlo a dar una valoración no tiene sentido. Pondrá un número aleatorio que contaminará los datos. Una opción «N/A» filtra las respuestas irrelevantes y deja las medias más limpias.
Escalas en SurveyNinja
En el creador de SurveyNinja están disponibles todos los tipos principales de escalas.
Valoración con estrellas y números. Una escala configurable del 1 a N: estrellas, números, emojis. Las etiquetas para cada valor son opcionales. Adecuada para valoraciones rápidas de satisfacción y para el CSAT.
Control deslizante (Slider). Una escala continua con un rango y un paso configurables. El encuestado arrastra un marcador: visualmente recuerda a una VAS, pero con un valor numérico. Cómodo para preguntas del tipo «¿Qué probabilidad hay de que nos recomiendes?».
Matriz. Varias afirmaciones con la misma escala, reunidas en una tabla. Ahorra espacio en pantalla y agiliza la cumplimentación. Ideal para bloques de escalas de Likert. Lee más sobre la configuración de las preguntas en el artículo de ayuda sobre elementos.
Pregunta NPS. Un elemento listo para usar con una escala de 0 a 10, división automática en promotores, pasivos y detractores, y el cálculo del índice en la analítica.
Una escala no es una decoración del cuestionario, sino su instrumento de medición. Una escala mala produce datos que parecen convincentes pero que no significan nada. Una buena convierte las sensaciones subjetivas de los encuestados en números en los que se puede confiar. Elige la escala antes de redactar las preguntas, etiqueta cada punto y no cambies la escala en mitad del cuestionario.
Publicado: 31 may. 2026
Mike Taylor