Pruebas de usabilidad
31 may. 2026 Tiempo de lectura ≈ 7 min
Un usuario busca el botón "Realizar pedido" durante tres minutos, hace clic en el lugar equivocado y murmura "¿dónde está?". Las pruebas de usabilidad son un método para evaluar una interfaz observando a usuarios reales mientras completan tareas.
No es una encuesta que pregunta "¿es cómodo?" - es "observar lo que la gente hace de verdad". Saca a la luz problemas concretos: navegación confusa, formularios enredados, acciones poco obvias. Los resultados son insights cualitativos y métricas (tasa de éxito de tareas, tiempo por tarea). Se relaciona con la experiencia del cliente (CX) y con la investigación cualitativa. Con SurveyNinja puedes lanzar encuestas después de una sesión de usabilidad (SEQ, SUS) o recoger feedback en un formato remoto y asíncrono. Más sobre el UX en la investigación más abajo.
Una prueba de usabilidad no es un grupo focal. No preguntas "¿te gusta el diseño?" - entregas una tarea y observas si la gente puede hacerla.
Definición
Las pruebas de usabilidad son un método para evaluar cuán usable es una interfaz observando a los usuarios mientras realizan tareas típicas. Los participantes reciben escenarios ("realiza un pedido", "encuentra el artículo sobre el envío") y el investigador registra: si completaron la tarea, dónde tropezaron, cuánto tardaron, qué dijeron. El objetivo es detectar problemas de usabilidad antes de un lanzamiento masivo. Métricas: tasa de éxito de tareas (la proporción que completó), tiempo por tarea, número de errores. Se complementa con encuestas: SUS, SEQ. Se relaciona con el feedback - los comentarios cualitativos de los participantes.
En resumen: "usuario + tarea + observación" - observas dónde se rompe el escenario.
Pruebas moderadas y no moderadas
Moderada. El investigador está presente (en persona o por video): entrega tareas, hace preguntas aclaratorias y pide al participante que "piense en voz alta". Profundiza más - se ve la vacilación y las expresiones faciales y se puede indagar en los problemas. Cuesta más tiempo.
No moderada (asíncrona). El participante completa las tareas por su cuenta mientras se guarda una grabación de pantalla y voz. Es escalable - puedes lanzar 50 pruebas en paralelo. Hay menos contexto - no hay forma de preguntar "¿por qué hiciste clic aquí?". Sirve para tareas simples y feedback rápido.
La elección depende de las tareas: un escenario complejo o un prototipo suele ser moderado. Una verificación simple de pantallas o una muestra grande es no moderada.
Cuántos participantes necesitas
Jakob Nielsen: 5 usuarios sacan a la luz el 85% de los problemas. En la práctica, 5-8 por iteración basta para encontrar los principales puntos de dolor. Más que eso entra en rendimientos decrecientes - los nuevos insights son raros. Si los segmentos difieren (novatos vs expertos, móvil vs escritorio), usa 5 por segmento. Un enfoque iterativo - probar, luego refinar, luego probar - es más eficaz que una sola prueba "grande" con 30 personas.
Cómo realizar una prueba de usabilidad
Tareas. Escenarios concretos: "Encuentra el coste de envío a Moscú", "Realiza un pedido de 20 $", "Cancela la suscripción". No "mira el sitio" - una acción con un criterio de éxito claro.
Pensar en voz alta. Pide al participante que exprese sus pensamientos: "Estoy buscando el botón de pago... no lo veo... ¿quizás aquí?" - escuchas la lógica y las dudas. No le des pistas hasta que termine la tarea o se atasque.
Registro. Anota: completada/no completada, tiempo, dónde se equivocó, citas. Una escala posterior a la tarea - SEQ "¿Qué tan fácil fue?" - da una instantánea numérica. Un cuestionario posterior a la sesión - SUS, preguntas abiertas - complementa la observación.
Encuestados. Usuarios reales o un grupo cercano a tu público objetivo. No colegas - ellos conocen el producto. El muestreo por conveniencia es aceptable para la usabilidad: importa más la profundidad que la representatividad.
Métricas de la prueba de usabilidad
Tasa de éxito de tareas. La proporción de participantes que completó la tarea. 8 de 10 es 80%. Una tasa baja es un problema en el escenario.
Tiempo por tarea. Cuántos segundos/minutos hasta completarla. Compáralo con un punto de referencia o entre versiones de la interfaz.
Errores. El número de clics equivocados, callejones sin salida y fracasos antes del éxito. Un análisis cualitativo muestra exactamente dónde se equivocó la gente.
SEQ, SUS. Una valoración subjetiva después de una tarea o una sesión. Combínala con métricas objetivas: "lo hizo rápido pero lo valoró como difícil" es señal de un problema oculto.
Relación con el UX y las encuestas
La experiencia de usuario (UX) es un concepto amplio, y una prueba de usabilidad es una de las herramientas para medirla. La prueba te da el "qué está mal" y el "por qué", mientras que las encuestas (NPS, SUS) te dan el "cuán mal" a escala. Combínalas: una prueba con 8 personas saca a la luz los problemas, una encuesta con 200 confirma lo extendidos que están. Las personas (personas de usuario) ayudan a reclutar participantes relevantes.
Errores típicos
Dar pistas. "El botón está arriba a la derecha" - eso mata el valor de la prueba. Espera a que el participante lo intente por su cuenta. Da una pista solo si lleva atascado más de 2-3 minutos - y regístralo como un problema.
Tareas complejas o poco concretas. "Valora qué tan cómodo es el sitio" no es una tarea. "Encuentra cómo hacer una devolución" es una tarea con un éxito claro.
Probar con colegas. Ellos conocen la estructura del producto. Los resultados no reflejan a los usuarios reales.
Ignorar la versión móvil. El UX en el teléfono y en el escritorio es distinto. Usa pruebas separadas o tareas separadas por dispositivo.
Encuestas tras la sesión en SurveyNinja
Después de cada sesión - una encuesta corta: SEQ por cada tarea, SUS al final, una abierta "¿Qué no quedó claro?". En SurveyNinja, crea una encuesta con lógica: un bloque para la tarea 1, otro para la tarea 2. Envías el enlace al participante después de la sesión o haces que lo complete de inmediato. La exportación es un resumen de las valoraciones subjetivas. Para pruebas no moderadas: la encuesta va integrada en la plataforma (si lo admite) o es un enlace aparte tras finalizar. Las variables ocultas - la versión del prototipo, el segmento del participante - permiten comparar cohortes.
Cuándo realizar una prueba de usabilidad
Antes de un lanzamiento - para verificar escenarios críticos. Tras un rediseño - para comparar "antes/después". Cuando cae la tasa de éxito de tareas o la conversión - para hallar las causas de forma cualitativa. Al añadir una función nueva - para asegurarte de que sea descubrible. De forma regular (una vez por trimestre) - para monitorear la usabilidad de los caminos clave. No reemplaza a las encuestas - la prueba da profundidad, las encuestas dan escala.
Prueba presencial vs remota
Presencial. El participante está en una oficina o un laboratorio. Control total, se ven las señales no verbales. Más cara, menor alcance geográfico.
Remota moderada. Zoom, Teams, grabación de pantalla. Mayor geografía, más barata. La calidad de la conexión afecta cómo se desarrolla.
Remota no moderada. Plataformas como Maze o UserTesting. El participante realiza las tareas por sí mismo y el sistema graba. Escala, pero menos profundidad. Una encuesta posterior es una forma de recoger la valoración subjetiva.
Caso: prueba de usabilidad de un formulario de registro
Un servicio de suscripciones. El registro tenía 4 pasos, 12 campos. Analítica: el 70% abandona en el paso 2. Prueba de usabilidad: 8 participantes, tarea "regístrate y contrata una suscripción". Resultado: 5 de 8 la completaron, 3 se atascaron en el campo "tipo de organización" - no entendían qué elegir. Dos se fueron en el paso 2 por el teléfono obligatorio - "no quiero darlo". La solución: el desplegable "tipo de organización" se reemplazó por una pista y el teléfono se hizo opcional. La nueva prueba - 8 de 8. Un mes después, la tasa de éxito del registro en producción subió del 30% al 45%. La prueba señaló campos concretos, no solo "el formulario es largo" en general.
Las pruebas de usabilidad son la observación de los usuarios mientras realizan tareas. Sacan a la luz problemas de la interfaz y aportan métricas de tasa de éxito de tareas y de tiempo. 5-8 participantes bastan para una iteración. Se relacionan con el UX y con las encuestas SUS/SEQ. En SurveyNinja - encuestas tras la sesión para las valoraciones subjetivas.
Publicado: 31 may. 2026
Mike Taylor