Introducción
En la investigación de mercados, una de las preguntas más comunes y útiles es la de respuesta múltiple: “¿Qué marcas de coches conoces, aunque solo sea de oídas?”, “¿Qué redes sociales has utilizado en el último mes?”, “¿Qué características son más importantes para ti al comprar un portátil?”. Estas preguntas proporcionan datos increíblemente ricos sobre el comportamiento y las percepciones del consumidor.
Sin embargo, para muchos analistas que se inician en SPSS, estos datos presentan un desafío. A diferencia de una variable categórica simple (como el género) o una continua (como la edad), los datos de respuesta múltiple no se pueden analizar directamente con los procedimientos estándar de Frecuencias o Tablas de Contingencia. Si lo intentas, obtendrás una tabla para cada opción de respuesta, perdiendo la visión de conjunto.
La solución reside en una de las funcionalidades más potentes y específicas de SPSS: los Conjuntos de Respuestas Múltiples. Este post es una guía completa que te enseñará a definir, tabular y, lo más importante, a realizar pruebas de significación avanzadas con estas variables utilizando el módulo de Tablas Personalizadas (Custom Tables).
Los dos tipos de Multi-Respuesta en la base de datos
Antes de empezar a analizar, es crucial entender cómo se almacenan los datos de una pregunta de respuesta múltiple. Existen dos métodos principales, y saber cuál estás utilizando es el primer paso para un análisis correcto.
1. Método de Dicotomía Múltiple (binarias)
Este es el método más común. Se crea una variable separada para cada una de las posibles respuestas a la pregunta. Cada una de estas variables es una “dicotomía”, generalmente con valores 1 (seleccionado) y 0 (no seleccionado).
- Pregunta de Encuesta: “¿Qué servicios de streaming utilizas? (Marca todos los que apliquen)”
- Estructura de Datos en SPSS:
streaming_netflix(1=Sí, 0=No)streaming_hbo(1=Sí, 0=No)streaming_amazon(1=Sí, 0=No)streaming_disney(1=Sí, 0=No)
2. Método de Categoría Múltiple (menciones)
Este método se utiliza cuando se le pide al encuestado que dé un número limitado de respuestas (ej. “Menciona tus 3 marcas favoritas”). Los datos se almacenan en un número de variables igual al máximo de respuestas permitidas.
- Pregunta de Encuesta: “Por favor, menciona hasta 3 marcas de refrescos que hayas consumido en el último mes.”
- Estructura de Datos en SPSS:
mencion_1(con códigos de marca, ej. 1=Coca-Cola, 2=Pepsi)mencion_2(con los mismos códigos de marca)mencion_3(con los mismos códigos de marca)
Definir un Conjunto de Respuestas Múltiples en SPSS
SPSS no sabe de forma nativa que streaming_netflix y streaming_hbo pertenecen a la misma pregunta. Debes decírselo explícitamente creando un “Conjunto de Respuestas Múltiples”. Este es un objeto virtual que agrupa las variables para que puedan ser analizadas conjuntamente.
El proceso es el siguiente:
- Ve al menú: Analizar > Respuesta Múltiple > Definir Conjuntos de Variables…
- Selecciona las variables que componen tu pregunta (ej.
streaming_netflixhastastreaming_disney) y pásalas a la caja “Variables en el conjunto”. - Indica el tipo de codificación:
- Para el Método de Dicotomía, selecciona “Las variables están codificadas como” y en “Valor contado” escribe el valor que indica la selección (normalmente
1). - Para el Método de Categoría, selecciona “Categorías” e indica el rango de códigos que representan las respuestas (ej. Mínimo
1, Máximo15).
- Para el Método de Dicotomía, selecciona “Las variables están codificadas como” y en “Valor contado” escribe el valor que indica la selección (normalmente
- Asigna un Nombre al nuevo conjunto (ej.
$Streaming). SPSS añade el$por defecto para distinguirlo de las variables normales. - Asigna una Etiqueta descriptiva (ej. “Servicios de Streaming Utilizados”).
- Haz clic en “Añadir” y luego en “Cerrar”.
Has creado el conjunto de respuestas múltiples. Ahora puedes usarlo en los procedimientos de análisis.
Análisis Avanzado con Tablas Personalizadas (Custom Tables)
Aunque el menú Analizar > Respuesta Múltiple ofrece análisis básicos de Frecuencias y Tablas de Contingencia, el verdadero poder reside en el módulo de Tablas Personalizadas (Analizar > Tablas > Tablas personalizadas...). Este módulo ofrece una flexibilidad total y, lo más importante, pruebas de significación robustas.
Al abrir el constructor de tablas, verás tu nuevo conjunto ($Streaming) en la lista de variables. Simplemente arrástralo a las Filas o Columnas para empezar a analizar. Si no aparece, puedes crearlo de nuevo desde este mismo diálogo.
Una tabla básica de un conjunto de respuestas múltiples mostrará dos tipos de porcentajes, y es vital entender la diferencia:
- % de Respuestas: El denominador es el número total de menciones. Es útil para ver la distribución de popularidad entre las opciones.
- % de Casos: El denominador es el número total de encuestados. Es la métrica más importante, ya que te dice el “reach” o penetración de cada opción en tu muestra.
El Poder de la Inferencia: Pruebas de Significación en Tablas Personalizadas
Aquí es donde se separa un análisis descriptivo de un análisis inferencial. Veamos cómo realizar las pruebas clave.
1. Prueba Chi-Cuadrado de Independencia
- Pregunta de Negocio: “¿La notoriedad de nuestras marcas (
$MarcasConocidas) está relacionada con elGrupo_Edaddel consumidor?” - Cómo hacerlo en Tablas Personalizadas:
- Arrastra el conjunto
$MarcasConocidasa las Filas. - Arrastra la variable
Grupo_Edada las Columnas. - Haz clic en la pestaña “Estadísticos de prueba”.
- Marca la casilla “Prueba de independencia (chi-cuadrado)”.
- Haz clic en “Aceptar”.
- Arrastra el conjunto
- Interpretación: En la tabla de resultados, SPSS mostrará una prueba de Chi-cuadrado global. Si el p-valor (
Sig. asintótica) es menor que 0.05, puedes concluir que existe una asociación general entre el conocimiento de marca y la edad. Esto te dice que hay “algo”, pero no dónde está la diferencia específica. Para eso, se necesita la siguiente prueba.
2. Prueba Z de Proporciones en Columnas
- Pregunta de Negocio: “Ya sé que hay una relación entre notoriedad y edad, pero, ¿qué marcas específicas son significativamente más conocidas por los ‘Jóvenes’ en comparación con los ‘Adultos’?”
- Cómo hacerlo en Tablas Personalizadas:
- Construye la misma tabla que en el punto anterior.
- Haz clic en la pestaña “Estadísticos de prueba”.
- Marca la casilla “Comparar proporciones de columna (pruebas z)”.
- Asegúrate de que el nivel de significación está en 0.05.
- Haz clic en “Aceptar”.
- Interpretación: La tabla de resultados ahora tendrá unas pequeñas letras (A, B, C…) debajo de cada columna para identificar los grupos. En el cuerpo de la tabla, junto a los porcentajes, aparecerán estas mismas letras. Si un porcentaje en la columna A tiene una letra ‘B’ al lado, significa que ese porcentaje es estadísticamente más alto que el porcentaje correspondiente en la columna B. Esta es la prueba post-hoc que permite identificar las diferencias específicas y significativas entre los grupos.
3. Prueba T de Medias en Columnas
- Pregunta de Negocio: “¿La media de
Gasto_Mensuales significativamente diferente entre los clientes que utilizanNetflixy los que utilizanHBO?” - Cómo hacerlo en Tablas Personalizadas:
- Arrastra el conjunto de respuestas múltiples (ej.
$Streaming) a las Columnas. - Arrastra la variable continua (ej.
Gasto_Mensual) a las Filas. - SPSS por defecto mostrará la Media de
Gasto_Mensualpara cada servicio. Si no, haz clic enGasto_Mensualen el lienzo de la tabla y en “Estadísticos de resumen” selecciona “Media”. - Ve a la pestaña “Estadísticos de prueba”.
- Marca la casilla “Comparar medias de columna (pruebas t)”.
- Haz clic en “Aceptar”.
- Arrastra el conjunto de respuestas múltiples (ej.
- Interpretación: La lógica es idéntica a la prueba Z de proporciones, pero aplicada a las medias. Si la media de gasto de los usuarios de Netflix (Columna A) tiene una letra ‘B’ al lado, significa que su gasto medio es estadísticamente superior al de los usuarios de HBO (Columna B).
Conclusión
Las variables de respuesta múltiple, lejos de ser una complicación, son una fuente de insights increíblemente rica cuando se tratan correctamente. El proceso en SPSS es sencillo una vez que se domina la lógica: primero, definir el conjunto de respuestas múltiples; segundo, utilizar el módulo de Tablas Personalizadas para el análisis.
Al combinar la flexibilidad de las tablas personalizadas con el rigor de las pruebas de significación Chi-cuadrado, Z y T, puedes transformar una simple pregunta de “marca todas las que apliquen” en una historia de datos completa, identificando no solo “qué” responden los clientes, sino también “quiénes” son y “cómo” se diferencian de forma estadísticamente significativa.
Referencias
Field, A. (2018). Discovering statistics using IBM SPSS statistics (5th ed.). Sage publications.
IBM Corp. (2021). IBM SPSS Custom Tables 28. IBM Corporation. Recuperado de https://www.ibm.com/docs/en/spss-statistics/28.0.0?topic=tables-custom-28
IBM Corp. (2021). IBM SPSS Statistics 28 Brief Guide. IBM Corporation. Recuperado de https://www.ibm.com/docs/en/spss-statistics/28.0.0?topic=guide-brief
Levesque, R., & Programming and Data Management for IBM SPSS Statistics. (2007). SPSS Programming and Data Management: A Guide for SPSS and SAS Users, 4th Edition. SPSS Inc.
Pallant, J. (2020). SPSS survival manual: A step by step guide to data analysis using IBM SPSS (7th ed.). Routledge.
Wagner, W. E. (2019). Using IBM® SPSS® Statistics for Research Methods and Social Science Statistics (7th ed.). Sage Publications.