Correspondencias simple |
Top Previous Next |
El análisis de correspondencias, caso especial del análisis de componentes principales, se puede considerar como una técnica reductiva donde el objetivo del investigador es reconocer las relaciones entre dos conjuntos de categorías. A diferencia del análisis factorial de componentes principales, el análisis de correspondencias trata de “analizar las formas que adoptan las relaciones entre las variables”. Se busca realizar un análisis geométrico de las relaciones, de ahí la importancia que en este análisis tiene la representación gráfica, típicamente conocida como mapa de posicionamiento o mapping de atributos y marcas. Muy utilizado en la práctica para representar mapas de posicionamiento (mapping) de elementos cruzados para realizar análisis de asociación. El típico ejemplo de marcas / atributos con la presencia del ideal, puede ser resuelto con este análisis. Uno de sus puntos fuertes, es la posibilidad de realizarlo a partir de datos elaborados, es decir, a partir de una matriz creada ad-hoc para ello. El caso que presentamos es de este tipo. El análisis de correspondencias no es una técnica muy exigente con las propiedades estadísticas que deben cumplir los datos. El uso de variables cualitativas, particularmente escalas nominales en su forma más simple (tablas de contingencia) hace que sea igualmente adecuado para establecer relaciones lineales como no lineales. El hecho de que no haya que tener precauciones con las hipótesis estadísticas, no quiere decir que no haya que ser cuidadoso con otras consideraciones. Fundamentalmente, hay que asegurarse de que los poseedores de los atributos son comparables respecto a esos atributos. (Aldás, 2000) El análisis permite representar simultáneamente dos conjuntos de variables en un mismo espacio tratando de representar la mayor parte de la información contenida en una matriz de números positivos, “para ello se fija no en los valores absolutos, sino en las correspondencias entre las características, es decir, en los valores relativos” (Pedret, Sagnier y Camps, 2000). El análisis de correspondencias se basa en una transformación de la prueba c. En esencia, esta prueba plantea la hipótesis nula de que la distribución de las frecuencias en la tabla de contingencia es homogénea, es decir, que no hay marcas que hayan recibido una mayor cantidad de asociaciones con un atributo determinado que otros, siendo una variable independiente de la otra. Si esta hipótesis nula pudiera rechazarse, se disponen de diversas medidas que permiten cuantificar el grado de dependencia. Podemos rechazar la hipótesis nula, de tal forma que afirmamos la existencia de unas marcas más identificadas con unos atributos que otras, por lo que tiene sentido intentar analizar en qué consisten las similitudes y diferencias de las categorías de unas variables respecto a otras.
Proceso de cálculoEste análisis se puede realizar a partir de tablas de contingencia calculadas a partir de una matriz de individuos por variables (típico fichero de entrevistas) con datos en frecuencias o también a partir de porcentajes, sumas y medias. En este caso, en el diálogo correspondiente al análisis de correspondencias, deberemos señalizar que variable/s pasan a ser categorías de columna, y cuáles pasan a ser categorías de fila. En principio si trabajamos con frecuencias o porcentajes es indiferente, pero si trabajamos con medias o sumas, las variables métricas de las que se calcula el estadístico deben ser situadas en filas.
También se puede realizar el análisis a partir de una entrada especial que sea una tabla de contingencia introducida como fichero de datos. Esta es la forma más sencilla de trabajo. El fichero de datos constará de una primera variable de tipo alfanumérico donde se escribirán los atributos o las marcas, y una serie de variables métricas que se corresponderán con las marcas / atributos analizados. Pongamos en práctica un ejemplo y comentemos sus resultados. Fichero Datos para correspondencias simple.gbw Órdenes Análisis-> Reducción de datos-> Correspondencias simple-> Clic sobre Fichero Actual-> Aceptar X1 Aquarius X2 Aquarius New X3 Aquarius Classic X4 Gatorade Classic X5 Gatorade Lemmon X6 Sprite Sport X7 Upgrade X8 Upgrade Lemmon X9 Upgrade Orange Matriz de entrada de la tabla de contingencia El primer resultado que se obtiene tras el cálculo, está relacionado con el objetivo principal de la técnica. Al ser una técnica con carácter reduccional, el objetivo es reducir las dimensiones de forma que se pueda explicar el máximo de la información original en unas nuevas dimensiones, sin perder excesiva información. En esta primera tabla, se muestra los valores propios que deben ser entendidos como magnitudes indicadoras del poder explicativo de cada una de las nuevas dimensiones en las que se estructuran los datos. Valores propios y porcentaje de varianza
Las dos columnas restantes muestran un indicador de la proporción de varianza que explica cada una de las dimensiones. La varianza explicada es la proporción de valor propio sobre el conjunto de información explicada y la varianza acumulada nos muestra el nivel máximo de información que explicamos. El número de dimensiones que el análisis calcula está relacionado con el mínimo de filas o columnas que tenga la tabla de contingencia restando una unidad. Si la matriz de entrada tiene J filas y K columnas, el número de dimensiones del análisis será como máximo el mínimo [(J, K)-1]. Al igual que en el análisis de componentes principales, existen varios criterios para determinar cuál es el número óptimo de dimensiones, pero habitualmente se trabaja con aquellas dimensiones que al menos alcancen la unidad (criterio de Káiser-Gutmann) en el valor propio. En nuestro ejemplo podemos observar como a partir de la tercera dimensión cae mucho el valor propio y, por tanto, la varianza explicada. La segunda tabla de información que aparece, tiene por objetivo mostrar la varianza explicada, pero desde una perspectiva marginal, mediante las aportaciones de cada una de las categorías de fila / columna que intervienen en el análisis. Esta tabla nos muestra de forma conjunta las contribuciones absolutas y las relativas para cada una de las categorías en el análisis. Contribuciones a la formación de los ejes por las filas
Contribuciones a la formación de los ejes por las columnas
Llamamos contribución absoluta de un elemento a la influencia que una categoría ha tenido en la formación de la dimensión factorial. Para cada agrupación categorías de fila y categorías de columna la suma de las cargas es 100 (en vertical). Calidad de representación de las categorías por las filas
Calidad de representación de las categorías por las filas
Llamamos contribución relativa de un elemento a la influencia o índice de calidad de cada una de las categorías fila o columna en la dimensión factorial, es decir, la calidad de representación de la categoría en la dimensión. En la mayoría de las ocasiones sucede que una carga importante de una categoría sobre la formación de eje, es complementada con una muy buena calidad de representación en las dimensiones factoriales analizadas, pero no siempre suele suceder a la inversa. Masa y distancia en el análisis de correspondencias
La siguiente tabla que aparece nos muestra tres indicadores relacionados con la ulterior representación gráfica:
Coordenadas en el mapa de correspondencias
Por último, se presenta el mapa cartesiano utilizando las dos dimensiones principales. Mapa de posicionamiento A diferencia de lo que sucede en el análisis de componentes principales, en el análisis de correspondencias si que se puede realizar un análisis de la proximidad entre las categorías de fila y/o columna en el mapa. Siguiendo a Pedret, Sagnier y Camps (2000):
|