Correlación de Pearson

Top  Previous  Next

El coeficiente de correlación de Pearson es un índice de asociación que acapara la mayor cantidad de los análisis de covariación y su importancia es si cabe mayor, si se piensa que es la base para el cálculo de los puntos de partida del análisis multivariante con variables cuantitativas (Manzano, 1995:167). Este índice nos indica si existe relación entre las variables analizadas, cuantifica esa relación y el signo del coeficiente muestra la dirección de la misma.

Ante una relación de proporción entre dos escalas de intervalo o métricas, se pueden dar tres situaciones:

Puntuaciones altas en la variable 1, si conducen a puntuaciones altas en la variable 2, nos llevarán a afirmar que existe una relación directa entre las variables analizadas. En este caso, el coeficiente de correlación de Pearson sería próximo a 1 (tanto más cuánto mayor sea la relación) y positivo.
Podría suceder también que puntuaciones altas en la variable 1 nos llevaran a puntuaciones bajas en la variable 2. Esto nos indicaría que ambas poseen una correlación en sentido inverso con valores del coeficiente próximos a - 1.
Si puntuaciones altas en la variable 1, en ocasiones conllevan puntuaciones altas en la variable 2, y en otras ocasiones puntuaciones bajas, obtendremos un valor de Pearson bajo, próximo a 0 mucho más que a los extremos 1 y - 1, indicando que no existe relación o que si la hubiere es puramente aleatoria.

En estas tres proposiciones cabe dejar presente la necesidad que las variables presenten una relación lineal y una escala de medición al menos de intervalo, aunque lo habitual es la presencia de escalas de medición de razón.

Requisitos de aplicación

Debemos ser cautos y precisos en la aplicación de este estadístico, pues la relación que mide es únicamente lineal, “cuanto más diste el tipo de relación de la lineal, menos apropiado es r para medir la relación” (Manzano, 1995:183). Es muy aconsejable realizar gráficos de dispersión que nos ayuden a ver si esa relación es o no es lineal.

Además ya que trabajamos con parejas de variables se debe tener en cuenta los supuestos de normalidad y igual dispersión, en el contexto de una relación bivariante.

Proceso de cálculo

Fichero        Correlación de Pearson.gbw

Órdenes        Análisis - > Correlación de Pearson - > Seleccionar P1 como variable 1 y P2 como variable 2

Imaginemos la siguiente tabla de valores, donde se relacionan dos calificaciones individuales a sendos componentes de un tercer indicador que es la calidad de servicio. Queremos analizar si existe relación entre las dos puntuaciones que explican una tercera, pero sin tener en cuenta esta última variable.

Individuo

Puntuación 1

Puntuación 2

Calidad de servicio

1

31

35

120

2

25

15

112

3

19

21

110

4

24

23

120

5

17

17

103

6

28

30

126

7

18

19

113

8

20

25

114

9

16

16

106

10

15

20

108

11

27

23

128

12

19

10

109

Aplicando r de Pearson obtenemos que...

Correlación de Pearson,

P1 - P2

Coeficiente

0.69

G.L.

10

Valor t

2.98

Significación

0.006762

Casos

12

Partiendo de la hipótesis nula de que en la población la correlación es nula, podremos calcular la probabilidad de que esto no sea así. Como en todos los casos nuestro objetivo será rechazar la hipótesis nula, concluyendo, por tanto, que la hipótesis alternativa es la correcta, y ésta implica la existencia de correlación significativa. En nuestro ejemplo al ser la significación <0,05 (0,006762) debemos rechazar la hipótesis nula, asegurando por tanto que existe correlación en la población de las cuales se derivan los datos.