Segmentación aid

Top  Previous  Next

Analicemos la segmentación AID con un sencillo ejemplo. Supongamos que tenemos una variable que recoge el consumo real de leche en litros semanales, y disponemos de los datos de clasificación de los individuos que han producido esas informaciones. Como investigadores, tenemos una idea de que la EDAD puede ser la variable que más discrimine en el consumo de leche. Bajo esta hipótesis, intentamos verificar que es así. Utilizamos la segmentación AID, ya que la variable a explicar es métrica, mientras que las variables explicativas son cualitativas, los datos de clasificación.

clip0299

clip0301

Fichero                Datos para segmentación.gbw

Órdenes                Análisis > Clasificación > Segmentación > AID

Variable Dependiente        C1

Independientes        SEXO, EDAD, ESTADO, ESTUDIOS y HABITAT

1 partición                -

Códigos consecutivos        EDAD

Opciones                Mostramos árbol y creamos variable con segmento

Datos de cálculo

Número de casos mínimo 30
Máximo valor de significación 0,05
Variable/s dependiente/s C1 Variables independientes SEXO EDAD con particiones de un sólo código ESTADO TAM_FAM STATUS HABITAT

La primera salida producida es una tabla que nos proporciona la información básica de la variable dependiente y sus mediciones (media de consumo de leche total y casos en el archivo). Podemos apreciar que cada fila de la tabla nos está dando la información de dos grupos, las dicotomías generadas intra variable. A cada dicotomía se imputa su media de consumo, y sobre estas medias se realiza una prueba F que arroja una significación. Nuestro objetivo es localizar aquella significación más baja (la más próxima a 0) que nos estará indicando que la dicotomía que la posee es la más discriminante respecto a la medición (consumo de leche) realizada.

clip0304

En nuestra salida estamos combinando la salida de texto que se muestra en el fichero de resultados con la salida gráfica que se muestra en una ventana de resultados. Para obtener las tablas que mostramos, tan solo debemos hacer doble clic en el segmento del que deseamos conocer la tabla.

Si sobre el gráfico de cuadros, hacemos doble clic en el segmento superior, el cuadro situado más arriba, obtenemos la siguiente tabla...

clip0302

clip0303

La información obtenida es la siguiente:

Particiones, grupos de test utilizados para la realización de los análisis de varianza
Casos, nº de casos de cada grupo
Media, media de cada grupo en la variable dependiente o a explicar
Prueba F, valor de la prueba o contraste realizado con el ANOVA
Significación del valor de F

Podemos observar que en esta tabla, está marcada aquella dicotomía con la significación más baja. esta dicotomía es en nuestro ejemplo el grupo de edad de más de 55 años, comparado con el resto de grupos. Mientras que los mayores tienen un consumo de 2,3 litros de leche mensual, mientras que los menores de esa edad, tienen un consumo más elevado que nos lleva a los 3,3 litros mensuales. En la tabla se muestra con un color verde la fila que muestra la menor significación y por tanto la que produce la primera dicotomía, los primeros segmentos.

Si observamos detenidamente el árbol de segmentación, apreciaremos que debajo del primer nivel se crean dos nuevos niveles donde la información se corresponde con las dicotomías generadas. Por un lado se intenta seguir la segmentación con el grupo de los mayores de 55 años. Si hacemos doble clic sobre el segmento de los mayores de 55 años y se obtiene la siguiente tabla...

clip0306

Podemos observar que no hay fila marcada. Es por este motivo que la segmentación no ha seguido por ese camino. El gráfico no continua. Cómo se ha conseguido esta información. La explicación se encuentra en la cabecera de la tabla. Se ha repetido la misma segmentación inicial con todas las variables excepto con EDAD. Para la dicotomía de los mayores de 55 años se ha hecho una selección de estos 52 casos, y nada es discriminante, bien porque no se alcanza el nivel de significación exigido o bien porque el nº de casos de los grupos formados, no alcanza el mínimo exigido en los parámetros iniciales (30 casos).

Sin embargo, si hacemos doble clic sobre el segmento ubicado en el segundo nivel, a la derecha, la tabla obtenida es ésta:

clip0311

Observemos que la siguiente variable más discriminante en este grupo, es el tamaño de la familia: En este caso los resultados parecen no ser muy lógicos, pero conociendo que el consumo es individual y no del hogar, resultará más comprensible. Ahora se generan dos nuevos grupos. Las familias con hasta 2 miembros y las familias con más de 3 miembros. Vuelta a comenzar, realizaremos de nuevo la segmentación ahora con este grupo, que recordemos arrastra la condición del grupo anterior. Este segmento está formado por los grupos de edad de 25 a 55 años y las familia 3 o más miembros (140 casos). AID es un proceso iterativo, y son los parámetros fijados al análisis los que lo van deteniendo.

Hacer mención especial al color amarillo de algún segmento. Esto es debido a que la pantalla es limitada. El color amarillo indica que los caminos seguidos a partir de este segmento, están en otra ventana, de forma que se ven más claramente, puesto que el nivel de aumento de la imagen así lo permite.

Salida en el visor de resultados

Nivel de segmentación 1

Media

3,17

Número de casos

384

Significación

 

Variables independientes

6

Selección

 

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

228/156

3,3/ 3,0

2,4610

0,11322

EDAD
(-25)/(25-35,36-45,46-55,+55)

124/260

3,2/ 3,1

0,3162

0,58138

EDAD
(25-35)/(-25,36-45,46-55,+55)

104/280

3,3/ 3,1

0,8395

0,36313

EDAD
(36-45)/(-25,25-35,46-55,+55)

64/320

3,8/ 3,0

12,2733

0,00065

EDAD
(46-55)/(-25,25-35,36-45,+55)

40/344

2,8/ 3,2

2,5339

0,10797

EDAD
(+55)/(-25,25-35,36-45,46-55)

52/332

2,3/ 3,3

19,3949

0,00003

ESTADO
(soltero)/(pareja,otro)

128/256

3,2/ 3,1

0,1944

0,66370

ESTADO
(pareja)/(soltero,otro)

180/204

3,3/ 3,1

2,2075

0,13391

ESTADO
(otro)/(soltero,pareja)

76/308

2,8/ 3,3

5,7354

0,01634

TAM_FAM
(hasta 2)/(de 3 a 5,más de 5)

208/176

3,4/ 2,9

6,6391

0,01006

TAM_FAM
(de 3 a 5)/(hasta 2,más de 5)

176/208

2,9/ 3,4

6,6391

0,01006

TAM_FAM
(más de 5)/(hasta 2,de 3 a 5)

0/384

*

*

*

STATUS
(alta)/(media alta,media,media baja,baja)

73/311

2,6/ 3,3

13,6133

0,00035

STATUS
(media alta)/(alta,media,media baja,baja)

224/160

3,3/ 3,0

2,1724

0,13709

STATUS
(media)/(alta,media alta,media baja,baja)

73/311

3,5/ 3,1

4,6542

0,02985

STATUS
(media baja)/(alta,media alta,media,baja)

10/374

3,0/ 3,2

0,1217

0,72754

STATUS
(baja)/(alta,media alta,media,media baja)

4/380

2,5/ 3,2

0,7500

0,39122

STATUS
(alta,media alta)/(media,media baja,baja)

297/87

3,1/ 3,4

2,8009

0,09092

STATUS
(alta,media)/(media alta,media baja,baja)

146/238

3,0/ 3,2

1,4389

0,22894

STATUS
(alta,media baja)/(media alta,media,baja)

83/301

2,6/ 3,3

13,3467

0,00040

STATUS
(alta,baja)/(media alta,media,media baja)

77/307

2,6/ 3,3

14,7822

0,00021

STATUS
(alta,media alta,media)/(media baja,baja)

370/14

3,2/ 2,9

0,5861

0,45057

STATUS
(alta,media alta,media baja)/(media,baja)

307/77

3,1/ 3,5

3,5753

0,05625

STATUS
(alta,media alta,baja)/(media,media baja)

301/83

3,1/ 3,5

3,6802

0,05280

STATUS
(media alta,media)/(media baja,baja,alta)

297/87

3,3/ 2,6

14,5271

0,00024

STATUS
(media alta,media baja)/(media,baja,alta)

234/150

3,3/ 3,0

1,8898

0,16620

STATUS
(media alta,baja)/(media,media baja,alta)

228/156

3,3/ 3,0

1,6884

0,19134

HABITAT
(-10.000)/(+10.000)

112/272

3,2/ 3,1

0,1903

0,66692

Nivel de segmentación 1.1

Media

2,31

Número de casos

52

Significación

0,0000

Variables independientes

5

Selección

EDAD=(+55)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

20/32

2,2/ 2,4

0,1285

0,72180

ESTADO
(soltero)/(pareja,otro)

4/48

1,0/ 2,4

2,6528

0,10567

ESTADO
(pareja)/(soltero,otro)

8/44

2,0/ 2,4

0,3062

0,58923

ESTADO
(otro)/(soltero,pareja)

40/12

2,5/ 1,7

2,2785

0,13349

TAM_FAM
(hasta 2)/(de 3 a 5,más de 5)

16/36

1,6/ 2,6

3,9512

0,04966

TAM_FAM
(de 3 a 5)/(hasta 2,más de 5)

36/16

2,6/ 1,6

3,9512

0,04966

TAM_FAM
(más de 5)/(hasta 2,de 3 a 5)

0/52

*

*

*

STATUS
(alta)/(media alta,media,media baja,baja)

22/30

1,8/ 2,7

3,3122

0,07134

STATUS
(media alta)/(alta,media,media baja,baja)

27/25

2,8/ 1,8

5,4446

0,02252

STATUS
(media)/(alta,media alta,media baja,baja)

0/52

*

*

*

STATUS
(media baja)/(alta,media alta,media,baja)

2/50

1,5/ 2,3

0,4656

0,50518

STATUS
(baja)/(alta,media alta,media,media baja)

1/51

1,0/ 2,3

0,5999

0,44818

STATUS
(alta,media alta)/(media,media baja,baja)

49/3

2,4/ 1,3

1,0491

0,31174

STATUS
(alta,media)/(media alta,media baja,baja)

22/30

1,8/ 2,7

3,3122

0,07134

STATUS
(alta,media baja)/(media alta,media,baja)

24/28

1,8/ 2,8

4,3890

0,03910

STATUS
(alta,baja)/(media alta,media,media baja)

23/29

1,8/ 2,7

4,1895

0,04357

STATUS
(alta,media alta,media)/(media baja,baja)

49/3

2,4/ 1,3

1,0491

0,31174

STATUS
(alta,media alta,media baja)/(media,baja)

51/1

2,3/ 1,0

0,5999

0,44818

STATUS
(alta,media alta,baja)/(media,media baja)

50/2

2,3/ 1,5

0,4656

0,50518

STATUS
(media alta,media)/(media baja,baja,alta)

27/25

2,8/ 1,8

5,4446

0,02252

STATUS
(media alta,media baja)/(media,baja,alta)

29/23

2,7/ 1,8

4,1895

0,04357

STATUS
(media alta,baja)/(media,media baja,alta)

28/24

2,8/ 1,8

4,3890

0,03910

HABITAT
(-10.000)/(+10.000)

12/40

2,3/ 2,3

0,0035

0,95169

Nivel de segmentación 1.2

Media

3,30

Número de casos

332

Significación

0,0000

Variables independientes

5

Selección

EDAD=(-25,25-35,36-45,46-55)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

208/124

3,4/ 3,2

1,2622

0,26110

ESTADO
(soltero)/(pareja,otro)

124/208

3,3/ 3,3

0,0172

0,89114

ESTADO
(pareja)/(soltero,otro)

172/160

3,4/ 3,3

0,4096

0,53009

ESTADO
(otro)/(soltero,pareja)

36/296

3,1/ 3,3

0,6799

0,41528

TAM_FAM
(hasta 2)/(de 3 a 5,más de 5)

192/140

3,5/ 3,0

8,0571

0,00488

TAM_FAM
(de 3 a 5)/(hasta 2,más de 5)

140/192

3,0/ 3,5

8,0571

0,00488

TAM_FAM
(más de 5)/(hasta 2,de 3 a 5)

0/332

*

*

*

STATUS
(alta)/(media alta,media,media baja,baja)

51/281

2,9/ 3,4

4,4532

0,03360

STATUS
(media alta)/(alta,media,media baja,baja)

197/135

3,3/ 3,3

0,1446

0,70558

STATUS
(media)/(alta,media alta,media baja,baja)

73/259

3,5/ 3,2

1,9854

0,15576

STATUS
(media baja)/(alta,media alta,media,baja)

8/324

3,4/ 3,3

0,0185

0,88716

STATUS
(baja)/(alta,media alta,media,media baja)

3/329

3,0/ 3,3

0,1263

0,72294

STATUS
(alta,media alta)/(media,media baja,baja)

248/84

3,2/ 3,5

1,7224

0,18693

STATUS
(alta,media)/(media alta,media baja,baja)

124/208

3,3/ 3,3

0,1294

0,71987

STATUS
(alta,media baja)/(media alta,media,baja)

59/273

3,0/ 3,4

3,7384

0,05110

STATUS
(alta,baja)/(media alta,media,media baja)

54/278

2,9/ 3,4

4,6404

0,03019

STATUS
(alta,media alta,media)/(media baja,baja)

321/11

3,3/ 3,3

0,0051

0,94133

STATUS
(alta,media alta,media baja)/(media,baja)

256/76

3,2/ 3,5

1,7114

0,18838

STATUS
(alta,media alta,baja)/(media,media baja)

251/81

3,2/ 3,5

1,9811

0,15622

STATUS
(media alta,media)/(media baja,baja,alta)

270/62

3,4/ 3,0

3,9361

0,04544

STATUS
(media alta,media baja)/(media,baja,alta)

205/127

3,3/ 3,3

0,1826

0,67308

STATUS
(media alta,baja)/(media,media baja,alta)

200/132

3,3/ 3,3

0,0979

0,75286

HABITAT
(-10.000)/(+10.000)

100/232

3,3/ 3,3

0,0429

0,83074

 

Nivel de segmentación 1.2.1

Media

3,50

Número de casos

192

Significación

0,0049

Variables independientes

4

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(hasta 2)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

132/60

3,4/ 3,6

0,7045

0,40711

ESTADO
(soltero)/(pareja,otro)

48/144

3,5/ 3,5

0,0000

1,00000

ESTADO
(pareja)/(soltero,otro)

120/72

3,5/ 3,5

0,0101

0,91703

ESTADO
(otro)/(soltero,pareja)

24/168

3,5/ 3,5

0,0215

0,87844

STATUS
(alta)/(media alta,media,media baja,baja)

23/169

2,8/ 3,6

6,2848

0,01254

STATUS
(media alta)/(alta,media,media baja,baja)

131/61

3,6/ 3,3

1,2060

0,27305

STATUS
(media)/(alta,media alta,media baja,baja)

30/162

3,7/ 3,5

0,4478

0,51148

STATUS
(media baja)/(alta,media alta,media,baja)

5/187

4,0/ 3,5

0,5824

0,45252

STATUS
(baja)/(alta,media alta,media,media baja)

3/189

3,0/ 3,5

0,3453

0,56483

STATUS
(alta,media alta)/(media,media baja,baja)

154/38

3,5/ 3,7

0,5358

0,47173

STATUS
(alta,media)/(media alta,media baja,baja)

53/139

3,3/ 3,6

1,5721

0,20870

STATUS
(alta,media baja)/(media alta,media,baja)

28/164

3,0/ 3,6

3,7811

0,05044

STATUS
(alta,baja)/(media alta,media,media baja)

26/166

2,8/ 3,6

6,7520

0,00982

STATUS
(alta,media alta,media)/(media baja,baja)

184/8

3,5/ 3,6

0,0590

0,80376

STATUS
(alta,media alta,media baja)/(media,baja)

159/33

3,5/ 3,6

0,2030

0,65731

STATUS
(alta,media alta,baja)/(media,media baja)

157/35

3,5/ 3,7

0,8933

0,34809

STATUS
(media alta,media)/(media baja,baja,alta)

161/31

3,6/ 3,0

4,2751

0,03781

STATUS
(media alta,media baja)/(media,baja,alta)

136/56

3,6/ 3,3

1,9471

0,16063

STATUS
(media alta,baja)/(media,media baja,alta)

134/58

3,6/ 3,3

0,9096

0,34352

HABITAT
(-10.000)/(+10.000)

32/160

3,4/ 3,5

0,0679

0,79078

Nivel de segmentación 1.2.2

Media

3,04

Número de casos

140

Significación

0,0049

Variables independientes

4

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(de 3 a 5,más de 5)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

76/64

3,3/ 2,8

4,1465

0,04124

ESTADO
(soltero)/(pareja,otro)

76/64

3,2/ 2,9

1,1715

0,28081

ESTADO
(pareja)/(soltero,otro)

52/88

3,0/ 3,0

0,0003

0,98366

ESTADO
(otro)/(soltero,pareja)

12/128

2,3/ 3,1

3,8999

0,04757

STATUS
(alta)/(media alta,media,media baja,baja)

28/112

3,0/ 3,0

0,0209

0,88030

STATUS
(media alta)/(alta,media,media baja,baja)

66/74

2,8/ 3,2

2,4361

0,11662

STATUS
(media)/(alta,media alta,media baja,baja)

43/97

3,4/ 2,9

4,3945

0,03580

STATUS
(media baja)/(alta,media alta,media,baja)

3/137

2,3/ 3,1

0,7116

0,40506

STATUS
(baja)/(alta,media alta,media,media baja)

0/140

*

*

*

STATUS
(alta,media alta)/(media,media baja,baja)

94/46

2,9/ 3,3

3,1963

0,07236

STATUS
(alta,media)/(media alta,media baja,baja)

71/69

3,3/ 2,8

3,2748

0,06899

STATUS
(alta,media baja)/(media alta,media,baja)

31/109

2,9/ 3,1

0,1875

0,66949

STATUS
(alta,baja)/(media alta,media,media baja)

28/112

3,0/ 3,0

0,0209

0,88030

STATUS
(alta,media alta,media)/(media baja,baja)

137/3

3,1/ 2,3

0,7116

0,40506

STATUS
(alta,media alta,media baja)/(media,baja)

97/43

2,9/ 3,4

4,3945

0,03580

STATUS
(alta,media alta,baja)/(media,media baja)

94/46

2,9/ 3,3

3,1963

0,07236

STATUS
(media alta,media)/(media baja,baja,alta)

109/31

3,1/ 2,9

0,1875

0,66949

STATUS
(media alta,media baja)/(media,baja,alta)

69/71

2,8/ 3,3

3,2748

0,06899

STATUS
(media alta,baja)/(media,media baja,alta)

66/74

2,8/ 3,2

2,4361

0,11662

HABITAT
(-10.000)/(+10.000)

68/72

3,3/ 2,8

3,7762

0,05115

 

Nivel de segmentación 1.2.1.1

Media

3,60

Número de casos

161

Significación

0,0378

Variables independientes

3

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(hasta 2)
STATUS=(media alta,media)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

107/54

3,6/ 3,7

0,2951

0,59458

ESTADO
(soltero)/(pareja,otro)

37/124

3,4/ 3,7

0,8066

0,37397

ESTADO
(pareja)/(soltero,otro)

105/56

3,6/ 3,5

0,2425

0,62887

ESTADO
(otro)/(soltero,pareja)

19/142

3,7/ 3,6

0,1954

0,66320

HABITAT
(-10.000)/(+10.000)

26/135

3,7/ 3,6

0,2576

0,61862

Nivel de segmentación 1.2.1.2

Media

3,00

Número de casos

31

Significación

0,0378

Variables independientes

3

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(hasta 2)
STATUS=(media baja,baja,alta)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

25/6

3,0/ 3,2

0,0939

0,75899

ESTADO
(soltero)/(pareja,otro)

11/20

3,8/ 2,5

6,2943

0,01718

ESTADO
(pareja)/(soltero,otro)

15/16

2,5/ 3,5

4,3014

0,04477

ESTADO
(otro)/(soltero,pareja)

5/26

2,8/ 3,0

0,1085

0,74291

HABITAT
(-10.000)/(+10.000)

6/25

2,2/ 3,2

2,5467

0,11757

Nivel de segmentación 1.2.2.1

Media

3,42

Número de casos

43

Significación

0,0358

Variables independientes

3

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(de 3 a 5,más de 5)
STATUS=(media)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

31/12

3,5/ 3,3

0,0515

0,81644

ESTADO
(soltero)/(pareja,otro)

31/12

3,5/ 3,1

0,8110

0,37657

ESTADO
(pareja)/(soltero,otro)

12/31

3,1/ 3,5

0,8110

0,37657

ESTADO
(otro)/(soltero,pareja)

0/43

*

*

*

HABITAT
(-10.000)/(+10.000)

16/27

3,4/ 3,4

0,0206

0,88160

Nivel de segmentación 1.2.2.2

Media

2,87

Número de casos

97

Significación

0,0358

Variables independientes

3

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(de 3 a 5,más de 5)
STATUS=(alta,media alta,media baja,baja)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

45/52

3,1/ 2,6

3,1104

0,07729

ESTADO
(soltero)/(pareja,otro)

45/52

2,9/ 2,8

0,0221

0,87700

ESTADO
(pareja)/(soltero,otro)

40/57

3,0/ 2,8

0,8720

0,35541

ESTADO
(otro)/(soltero,pareja)

12/85

2,3/ 3,0

2,6818

0,10071

HABITAT
(-10.000)/(+10.000)

52/45

3,3/ 2,4

9,0914

0,00341

 

Nivel de segmentación 1.2.2.2.1

Media

3,25

Número de casos

52

Significación

0,0034

Variables independientes

2

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(de 3 a 5,más de 5)
STATUS=(alta,media alta,media baja,baja)
HABITAT=(-10.000)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

28/24

3,3/ 3,2

0,0318

0,85363

ESTADO
(soltero)/(pareja,otro)

16/36

3,3/ 3,2

0,0371

0,84246

ESTADO
(pareja)/(soltero,otro)

28/24

3,3/ 3,2

0,1274

0,72280

ESTADO
(otro)/(soltero,pareja)

8/44

2,9/ 3,3

0,5520

0,46733

Nivel de segmentación 1.2.2.2.2

Media

2,42

Número de casos

45

Significación

0,0034

Variables independientes

2

Selección

EDAD=(-25,25-35,36-45,46-55)
TAM_FAM=(de 3 a 5,más de 5)
STATUS=(alta,media alta,media baja,baja)
HABITAT=(+10.000)

 

Dicotomía

Casos

Medias

Prueba F

Significación

SEXO
(hombre)/(mujer)

17/28

2,9/ 2,1

5,5038

0,02250

ESTADO
(soltero)/(pareja,otro)

29/16

2,7/ 2,0

4,0884

0,04692

ESTADO
(pareja)/(soltero,otro)

12/33

2,3/ 2,5

0,1093

0,74139

ESTADO
(otro)/(soltero,pareja)

4/41

1,0/ 2,6

9,0706

0,00437