MIRTA VARGAS DE ARGENTINA MEDIA 9 CALZADA Cat B 2° grupo 1ª Actividad
GILABREU_ACTIVIDAD5
-
Upload
samuelnicol -
Category
Documents
-
view
119 -
download
12
Transcript of GILABREU_ACTIVIDAD5
ANÁLISIS DE DATOS. TÉCNICAS
APLICADAS A DATOS DE PROXIMIDAD ACTIVIDAD 5
Samuel Nicol Gil Abreu
75878169L
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
2
ACTIVIDAD 5.1
Comenta los resultados obtenidos al realizar el análisis:
## Solución simple de SMACOF para los datos de kinship
data(kinshipdelta)
res = smacofSym(kinshipdelta)
res
summary(res)
## Solución no métrica 3D de SMACOF para los datos de trading
data(trading)
res = smacofSym(trading, ndim = 3, metric = FALSE, ties = "secondary")
res
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
3
Lo primero será cargar la libraría necesaria para poder ejecutar el código anterior, supuesto que
ha sido previamente descargada e instalada.
> library(smacof)
Así:
> data(kinshipdelta)
> kinshipdelta
Aunt Brother Cousin Daughter Father Granddaughter Grandfather Grandmother Grandson Mother Nephew Niece Sister
Aunt 0 79 53 59 73 57 77 55 79 51 56 32 58
Brother 79 0 67 62 38 75 57 80 51 63 53 76 28
Cousin 53 67 0 74 77 74 76 78 72 79 51 53 70
Daughter 59 62 74 0 57 46 77 54 72 31 74 52 37
Father 73 38 77 57 0 79 51 70 54 29 59 81 63
Granddaughter 57 75 74 46 79 0 57 32 29 56 74 51 50
Grandfather 77 57 76 77 51 57 0 29 31 75 58 79 79
Grandmother 55 80 78 54 70 32 29 0 57 50 79 58 57
Grandson 79 51 72 72 54 29 31 57 0 79 51 74 75
Mother 51 63 79 31 29 56 75 50 79 0 81 60 39
Nephew 56 53 51 74 59 74 58 79 51 81 0 27 76
Niece 32 76 53 52 81 51 79 58 74 60 27 0 53
Sister 58 28 70 37 63 50 79 57 75 39 76 53 0
Son 80 38 73 29 32 72 55 78 47 57 52 74 62
Uncle 27 57 51 80 51 80 55 77 58 73 33 56 79
Son Uncle
Aunt 80 27
Brother 38 57
Cousin 73 51
Daughter 29 80
Father 32 51
Granddaughter 72 80
Grandfather 55 55
Grandmother 78 77
Grandson 47 58
Mother 57 73
Nephew 52 33
Niece 74 56
Sister 62 79
Son 0 59
Uncle 59 0
> res=smacofSym(kinshipdelta)
> res
Call: smacofSym(delta = kinshipdelta)
Model: Symmetric SMACOF
Number of objects: 15
Metric stress: 0.06988988
Number of iterations: 204
El modelo usado (SMACOF simétrico) analiza objetos y, tras algo más de doscientas iteraciones devuelve
el valor del STRESS, que resulta ser .
Para obtener un resumen estadístico de este análisis se ordena el comando , que devolverá la
ubicación de cada familiar y el STRESS métrico de cada individuo:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
4
> summary(res)
Configurations:
D1 D2
Aunt 0.5052 0.4421
Brother -0.3106 -0.6027
Cousin 0.8603 0.1357
Daughter -0.4977 0.2096
Father -0.5568 -0.4258
Granddaughter -0.0844 0.5313
Grandfather 0.1751 -0.6940
Grandmother -0.1442 0.7012
Grandson 0.1259 -0.5109
Mother -0.6963 0.1600
Nephew 0.5248 -0.1800
Niece 0.3729 0.5135
Sister -0.5328 0.4216
Son -0.3723 -0.3849
Uncle 0.6309 -0.3168
Stress per point:
SPP SPP(%)
Daughter 0.0367 3.6863
Son 0.0387 3.8858
Niece 0.0411 4.1270
Nephew 0.0473 4.7473
Father 0.0503 5.0521
Mother 0.0528 5.2954
Uncle 0.0587 5.8891
Aunt 0.0627 6.2934
Cousin 0.0672 6.7422
Sister 0.0766 7.6896
Brother 0.0766 7.6908
Granddaughter 0.0794 7.9723
Grandson 0.0803 8.0591
Grandfather 0.1122 11.2600
Grandmother 0.1157 11.6096
Puede además atenderse a la representación gráfica de este análisis: > par(bg="Cornsilk")
> plot(res,type="p",col="blue")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
5
Se atiende en dicho gráfico la relación entre las variables. Puede verse que en la parte inferior se sitúan los
miembros familiares de sexo masculino y en la parte opuesta las féminas. Incluso se puede pensar en la
agrupación de algunos individuos, como:
- madre, hermana e hija
- padre, hijo y hermano
- abuelo y abuela
- sobrina y tía
- sobrino y tío
- primo/a.
También en estos casos es usual representar el diagrama de Shepard, que enfrenta las similaridades y las
distancias. Así:
> par(bg="lightgrey")
> plot(res,plot.type="Shepard",main="Diagrama de Shepard")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
6
Se comienza ahora el segundo análisis con los datos de la variable :
> data(trading)
Arge Aust Braz Cana Chin Czec Egyp E.Ge Fran Hung Indi
Aust 0.6250000
Braz 0.5000000 0.5714286
Cana 0.7142857 0.3333333 0.6666667
Chin 0.8750000 0.8888889 0.8571429 0.8571429
Czec 1.0000000 1.0000000 1.0000000 1.0000000 0.8571429
Egyp 0.6250000 0.6666667 0.7500000 0.7500000 0.8888889 0.8888889
E.Ge 0.8888889 0.9000000 0.8750000 1.0000000 0.8750000 0.5000000 0.7777778
Fran 0.5714286 0.6250000 0.7142857 0.7142857 1.0000000 1.0000000 0.4285714 0.8888889
Hung 0.8750000 0.8888889 0.8571429 1.0000000 0.8571429 0.6666667 0.7500000 0.5000000 0.8750000
Indi 0.5714286 0.4285714 0.5000000 0.5000000 0.7142857 0.8750000 0.4285714 0.7500000 0.5714286 0.7142857
Ital 0.8750000 0.8888889 0.6666667 1.0000000 1.0000000 1.0000000 0.7500000 0.8750000 0.7142857 0.8571429 0.8750000
Japa 0.8181818 0.7272727 0.8000000 0.8000000 0.8000000 1.0000000 0.9230769 1.0000000 0.9166667 1.0000000 0.9166667
N.Ze 0.7142857 0.5714286 0.6666667 0.4000000 0.6666667 1.0000000 0.7500000 1.0000000 0.7142857 1.0000000 0.5000000
Pola 0.8750000 0.8888889 0.8571429 1.0000000 0.8571429 0.6666667 0.7500000 0.5000000 0.8750000 0.0000000 0.7142857
Swed 0.6666667 0.5000000 0.6000000 0.6000000 1.0000000 1.0000000 0.5000000 0.8571429 0.4000000 0.8333333 0.4000000
USA 0.7857143 0.7142857 0.7692308 0.8571429 0.7692308 1.0000000 0.8000000 0.9375000 0.7857143 0.9333333 0.7857143
USSR 1.0000000 0.9166667 1.0000000 0.9000000 1.0000000 0.6250000 1.0000000 0.6666667 0.9090909 0.7777778 1.0000000
U.K. 0.8333333 0.7500000 0.8181818 0.9166667 0.8181818 1.0000000 0.7500000 0.9230769 0.7272727 0.9166667 0.8333333
W.Ge 0.8000000 0.8823529 0.8666667 0.8666667 0.9375000 0.7857143 0.7333333 0.8750000 0.7142857 0.9375000 0.8750000
Ital Japa N.Ze Pola Swed USA USSR U.K.
Aust
Braz
Cana
Chin
Czec
Egyp
E.Ge
Fran
Hung
Indi
Ital
Japa 0.9090909
N.Ze 1.0000000 0.8000000
Pola 0.8571429 1.0000000 1.0000000
Swed 0.8333333 0.9000000 0.6000000 0.8333333
USA 0.6666667 0.5714286 0.7692308 0.9333333 0.8461538
USSR 0.9000000 0.8461538 1.0000000 0.7777778 1.0000000 0.8823529
U.K. 0.7000000 0.5833333 0.8181818 0.9166667 0.8000000 0.3846154 0.8571429
W.Ge 0.7857143 0.6875000 0.7857143 0.9375000 0.8571429 0.5294118 0.6666667 0.6250000
> res=smacofSym(trading,ndim=3,metric=F,ties="secondary")
> res
Call: smacofSym(delta = trading, ndim = 3, metric = F, ties = "secondary")
Model: Symmetric SMACOF
Number of objects: 20
Nonmetric stress: 0.01129101
Number of iterations: 137
Tras analizar las variables y realizar iteraciones (menos que en el apartado anterior) se obtuve un
STRESS de . En cuanto al resumen del análisis se presenta a continuación:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
7
> summary(res)
Configurations:
D1 D2 D3
Arge -0.4454 0.1850 0.3048
Aust -0.4703 0.1840 -0.0965
Braz -0.5317 0.0404 0.1008
Cana -0.5448 0.2996 -0.3468
Chin 0.0264 -0.0954 -0.8231
Czec 0.8506 0.0540 -0.2875
Egyp -0.0616 0.3702 0.3090
E.Ge 0.7299 0.1872 0.0039
Fran -0.2549 0.2730 0.4137
Hung 0.6317 0.4270 0.0494
Indi -0.2296 0.3459 -0.0492
Ital 0.0326 -0.3152 0.7260
Japa -0.2163 -0.7367 -0.2709
N.Ze -0.4688 0.1111 -0.4211
Pola 0.6317 0.4270 0.0494
Swed -0.3380 0.4511 0.1111
USA -0.1678 -0.6047 0.0412
USSR 0.7828 -0.3803 -0.1012
U.K. -0.1359 -0.6170 0.2302
W.Ge 0.1793 -0.6061 0.0571
Stress per point:
SPP SPP(%)
Czec 0.0029 1.3420
E.Ge 0.0049 2.2825
Aust 0.0054 2.5092
USA 0.0054 2.5299
N.Ze 0.0064 2.9575
Indi 0.0066 3.0822
Japa 0.0070 3.2429
Hung 0.0072 3.3356
Pola 0.0072 3.3356
Swed 0.0086 4.0110
U.K. 0.0091 4.2422
Egyp 0.0100 4.6500
Cana 0.0122 5.6603
USSR 0.0128 5.9295
Fran 0.0135 6.2841
W.Ge 0.0152 7.0597
Arge 0.0154 7.1520
Ital 0.0178 8.2956
Chin 0.0228 10.5945
Braz 0.0247 11.5036
Se presenta la posición de los países respecto del comercio en 3 dimensiones, así como el STRESS y el
STRESS acumulado para cada nación.
Nuevamente se atiende a la representación gráfica comparando uno a uno los ejes:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
8
> par(bg="Cornsilk")
> plot(res,plot.dim=c(1,2),type="p",col="brown")
> plot(res,plot.dim=c(1,3),type="p",col="brown")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
9
> plot(res,plot.dim=c(2,3),type="p",col="brown")
A diferencia del modelo métrico, el modelo de escalamiento no métrico no presupone una relación de tipo
lineal entre proximidades y distancias, sino una relación monótona creciente (que puede corresponder a
una línea recta, curva o quebrada), luego la relación se establece en términos de orden de proximidades.
Por ello se transforman las proximidades en disparidades y se calculan las distancias a partir de las
disparidades usando el (función de bondad de ajuste).
Por todo lo anterior, puede verse en las representaciones gráficas anteriores que China ocupa una posición
intermedia, lo cual daría a pensar que se relaciona con los restantes países, o algunos subgrupos como:
- Argentina, Australia, Canadá, Brasil, Nueva Zelanda
- Suecia, India, Francia y Egipto
- Hungría y Polonia
- Japón, Estados Unidos y Reino Unido
En un posición más alejada se encuentra Rusia y la República Checa.
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
10
En cuanto al Diagrama de Shepard:
> par(bg="lightgrey")
> plot(res,plot.type="Shepard",main="Diagrama de Shepard")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
11
ACTIVIDAD 5.2
Comenta los resultados obtenidos al realizar el análisis:
data(perception)
res <- smacofIndDiff(perception)
res
summary(res)
res.id <- smacofIndDiff(perception, constraint = "identity")
res.diag <- smacofIndDiff(perception, constraint = "diagonal")
res.idio <- smacofIndDiff(perception, constraint = "idioscal"
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
12
Lo primero será cargar la libraría necesaria para poder ejecutar el código anterior, supuesto que
ha sido previamente descargada e instalada.
> library(smacof)
Así:
> data(perception)
> perception
[[1]]
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16]
[1,] 0.00 4.33 6.12 7.21 2.38 4.52 6.00 7.76 3.36 5.93 6.71 7.88 3.69 5.86 7.36 8.36
[2,] 4.33 0.00 4.07 5.62 5.76 2.52 4.52 6.21 6.14 4.24 5.60 6.31 6.98 4.55 5.88 7.02
[3,] 6.12 4.07 0.00 3.24 7.12 5.48 3.38 4.40 7.14 6.07 4.29 5.48 7.98 6.64 4.55 5.86
[4,] 7.21 5.62 3.24 0.00 7.57 6.86 5.21 3.12 8.10 6.93 5.90 5.00 8.45 7.17 6.79 5.40
[5,] 2.38 5.76 7.12 7.57 0.00 4.10 6.10 6.83 2.00 5.00 6.86 7.83 2.60 4.86 6.93 7.57
[6,] 4.52 2.52 5.48 6.86 4.10 0.00 4.31 5.45 4.71 2.81 4.50 5.55 5.95 2.88 4.50 5.86
[7,] 6.00 4.52 3.38 5.21 6.10 4.31 0.00 4.00 6.52 5.43 2.64 4.43 7.69 5.40 3.50 4.52
[8,] 7.76 6.21 4.40 3.12 6.83 5.45 4.00 0.00 7.71 5.67 5.21 2.69 7.86 6.50 5.55 3.50
[9,] 3.36 6.14 7.14 8.10 2.00 4.71 6.52 7.71 0.00 4.38 6.26 7.21 1.60 4.14 5.95 6.86
[10,] 5.93 4.24 6.07 6.93 5.00 2.81 5.43 5.67 4.38 0.00 3.60 5.83 4.31 1.19 3.95 5.17
[11,] 6.71 5.60 4.29 5.90 6.86 4.50 2.64 5.21 6.26 3.60 0.00 3.60 6.95 3.79 1.48 3.71
[12,] 7.88 6.31 5.48 5.00 7.83 5.55 4.43 2.69 7.21 5.83 3.60 0.00 7.43 5.88 4.60 1.62
[13,] 3.69 6.98 7.98 8.45 2.60 5.95 7.69 7.86 1.60 4.31 6.95 7.43 0.00 4.17 6.07 7.07
[14,] 5.86 4.55 6.64 7.17 4.86 2.88 5.40 6.50 4.14 1.19 3.79 5.88 4.17 0.00 4.02 5.26
[15,] 7.36 5.88 4.55 6.79 6.93 4.50 3.50 5.55 5.95 3.95 1.48 4.60 6.07 4.02 0.00 3.45
[16,] 8.36 7.02 5.86 5.40 7.57 5.86 4.52 3.50 6.86 5.17 3.71 1.62 7.07 5.26 3.45 0.00
[[2]]
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16]
[1,] 0.00 2.05 2.64 3.31 4.93 4.31 4.60 5.79 6.50 6.55 6.19 5.52 8.00 6.98 6.79 7.14
[2,] 2.05 0.00 2.12 2.71 4.71 4.69 4.43 4.98 6.40 5.98 5.81 5.71 8.14 6.95 6.76 6.79
[3,] 2.64 2.12 0.00 1.79 5.40 5.07 4.36 4.24 6.93 6.29 5.98 5.71 8.17 7.40 6.76 6.71
[4,] 3.31 2.71 1.79 0.00 6.36 5.83 4.88 4.31 7.14 6.52 5.71 5.79 8.67 7.69 7.17 6.40
[5,] 4.93 4.71 5.40 6.36 0.00 3.17 4.19 4.57 3.52 3.79 3.69 4.95 6.33 5.67 5.29 4.69
[6,] 4.31 4.69 5.07 5.83 3.17 0.00 3.43 3.93 4.12 3.57 3.74 3.60 6.62 5.76 5.31 4.90
[7,] 4.60 4.43 4.36 4.88 4.19 3.43 0.00 3.43 5.64 4.07 3.48 2.98 7.26 5.83 5.64 5.26
[8,] 5.79 4.98 4.24 4.31 4.57 3.93 3.43 0.00 5.55 4.45 3.71 3.64 6.95 5.98 5.24 5.00
[9,] 6.50 6.40 6.93 7.14 3.52 4.12 5.64 5.55 0.00 2.86 4.45 5.79 4.14 3.02 3.00 4.57
[10,] 6.55 5.98 6.29 6.52 3.79 3.57 4.07 4.45 2.86 0.00 2.86 4.17 4.50 3.48 3.05 3.17
[11,] 6.19 5.81 5.98 5.71 3.69 3.74 3.48 3.71 4.45 2.86 0.00 3.31 5.52 3.83 3.40 2.50
[12,] 5.52 5.71 5.71 5.79 4.95 3.60 2.98 3.64 5.79 4.17 3.31 0.00 5.95 5.17 3.88 3.55
[13,] 8.00 8.14 8.17 8.67 6.33 6.62 7.26 6.95 4.14 4.50 5.52 5.95 0.00 2.38 4.29 5.43
[14,] 6.98 6.95 7.40 7.69 5.67 5.76 5.83 5.98 3.02 3.48 3.83 5.17 2.38 0.00 2.64 3.81
[15,] 6.79 6.76 6.76 7.17 5.29 5.31 5.64 5.24 3.00 3.05 3.40 3.88 4.29 2.64 0.00 2.74
[16,] 7.14 6.79 6.71 6.40 4.69 4.90 5.26 5.00 4.57 3.17 2.50 3.55 5.43 3.81 2.74 0.00
> res= smacofIndDiff(perception)
> res
Call: smacofIndDiff(delta = perception)
Model: Three-way SMACOF
Number of objects: 16
Metric stress: 0.05531428
Number of iterations: 114
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
13
El modelo usado (SMACOF a tres vías) analiza los elementos y, tras algo más de cien iteraciones
devuelve el valor del STRESS, que resulta ser .
Para obtener un resumen estadístico de este análisis se ordena el comando , que devolverá la
posición de cada individuo (para dos dimensiones) y el STRESS métrico de cada uno:
> summary(res)
Group Stimulus Space (Joint Configurations):
D1 D2
1 -0.6189 -0.5678
2 -0.7075 -0.1874
3 -0.7614 0.1960
4 -0.7826 0.4892
5 -0.0644 -0.6431
6 -0.1447 -0.2234
7 -0.2503 0.2425
8 -0.2344 0.6107
9 0.3490 -0.6058
10 0.3435 -0.1570
11 0.2470 0.2459
12 0.1209 0.6141
13 0.7678 -0.5868
14 0.6645 -0.1738
15 0.6002 0.2125
16 0.4716 0.5343
Stress per point:
SPP SPP(%)
11 0.0613 4.6553
9 0.0624 4.7460
14 0.0632 4.8035
10 0.0636 4.8304
2 0.0647 4.9189
16 0.0670 5.0956
15 0.0732 5.5657
3 0.0770 5.8508
1 0.0771 5.8587
5 0.0805 6.1198
12 0.0838 6.3715
6 0.0940 7.1434
8 0.1101 8.3708
7 0.1106 8.4082
13 0.1126 8.5612
4 0.1145 8.7001
Puede además atenderse a la representación gráfica de este análisis: > par(bg="Cornsilk")
> plot(res,type="p",col="blue")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
14
A continuación se procede con otro análisis en base a los mismos datos, si bien se añade una restricción
(identity) que restringirá las configuraciones. Para cada situación se va a presentar:
Resultados principales del análisis
Resumen del análisis
Diagrama de configuración
Diagrama de Shepard
> res.id=smacofIndDiff(perception,constraint="identity")
> res.id
Call: smacofIndDiff(delta = perception, constraint = "identity")
Model: Three-way SMACOF
Number of objects: 16
Metric stress: 0.08491675
Number of iterations: 33
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
15
> summary(res.id)
Group Stimulus Space (Joint Configurations):
D1 D2
1 -0.1867 -0.8004
2 -0.4654 -0.5233
3 -0.7216 -0.2320
4 -0.9097 -0.0124
5 0.2928 -0.5986
6 0.0079 -0.2493
7 -0.3490 0.1240
8 -0.5442 0.4242
9 0.6044 -0.3692
10 0.3748 0.0699
11 0.0697 0.3729
12 -0.2314 0.6275
13 0.9292 -0.2046
14 0.6378 0.1601
15 0.3855 0.4943
16 0.1058 0.7170
Stress per point:
SPP SPP(%)
11 0.0580 4.3951
10 0.0607 4.6017
9 0.0639 4.8443
14 0.0650 4.9286
1 0.0675 5.1182
2 0.0696 5.2732
16 0.0766 5.8076
15 0.0810 6.1433
3 0.0814 6.1695
12 0.0834 6.3199
5 0.0866 6.5646
6 0.0944 7.1526
7 0.1015 7.6910
8 0.1084 8.2160
13 0.1099 8.3343
4 0.1113 8.4401
> par(bg="Cornsilk")
> plot(res.id,type="p",col="darkgreen")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
16
> par(bg="lightgrey")
> plot(res.id,plot.type="Shepard",main="Diagrama de Shepard")
> res.diag=smacofIndDiff(perception,constraint="diagonal")
> res.diag
Call: smacofIndDiff(delta = perception, constraint = "diagonal")
Model: Three-way SMACOF
Number of objects: 16
Metric stress: 0.05531428
Number of iterations: 114
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
17
> summary(res.diag)
Group Stimulus Space (Joint Configurations):
D1 D2
1 -0.6189 -0.5678
2 -0.7075 -0.1874
3 -0.7614 0.1960
4 -0.7826 0.4892
5 -0.0644 -0.6431
6 -0.1447 -0.2234
7 -0.2503 0.2425
8 -0.2344 0.6107
9 0.3490 -0.6058
10 0.3435 -0.1570
11 0.2470 0.2459
12 0.1209 0.6141
13 0.7678 -0.5868
14 0.6645 -0.1738
15 0.6002 0.2125
16 0.4716 0.5343
Stress per point:
SPP SPP(%)
11 0.0613 4.6553
9 0.0624 4.7460
14 0.0632 4.8035
10 0.0636 4.8304
2 0.0647 4.9189
16 0.0670 5.0956
15 0.0732 5.5657
3 0.0770 5.8508
1 0.0771 5.8587
5 0.0805 6.1198
12 0.0838 6.3715
6 0.0940 7.1434
8 0.1101 8.3708
7 0.1106 8.4082
13 0.1126 8.5612
4 0.1145 8.7001
> par(bg="Cornsilk")
> plot(res.diag,type="p",col="darkgreen")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
18
> par(bg="lightgrey")
> plot(res.diag,plot.type="Shepard",main="Diagrama de Shepard")
> res.idio=smacofIndDiff(perception,constraint="idioscal")
> res.idio
Call: smacofIndDiff(delta = perception, constraint = "idioscal")
Model: Three-way SMACOF
Number of objects: 16
Metric stress: 0.05531424
Number of iterations: 32
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
19
> summary(res.idio)
Group Stimulus Space (Joint Configurations):
D1 D2
1 -0.1993 -0.8179
2 -0.4782 -0.5230
3 -0.7304 -0.2081
4 -0.9069 0.0427
5 0.2960 -0.6062
6 0.0026 -0.2720
7 -0.3367 0.0906
8 -0.5235 0.4270
9 0.6146 -0.3651
10 0.3667 0.0327
11 0.0691 0.3436
12 -0.2340 0.6088
13 0.9476 -0.1376
14 0.6390 0.1791
15 0.3768 0.4914
16 0.0968 0.7139
Stress per point:
SPP SPP(%)
11 0.0612 4.6551
9 0.0624 4.7463
14 0.0632 4.8031
10 0.0636 4.8305
2 0.0647 4.9179
16 0.0671 5.0980
15 0.0732 5.5657
3 0.0770 5.8509
1 0.0771 5.8566
5 0.0805 6.1214
12 0.0838 6.3720
6 0.0940 7.1445
8 0.1101 8.3709
7 0.1106 8.4081
13 0.1126 8.5599
4 0.1145 8.6992
> par(bg="Cornsilk")
> plot(res.idio,type="p",col="darkgreen")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
20
> par(bg="lightgrey")
> plot(res.idio,plot.type="Shepard",main="Diagrama de Shepard")
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
21
ACTIVIDAD 5.3
Usando los datos de la Tabla 4.1 de colors de Helm, (1959):
a) Leer los datos con SPSS
La siguiente Tabla contiene las distancias entre los 45 pares de colores formados con 10
colores, emitidas por 11 individuos normales (Helm, 1959).
A C E G I K M O Q S 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
6,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
12,5 5,4 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
13,8 8,3 5,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0
14,2 10,4 7,2 3,7 0,0 0,0 0,0 0,0 0,0 0,0
12,5 11,6 9,5 5,9 4,2 0,0 0,0 0,0 0,0 0,0
11,0 13,8 11,3 10,1 6,9 4,3 0,0 0,0 0,0 0,0
8,6 14,3 13,5 11,1 10,2 6,8 4,8 0,0 0,0 0,0
5,5 11,8 14,6 12,3 12,1 9,9 7,4 4,5 0,0 0,0
3,5 8,9 14,1 12,5 11,2 10,7 8,7 6,1 3,6 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
5,9 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
11,1 4,9 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
18,8 10,6 4,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0
17,3 14,3 8,3 3,6 0,0 0,0 0,0 0,0 0,0 0,0
16,6 16,6 13,2 5,3 3,5 0,0 0,0 0,0 0,0 0,0
16,5 17,3 14,6 8,2 6,8 3,8 0,0 0,0 0,0 0,0
8,3 14,5 16,1 14,5 11,0 7,4 5,7 0,0 0,0 0,0
5,7 9,5 14,0 17,0 15,8 13,8 10,9 5,0 0,0 0,0
4,2 7,3 13,8 17,3 15,8 15,1 13,9 6,0 3,5 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
7,1 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,2 5,7 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
11,1 11,5 6,7 0,0 0,0 0,0 0,0 0,0 0,0 0,0
12,5 10,7 8,9 3,7 0,0 0,0 0,0 0,0 0,0 0,0
11,8 11,8 9,4 5,9 3,6 0,0 0,0 0,0 0,0 0,0
9,9 11,2 11,3 10,3 8,2 5,1 0,0 0,0 0,0 0,0
8,6 12,5 12,5 11,6 9,8 8,1 4,9 0,0 0,0 0,0
4,3 9,2 11,9 10,9 11,3 10,2 8,7 6,3 0,0 0,0
2,9 8,2 10,5 11,5 11,1 10,6 9,7 7,5 3,0 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
7,5 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,3 6,9 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,7 8,5 4,9 0,0 0,0 0,0 0,0 0,0 0,0 0,0
11,6 10,7 6,6 3,5 0,0 0,0 0,0 0,0 0,0 0,0
10,6 11,1 8,7 6,3 4,1 0,0 0,0 0,0 0,0 0,0
9,7 12,2 10,6 7,8 6,5 5,0 0,0 0,0 0,0 0,0
8,4 10,8 11,7 10,4 8,6 7,4 5,9 0,0 0,0 0,0
5,8 9,9 11,1 11,6 10,0 9,1 8,7 5,6 0,0 0,0
3,6 8,0 12,0 11,3 10,8 10,7 9,6 6,7 3,5 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
6,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,5 5,5 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,2 9,6 7,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,6 9,3 8,3 4,7 0,0 0,0 0,0 0,0 0,0 0,0
10,8 9,9 9,3 6,2 3,3 0,0 0,0 0,0 0,0 0,0
9,7 11,7 11,3 8,9 6,3 4,2 0,0 0,0 0,0 0,0
8,5 11,6 11,9 10,3 9,1 8,9 6,6 0,0 0,0 0,0
4,9 10,3 11,8 11,6 11,1 9,4 8,9 5,8 0,0 0,0
3,5 8,0 11,5 10,2 10,4 10,6 9,2 7,3 2,9 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
5,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,4 6,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
11,4 11,2 5,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0
13,3 13,5 8,2 4,0 0,0 0,0 0,0 0,0 0,0 0,0
12,0 12,9 9,6 5,8 3,8 0,0 0,0 0,0 0,0 0,0
12,3 12,0 12,7 6,8 5,4 3,6 0,0 0,0 0,0 0,0
10,6 11,5 13,7 9,3 7,9 5,6 4,2 0,0 0,0 0,0
4,9 8,2 13,4 10,5 9,9 9,0 8,2 5,1 0,0 0,0
3,5 6,3 11,7 12,2 13,2 10,4 9,8 6,8 3,8 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
5,8 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,5 4,9 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
13,4 12,2 4,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0
14,0 14,8 8,3 3,5 0,0 0,0 0,0 0,0 0,0 0,0
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
22
13,2 14,6 10,7 4,7 3,6 0,0 0,0 0,0 0,0 0,0
11,7 14,1 12,8 8,8 6,9 4,1 0,0 0,0 0,0 0,0
10,2 13,4 14,1 11,0 9,4 6,9 4,1 0,0 0,0 0,0
6,4 9,7 12,9 11,8 12,4 10,6 10,0 4,1 0,0 0,0
3,5 7,9 10,9 11,7 13,7 12,2 11,1 6,9 3,4 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
6,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,8 7,5 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,9 8,9 6,3 0,0 0,0 0,0 0,0 0,0 0,0 0,0
11,1 10,7 8,7 3,9 0,0 0,0 0,0 0,0 0,0 0,0
10,3 10,8 9,6 6,8 5,0 0,0 0,0 0,0 0,0 0,0
8,8 10,6 10,1 9,4 8,3 4,3 0,0 0,0 0,0 0,0
7,6 10,4 10,8 9,7 9,0 7,3 4,9 0,0 0,0 0,0
5,8 9,0 11,7 10,4 10,9 9,0 7,2 4,7 0,0 0,0
3,0 7,5 9,4 9,7 9,6 8,8 7,6 5,6 3,5 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
7,5 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,1 4,4 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,2 7,9 5,7 0,0 0,0 0,0 0,0 0,0 0,0 0,0
12,1 10,4 8,3 3,9 0,0 0,0 0,0 0,0 0,0 0,0
12,5 11,2 10,2 6,5 4,6 0,0 0,0 0,0 0,0 0,0
9,7 12,6 11,3 8,7 7,8 6,3 0,0 0,0 0,0 0,0
9,8 11,4 12,2 10,3 9,9 9,6 4,8 0,0 0,0 0,0
8,3 11,3 11,9 10,7 11,2 10,6 6,8 4,6 0,0 0,0
6,7 10,4 10,7 12,6 11,6 11,6 9,1 7,4 5,2 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
6,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,4 7,1 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,5 9,5 7,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,5 9,5 8,9 3,8 0,0 0,0 0,0 0,0 0,0 0,0
9,8 9,9 9,8 5,3 4,8 0,0 0,0 0,0 0,0 0,0
8,7 10,6 10,5 7,3 6,2 4,7 0,0 0,0 0,0 0,0
6,7 10,6 10,7 7,6 8,2 6,7 4,5 0,0 0,0 0,0
4,9 8,5 9,7 9,2 9,1 8,8 7,2 4,0 0,0 0,0
4,1 7,9 10,2 10,1 9,7 9,9 6,8 5,3 3,4 0,0
0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,2 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,8 5,5 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0
9,7 8,2 4,6 0,0 0,0 0,0 0,0 0,0 0,0 0,0
10,1 9,4 6,7 3,7 0,0 0,0 0,0 0,0 0,0 0,0
10,3 10,1 9,8 6,6 4,0 0,0 0,0 0,0 0,0 0,0
9,7 10,5 11,3 8,7 7,5 5,4 0,0 0,0 0,0 0,0
9,0 10,8 11,9 10,6 9,9 9,3 5,6 0,0 0,0 0,0
6,6 11,2 11,5 10,0 10,9 9,9 8,2 5,3 0,0 0,0
4,6 10,5 10,2 7,7 10,6 9,7 9,7 6,3 3,4 0,0
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
23
b) Realizar el análisis de los datos usando ALSCAL SPSS para el modelo identidad
Se sigue la siguiente ruta para poder realizar este análisis:
Analizar Escala Escalamiento multidimensional (ALSCAL)
t
En la pestaña Modelo se confirma que el nivel de medida de los datos es ordinal y que la distancia
utilizada para el modelo es la euclídea convencional:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
24
En Opciones pueden marcarse varios gráficos que acompañarán el dossier de resultados:
Se obtienen así los siguientes resultados:
Alscal Procedure Options
Data Options-
Number of Rows (Observations/Matrix). 10
Number of Columns (Variables) . . . 10
Number of Matrices . . . . . . 11
Measurement Level . . . . . . . Ordinal
Data Matrix Shape . . . . . . . Symmetric
Type . . . . . . . . . . . Dissimilarity
Approach to Ties . . . . . . . Leave Tied
Conditionality . . . . . . . . Matrix
Data Cutoff at . . . . . . . . .000000
Model Options-
Model . . . . . . . . . . . Euclid
Maximum Dimensionality . . . . . 2
Minimum Dimensionality . . . . . 2
Negative Weights . . . . . . . Not Permitted
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
25
Output Options-
Job Option Header . . . . . . . Printed
Data Matrices . . . . . . . . Not Printed
Configurations and Transformations . Plotted
Output Dataset . . . . . . . . Not Created
Initial Stimulus Coordinates . . . Computed
Algorithmic Options-
Maximum Iterations . . . . . . 30
Convergence Criterion . . . . . .00100
Minimum S-stress . . . . . . . .00500
Missing Data Estimated by . . . . Ulbounds
Tiestore . . . . . . . . . . 495
Iteration history for the 2 dimensional solution (in squared distances)
Young's S-stress formula 1 is used.
Iteration S-stress Improvement
1 .13736
2 .13657 .00079
Iterations stopped because
S-stress improvement is less than .001000
Stress and squared correlation (RSQ) in distances
RSQ values are the proportion of variance of the scaled data (disparities)
in the partition (row, matrix, or entire data) which
is accounted for by their corresponding distances.
Stress values are Kruskal's stress formula 1.
Matrix Stress RSQ Matrix Stress RSQ Matrix Stress RSQ Matrix Stress RSQ
1 .055 .976 2 .063 .969 3 .067 .964 4 .057 .975
5 .064 .968 6 .081 .949 7 .063 .969 8 .087 .941
9 .109 .908 10 .104 .916 11 .117 .894
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
26
Averaged (rms) over matrices
Stress = .08158 RSQ = .94810
Configuration derived in 2 dimensions
Stimulus Coordinates
Dimension
Stimulus Stimulus 1 2
Number Name
1 A -1.3344 -.5987
2 C -.3327 -1.6129
3 E .8869 -1.4176
4 G 1.3292 -.2886
5 I 1.3456 .3017
6 K 1.0142 .8296
7 M .3098 1.2190
8 O -.6177 1.1448
9 Q -1.2586 .4711
10 S -1.3424 -.0484
Se ve que el STRESS para cada una de las variables es un valor suficientemente pequeño como para
aceptar el modelo en cuestión. Además el coeficiente indica que éste explica un , lo
cual respalda lo anteriormente señalado.
En cuanto a las representaciones gráficas pedidas se presentan a continuación. En el segundo se
advierte también la bondad del ajuste.
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
27
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
28
c) Realizar el análisis de los datos con ALSCAL de SPSS para el modelo de diferencias individuales
Se sigue la siguiente ruta para poder realizar este análisis:
Analizar Escala Escalamiento multidimensional (ALSCAL)
t
En la pestaña Modelo se confirma que el nivel de medida de los datos es ordinal y que la distancia
utilizada para el modelo es la euclídea de diferencias individuales sin permitir ponderaciones
negativas entre los objetos:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
29
En Opciones pueden marcarse varios gráficos que acompañarán el dossier de resultados:
Se obtienen así los siguientes resultados:
Alscal Procedure Options
Data Options-
Number of Rows (Observations/Matrix). 10
Number of Columns (Variables) . . . 10
Number of Matrices . . . . . . 11
Measurement Level . . . . . . . Ordinal
Data Matrix Shape . . . . . . . Symmetric
Type . . . . . . . . . . . Dissimilarity
Approach to Ties . . . . . . . Leave Tied
Conditionality . . . . . . . . Matrix
Data Cutoff at . . . . . . . . .000000
Model Options-
Model . . . . . . . . . . . Indscal
Maximum Dimensionality . . . . . 2
Minimum Dimensionality . . . . . 2
Negative Weights . . . . . . . Not Permitted
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
30
Output Options-
Job Option Header . . . . . . . Printed
Data Matrices . . . . . . . . Not Printed
Configurations and Transformations . Plotted
Output Dataset . . . . . . . . Not Created
Initial Stimulus Coordinates . . . Computed
Initial Subject Weights . . . . . Computed
Algorithmic Options-
Maximum Iterations . . . . . . 30
Convergence Criterion . . . . . .00100
Minimum S-stress . . . . . . . .00500
Missing Data Estimated by . . . . Ulbounds
Tiestore . . . . . . . . . . 495
Iteration history for the 2 dimensional solution (in squared distances)
Young's S-stress formula 1 is used.
Iteration S-stress Improvement
0 .12867
1 .12836
2 .12589 .00247
3 .12558 .00031
Iterations stopped because
S-stress improvement is less than .001000
Stress and squared correlation (RSQ) in distances
RSQ values are the proportion of variance of the scaled data (disparities)
in the partition (row, matrix, or entire data)
which
is accounted for by their corresponding
distances.
Stress values are Kruskal's stress formula 1.
Matrix Stress RSQ Matrix Stress RSQ Matrix Stress RSQ Matrix Stress RSQ
1 .048 .982 2 .057 .975 3 .067 .965 4 .058 .973
5 .062 .970 6 .068 .965 7 .045 .984 8 .084 .945
9 .106 .912 10 .101 .921 11 .104 .918
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
31
Averaged (rms) over matrices
Stress = .07584 RSQ = .95556
Configuration derived in 2 dimensions
Stimulus Coordinates
Dimension
Stimulus Stimulus 1 2
Number Name
1 A -1.3569 -.4846
2 C -1.3512 .9426
3 E -.3379 1.6572
4 G .7893 1.1210
5 I 1.1685 .7213
6 K 1.2950 .0906
7 M 1.0433 -.6717
8 O .3350 -1.2519
9 Q -.5730 -1.2493
10 S -1.0120 -.8751
Subject Weights
Dimension
Subject Weird- 1 2
Number ness
1 .1237 .6381 .7585
2 .1368 .7759 .6109
3 .0274 .7170 .6714
4 .0073 .7094 .6856
5 .1196 .6364 .7516
6 .1593 .7823 .5940
7 .1897 .8042 .5810
8 .0313 .6782 .6965
9 .0543 .6538 .6962
10 .0473 .7106 .6449
11 .2441 .5444 .7887
Overall importance of
each dimension: .4890 .4666
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
32
Flattened Subject Weights
Variable
Subject Plot 1
Number Symbol
1 1 -.9681
2 2 1.0807
3 3 .2204
4 4 .0632
5 5 -.9359
6 6 1.2591
7 7 1.5013
8 8 -.2401
9 9 -.4207
10 A .3768
11 B -1.9366
Se ve que el STRESS para cada una de las variables son suficientemente pequeños como para
aceptar el modelo planetado. Además el coeficiente indica que éste explica un , lo
cual respalda lo anteriormente señalado.
En cuanto a las representaciones gráficas pedidas se presentan a continuación:
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
33
De los dos análisis anteriores, el modelo de diferencias individuales aumentaba el valor de .
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
34
d) Comparar los resultados con los obtenidos mediante PROXSCAL
Recuérdese lo obtenido para el análisis PROXSCAL para ambos estudios:
Medidas de ajuste y stress
Stress bruto normalizado ,01525
Stress-I ,12349a
Stress-II ,35162a
S-Stress ,03974b
Dispersión explicada (D.A.F.) ,98475
Coeficiente de congruencia de Tucker ,99235
PROXSCAL minimiza el stress bruto normalizado.
a. Factor para escalamiento óptimo = 1,016.
b. Factor para escalamiento óptimo = ,987.
Medidas de ajuste y stress
Stress bruto normalizado ,01411
Stress-I ,11878a
Stress-II ,33681a
S-Stress ,03582b
Dispersión explicada
(D.A.F.)
,98589
Coeficiente de congruencia
de Tucker
,99292
PROXSCAL minimiza el stress bruto
normalizado.
a. Factor para escalamiento óptimo =
1,014.
b. Factor para escalamiento óptimo =
,987.
, siendo el segundo el de diferencias individuales.
ANÁLISIS DE DATOS. TÉCNICAS APLICADAS A DATOS DE PROXIMIDAD
Samuel Nicol Gil Abreu Máster en Estadística Aplicada
Curso 2012/13
35
Así pueden tabularse, a modo de facilitar la comparativa, los resultados obtenidos:
MODELO
IDENTIDAD MODELO DIF. INDIVIDUALES
PROXSCAL
ALSCAL
A la vista de los resultados parece pensar que en cambios casos el modelo basado en distancias
euclídeas de diferencias individuales se ajusta algo mejor a los intereses, si bien la diferencia no es
notable.
En cualquier caso, todos los modelos superan el de la Variabilidad Explicada respecto de la
Variabilidad Total y tienen un nivel de ínfimo; en particular todos tienen un error inferior a
una décima. Por esta razón puede considerarse adecuado el uso de los planteados.
Y en cuanto a la comparativa por tipo de análisis, parece preferible el método PROXSCAL, pues
devuelven valores más altos en cuanto a la bondad del ajuste y al STRESS. También podría
atenderse a las representaciones gráficas obtenidas, en las que se aprecia una menor variabilidad
en el caso del susodicho método PROXSCAL frente al método ALSCAL.