ETAP
Ejem
Se pucon e
Si lo adelapara
Conc
Puntomidepara ocasi
Nota
Aplic
PA 1: Prepara
plo: Índice d
uede correlael PIB del prim
comparo coantado. Por tque quede c
lusión: de lo
o débil del a la correlacióque penalicones necesit
: Siempre ha
cación en SP
ación de dat
de Producció
acionar con emer trimestr
on el spreadtanto, para contemporán
que se trata
análisis factoón lineal (y ce mucho el taríamos cor
ay que relativ
PSS (archiv
Aná
os
n Industrial
el PIB y comre (son conte
d soberano,poder compneo.
a es de gener
orial: se apopor tanto, dresultado. A
rrelaciones p
vizar las varia
o ejemplo:
álisis facto
mprobar si eemporáneos
veremos qpararlo con e
rar varianza.
oya en las codeficiente). BAdemás, midparciales (ent
ables (ejemp
autonomia
orial
l IPI del prim).
que probableel IPI habría
orrelaciones, Basta con qude sólo corrtre varias var
plo: número
as2)
mer trimestr
emente ésteque adelant
que es un ce la correlacrelaciones deriables) y no
de internaut
re se corresp
e es un inditarlo en el ti
concepto qución no sea e dos a dossimples.
tas/població
ponde
icador empo
e sólo lineal, , y en
ón)
Análivaria
Resu
líneas
líneas
líneas
vivmo
invtfija
vivinte
intera
gasto
idpers
redes
vivord
Métod
princi
Prim
Extra
facto
pista
en te
isis 1: se mble de selecc
ltado:
C
s fijas
s adsl
s fijas en vivie
ovil
a
er
anu
o i+d sobre pib
s
sloc
denador
do de extracci
pales.
mera column
acción: cant
orial (obviam
a sobre las v
elefonía fija)
eten todas ción vacía.
Comunalidad
In
enda
b
ión: Análisis d
na (Inicial):
tidad de inf
mente, se ha
variables que
).
las variables
des
icial Extra
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
de Component
cantidad de
formación q
a perdido es
e tienen baj
s (excepto l
acción
,905
,910
,863
,928
,632
,925
,869
,915
,956
,810
,981
tes
e informació
que se ha con
specificidad
ja comunali
a de cadena
ón que la va
nseguido ca
d de cada va
dad. En este
a –autonom
ariable tenía
apturar con
ariable). Est
e caso, invtf
mías‐) y se d
a en el inicio
el análisis
to nos dará u
fija (inversi
eja la
o.
una
ión
Varianza total explicada
Compo
nente
Autovalores iniciales
Sumas de las saturaciones al cuadrado de la
extracción
Total % de la varianza % acumulado Total % de la varianza % acumulado
1 6,847 62,246 62,246 6,847 62,246 62,246
2 1,670 15,179 77,424 1,670 15,179 77,424
3 1,179 10,715 88,139 1,179 10,715 88,139
4 ,558 5,070 93,209
5 ,283 2,569 95,778
6 ,244 2,215 97,992
7 ,098 ,893 98,886
8 ,070 ,638 99,524
9 ,033 ,300 99,823
10 ,013 ,121 99,944
11 ,006 ,056 100,000
Método de extracción: Análisis de Componentes principales.
Total: cantidad de información que tiene contenida respecto a la variable original.
% acumulado: % de la información que me da cada factor. Es decir, con 11 factores,
tendría explicado el 100%, y con 3 factores el 88,139%.
Aquí hemos pasado de 11 variables a 11 factores. La diferencia es que las variables
están correlacionadas entre sí, pero los factores tienen correlación 0. Por tanto, cada
factor complementa información, no redunda. La dificultad estriba en cuántos factores
utilizar. En este caso, SPSS ha utilizado de forma automática los 3 primeros factores
(porque total es mayor a 1).
El siguiente paso sería descubrir qué variables están representadas en esos 3 factores.
Para ello, utilizamos la matriz de componentes principales.
líneas
líneas
líneas
vivmo
invtfija
vivinte
intera
gasto
idpers
redes
vivord
Métod
a. 3 c
Lo lógEn escontrfacto
Segunexplic
Si en
s fijas
s adsl
s fijas en vivie
ovil
a
er
anu
o i+d sobre pib
s
sloc
denador
do de extracci
componentes e
gico es que ste caso, seribuyen más r).
ndo compocado por el e
puntuacione
Matriz de co
enda
b
ión: Análisis d
extraídos
todas las va cumple, y al desarroll
nente: hay esfuerzo en g
es señalo lo s
mponentesa
Compo
1 2
,759
,747
,551
,827
,714
,958
,910
,704
,716
,720
,971
de componente
riables tengaademás todo tecnológic
valores neggasto tecnoló
siguiente:
onente
2 3
-,075
-,562
,427
-,141
-,207
-,041
,049
,621
,658
-,527
-,028
es principales
an signo posdos los valoco (aquéllas
gativos y poógico.
,569
,190
,614
-,474
,281
-,072
-,196
-,183
-,102
-,116
-,193
s.
sitivo en el pres son altoque tienen
ositivos. En
primer factoros. Aquí vemun índice m
este caso,
r (componenmos qué varayor en el p
parece que
nte 1). riables primer
e está
En la orden
Madr
Catal
PVasc
Nava
Balea
Aragó
Cana
Valen
Canta
Astur
CLeó
Rioja
Anda
Murc
Galic
Extre
CMan
TEOR
X = va
d*U =
Los dmateel de En octransoblicinter
vista de datnado de may
rid 2
uña 1
co 1
rra 0
ares 0
ón 0
rias 0
ncia ‐0
abria ‐0
rias ‐0
n ‐0
‐0
lucí ‐0
cia ‐0
ia ‐1
emadura ‐1
ncha ‐1
RÍA: Fórmula
ariable obse
= especificid
distintos méemáticos dee componen
casiones lossformando cuos (o bienrpretación p
tos obtengo yor a menor
,08286
,57451
,05949
,89640
,64259
,47781
,25690
0,08471
0,15925
0,44177
0,54306
0,59201
0,60129
0,91920
1,07343
1,28355
1,29229
a del análisis
rvada
ad
étodos de ee derivar lasntes princip
s factores solas cargas (n rotando lopráctica es m
los valores según el fact
‐0,10528
‐0,22830
1,37128
1,91176
‐2,46325
0,04403
‐1,29699
‐0,17162
‐0,53931
0,24642
0,68030
0,79865
‐0,37489
‐0,24463
0,87715
‐0,44066
‐0,06467
factorial
xtracción fas cargas a paales.
on ortogonel peso de cos ejes, dejamás sencilla
de los 3 facttor 1)
‐0,729
0,443
‐0,529
‐0,023
0,817
1,408
0,487
‐0,961
‐0,807
0,119
0,988
0,845
‐1,322
‐2,408
0,519
0,169
0,985
actorial corrartir de las
ales (perpecada variabando los faca.
tores para ca
981
35
976
371
55
09
20
148
765
05
59
58
211
852
26
07
28
responden correlacion
ndiculares)le en cada ftores ortog
ada Comunid
a distintos mes. El princi
. Pueden rofactor), cononales). De
dad: (esto y
métodos ipal método
otarse, nvirtiéndoloe esta forma
a está
o es
s en a, su
La coLa reuna asimp
Aplic
Si pulvaria
Matrcoefictamb
KMOpartiracept
orrelación pegresión ofranálisis factple muy alta
cación en SP
lsamos sobreble (marcand
iz de correlcientes. Si qubién “niveles
: Da una ider del cual setable.
parcial miderece resultatorial, es nea.
PSS (archiv
e “descripciodo “descript
laciones: noueremos comde significac
a de lo que ea válido. Lo
e la correlacdos en funcecesario que
o ejemplo:
ones”, nos daivos univaria
os da las remprobar queción”.
puede serviros autores d
ción entre Xción de la coe la correlac
Developme
a la opción dados).
elaciones ene las variable
r o no un anáicen que a p
X1 y X2, no correlación pción parcial
nt Exercise)
de calcular d
ntre variablees están corr
álisis factoriapartir de 0,7
ompartido parcial. Parasea escasa
escriptivos b
es. Lo normrelacionadas,
al. No hay un7 es bueno,
con X3 (ruida poder hacy la correla
básicos sobre
mal es marca, se puede m
n valor concy entre 0,3
do). cer ación
e cada
ar los marcar
reto a y 0,7
Anti‐ique e
En es
“Extrmás c
Marc
Extra
‐
Esto rotar
Rotac
En el
Puntu
imagen: Mates mejor elim
ste análisis d
acción”: en ecomún.
camos matriz
er: (aquí ele
Basado eoriginalespor ejemque 5 var
tiene sentid.
ción:
primer anál
uaciones:
triz que conminar del aná
e ejemplo, m
este caso co
z de correlac
gimos la can
en autovalos tienen un v
mplo, marcamriables.
do cuando q
isis no se rot
tiene las coálisis. Esto ta
marcamos: co
mo método
ciones, soluci
ntidad de fac
r (cantidad valor = 1, pormos 5, extra
queremos ro
ta.
rrelaciones ambién pued
oeficientes,
utilizaremos
ión factorial
ctores que qu
de varianzar lo que es lóaería autova
otar, para qu
parciales. Vede verse en la
KMO y anti‐i
s el de comp
sin rota, y gr
ueremos que
a que contiógico extraerlores que a
ue SPSS sep
eremos si haa matriz de c
magen.
ponentes prin
ráfico de sed
e extraiga)
ene el factor autovaloresporten la m
a cuántos fa
ay alguna vacargas.
ncipales, que
dimentación
or). Las vars mayores d
misma inform
actores tien
ariable
e es el
.
riables e 1. Si
mación
e que
Se puestemguard
Opcio
RESU
Ademsedimexplic
ueden guardmos acercánda una comb
ones:
ULTADO:
más de las mentación, qcado por cad
ar las puntundonos al finbinación linea
tablas inicique no es mda factor.
aciones factnal del análal de las vari
ales, me samás que la r
toriales de caisis. Cuandoiables.
ale, tras la representaci
ada extraccióo se guarda
varianza toón gráfica d
ón. Sólo guaun factor c
otal explicaddel porcenta
ardaremos cucomo variab
da, el gráficaje de la va
uando ble, se
co de rianza
Matriz de componentesa
Componente
1 2 3 4 5 6 7 8
Inmigration rate (as % of
Population) 2005
,536 ,550 ,328 -,042 -,146 ,118 ,321 ,0
Stock of refugees (abroad)
by country of origin
-,067 ,127 ,546 -,672 ,274 -,313 -,114 ,1
Remittances inflows total
(US$ millions)
,076 -,449 -,223 -,322 ,509 ,347 ,502 -,0
International Covenant on
Civil and Political Rights
(1966)
-,273 ,650 -,298 ,132 ,225 ,168 ,096 ,5
Convention on the Rights of
the Child (1989)
,139 ,674 -,178 -,011 ,452 -,002 -,219 -,4
Life expectancy at birth
(2007)
,841 -,154 -,182 -,003 ,097 -,203 -,010 ,1
Adult literacy ratea (% aged
15 and above) 1999–2007
,764 -,107 -,069 ,250 ,320 -,185 -,175 ,1
Combined gross enrolment
ratio in education (%) 2007
,847 -,218 -,052 ,142 ,166 -,161 -,160 ,0
GDP Percapita: Highest
value in the period 1980–
2007 (2007 PPP US$a)
,814 ,243 ,096 -,023 -,137 ,182 ,065 -,1
Urban population (% of total) ,757 -,022 ,270 ,136 ,010 -,060 ,249 ,0
Average annual change in
consumer price index (%)
1990-2007
-,204 -,194 ,606 ,367 ,301 ,492 -,268 ,0
Share of income or
expenditure (%) Richest 10%
-,441 ,060 ,257 ,456 ,166 -,415 ,482 -,1
Public expenditure on health
per capita PPP US$ 2006
,763 ,043 ,034 -,101 -,225 ,260 ,042 -,0
Método de extracción: Análisis de componentes principales.
a. 12 componentes extraídos
Por lo general, las variables que tienen un bajo componente en el primer factor, tienen alto componente en el segundo, y viceversa. Así, podemos hacer una interpretación sobre el significado de cada factor. De esta forma, podríamos llamar desarrollo económico al primer factor, y derechos al segundo. Para poder argumentar esto, necesitamos probar que estos dos factores son independientes.
Matriz de componentes rotadosa
Componente
1 2 3 4 5 6 7 8
Inmigration rate (as % of
Population) 2005
,108 ,929 ,151 -,035 -,044 ,066 ,105 -,0
Stock of refugees (abroad)
by country of origin
-,051 ,048 -,025 -,004 ,019 -,031 ,029 ,0
Remittances inflows total
(US$ millions)
,041 -,060 ,016 -,033 ,000 -,044 -,046 ,9
International Covenant on
Civil and Political Rights
(1966)
-,125 ,050 -,060 ,044 -,029 ,970 ,149 -,0
Convention on the Rights of
the Child (1989)
,060 ,095 ,011 -,020 -,044 ,144 ,979 -,0
Life expectancy at birth
(2007)
,638 ,123 ,169 -,171 -,190 -,102 -,003 ,0
Adult literacy ratea (% aged
15 and above) 1999–2007
,958 ,155 ,086 -,069 ,011 -,030 ,059 ,0
Combined gross enrolment
ratio in education (%) 2007
,807 -,043 ,243 -,116 -,046 -,155 ,025 ,0
GDP Percapita: Highest
value in the period 1980–
2007 (2007 PPP US$a)
,352 ,412 ,369 -,150 -,055 -,070 ,113 -,0
Urban population (% of total) ,373 ,288 ,196 -,025 ,002 -,114 -,010 ,0
Average annual change in
consumer price index (%)
1990-2007
-,042 -,039 -,046 ,049 ,993 -,027 -,043 ,0
Share of income or
expenditure (%) Richest 10%
-,143 -,039 -,141 ,972 ,052 ,044 -,020 -,0
Public expenditure on health
per capita PPP US$ 2006
,281 ,191 ,882 -,183 -,061 -,073 ,006 ,0
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Varimax con Kaiser.
a. La rotación ha convergido en 7 iteraciones.
Esto fuerza los valores extremos, para poder interpretarlo más fácilmente. (Esto es lo que señalamos como “Varimax”). Es una rotación ortogonal.
Ejercicio: Ejerciciofactorial.sav
1. Guardar como un indicador las variables de gobernanza (IG1 a IG6) 2. Ídem para las variables de liberalización económica (ILE) 3. Hacer un gráfico que relacione los dos índices
1. El resultado de la gobernanza es un solo factor que sale muy fácilmente. 2. Para la liberalización económica, hay que fijarse en que hay muchos países sin valor en
la variable. El resultado son dos factores.
Varianza total explicada
Compo
nente
Autovalores iniciales
Sumas de las saturaciones al cuadrado de la
extracción
Total % de la varianza % acumulado Total % de la varianza % acumulado
1 3,314 47,336 47,336 3,314 47,336 47,336
2 1,086 15,508 62,844 1,086 15,508 62,844
3 ,910 12,995 75,839
4 ,624 8,920 84,759
5 ,447 6,384 91,142
6 ,350 5,001 96,143
7 ,270 3,857 100,000
Método de extracción: Análisis de Componentes principales.
Observando las componentes principales:
Matriz de componentesa
Componente
1 2
ILE: Tamaño del gobierno ,209 ,872
ILE: Marco legal y derechos
de propiedad
,828 -,295
ILE: Entorno monetario ,773 -,168
ILE: Libertad para comerciar
internacionalmente
,776 -,102
ILE: Regulación A ,706 ,038
ILE: Regulación B ,518 ,444
ILE: Regulación C ,787 ,019
Método de extracción: Análisis de componentes
principales.
Matriz de componentesa
Componente
1 2
ILE: Tamaño del gobierno ,209 ,872
ILE: Marco legal y derechos
de propiedad
,828 -,295
ILE: Entorno monetario ,773 -,168
ILE: Libertad para comerciar
internacionalmente
,776 -,102
ILE: Regulación A ,706 ,038
ILE: Regulación B ,518 ,444
ILE: Regulación C ,787 ,019
Método de extracción: Análisis de componentes
principales.
a. 2 componentes extraídos
Vemos que el segundo factor está explicado por la variable “tamaño de
gobierno” casi únicamente. Por tanto, lo mejor es eliminar esa variable y repetir
el factorial. Resultado:
Varianza total explicada
Compo
nente
Autovalores iniciales
Sumas de las saturaciones al cuadrado de la
extracción
Total % de la varianza % acumulado Total % de la varianza % acumulado
1 3,283 54,717 54,717 3,283 54,717 54,717
2 ,944 15,740 70,457
3 ,632 10,538 80,994
4 ,481 8,021 89,015
5 ,351 5,846 94,861
6 ,308 5,139 100,000
Método de extracción: Análisis de Componentes principales.
Matriz de componentesa
Componente
1
ILE: Marco legal y derechos
de propiedad
,843
ILE: Entorno monetario ,773
ILE: Libertad para comerciar
internacionalmente
,775
ILE: Regulación A ,704
ILE: Regulación B ,510
ILE: Regulación C ,787
Método de extracción: Análisis de
componentes principales.
a. 1 componentes extraídos
Matriz de coeficientes para el cálculo de
las puntuaciones en las componentes
Componente
1
ILE: Marco legal y derechos
de propiedad
,257
ILE: Entorno monetario ,235
ILE: Libertad para comerciar
internacionalmente
,236
ILE: Regulación A ,214
ILE: Regulación B ,155
ILE: Regulación C ,240
Método de extracción: Análisis de
componentes principales.
Puntuaciones de componentes.
Esta última tabla me da las cargas de cada variable en el factor, para poder calcular el
valor del factor para cada país de forma manual.
3. Gráfico de dispersión entre gobernanza y liberalización económica:
Si en este gráfico quisiera diferenciar unos países de otros con colores, podría utilizar
por ejemplo la variable OCDE. Esta variable presenta un problema: tiene valores 1 para
los miembros, y valores perdidos para los no miembros. Hay, por tanto, que transformar
la variable. Para ello:
La va
en el
camb
cuad
ariable OCD
l mismo edi
bia. Despué
dro de defini
DE está cali
tor de gráfi
és, se modifi
ición del co
ificada com
cos, se puls
fica el tipo d
olor. El resu
mo métrica, c
sa sobre la v
de gráfico, y
ultado es el s
cuando real
variable con
y se arrastra
siguiente:
mente es no
n el botón de
la variable
ominal. Por
erecho y se
OCDE al
r ello,
Top Related