Post on 07-Sep-2018
Análisis estadístico básico (II)
Magdalena Cladera Munarmcladera@uib.es
Departament d’Economia AplicadaUniversitat de les Illes Balears
REFERENCIAS
Alegre, J. y Cladera, M. (2003). Introducción a la Estadística Descriptiva para Economistas. Materials Didàctics UIB, 101. Palma de Mallorca.
Newbold, P. (1997). Estadística para los Negocios y la Economía. Prentice-Hall. Madrid.
Peña, D. y Romo, D. (1997). Introducción a la Estadística para las Ciencias Sociales. McGrawHill. Madrid.
Pardo, A. y Ruíz, M. A. (2001). SPSS 10.0. Guía para el análisis de datos. Accesible en: http://www.uca.es/serv/ai/formacion/spss/Inicio.pdf.
Pérez, C. (2001). Técnicas Estadísticas con SPSS, Prentice Hall, Madrid.
Instrumentos estadísticos:
Relación lineal entre dos variables cuantitativas. Representación gráfica.Medidas de relación lineal: Covarianza i Coeficiente de
correlación de Pearson.Ajuste lineal entre dos variables. Interpretación gráfica y
bondad de ajuste lineal.
Relación lineal entre variables cuantitativas
Relación lineal: relación entre dos variables que puede representarse aproximadamente como una línea recta.
La asociación no implica causalidad.
Dos tipos de asociación lineal: positiva y negativa.
Relación lineal entre variables cuantitativas
Gráfica 1. Relación lineal exacta positiva.
X
3210-1-2-3Y
3
2
1
0
-1
-2
-3
Gráfica 2. Relación lineal exacta negativa.
X
3210-1-2-3Y
3
2
1
0
-1
-2
-3
Relaciones no lineales
Relación lineal entre variables cuantitativas
Gráfica 3.
X
3210-1-2-3Y
10
0
-10
-20
-30
Gráfica 4.
X
3210-1-2-3Y
40
20
0
-20
-40
-60
-80
-100
Relaciones lineales
Relación lineal entre variables cuantitativas
Gráfica 1. Relación lineal exacta positiva.
X
3210-1-2-3Y
3
2
1
0
-1
-2
-3
Gráfica 2. Relación lineal exacta negativa.
X
3210-1-2-3Y
3
2
1
0
-1
-2
-3
Gráfica 5. Relación lineal positiva no exacta.
X
6000500040003000200010000-1000
Y
6000
5000
4000
3000
2000
1000
0
-1000
-2000
Estadístico de covarianza
Covarianza positiva (Sxy>0) ⇒ Asociación lineal positiva.
Covarianza negativa (Sxy<0) ⇒ Asociación lineal negativa.
Covarianza nula (Sxy=0) ⇒ Asociación lineal inexistente.
Relación lineal entre variables cuantitativas
( )( )YX
n
YX
n
yYxXs
n
iii
n
iii
XY −=−−
=∑∑== 11
Estadístico de covarianza positivo
Relación lineal entre variables cuantitativas
Figura 5.1.
X
131211109876543210
Y
17161514131211109876543210
Estadístico de covarianza nulo
Relación lineal entre variables cuantitativas
Figura 5.6.
X
3210-1-2-3-4
Y
1,5
1,0
,5
0,0
-,5
-1,0
Covarianza. Ejemplo.
Relación lineal entre variables cuantitativas
X
2220181614121086420
Y
24
22
20
18
16
14
12
10
8
6
4
2
0
i X i Yi iiYX 1 12 14,55 174,6 2 10 12,85 128,5 3 11 13,3 146,3 4 13 13,53 175,89 5 15 18,18 272,7 6 14 18,94 265,16 7 12 16,11 193,32 8 11 13,82 152,02 9 19 23,53 447,07
10 20 23,02 460,4 Suma 137 167,83 2415,96Media 13,7 16,783
( )( )671178316713
1096241511 ,,·,,YX
n
YX
n
yYxXs
n
iii
n
iii
XY =−=−=−−
=∑∑==
Por tanto, existe asociación positiva entre ambas variables.
Estadístico de covarianza
Problemas del estadístico de covarianza como medida de asociación:
No tiene un límite superior, con respecto al cual considerar si el grado de asociación.
La covarianza depende de las unidades en que están medidas las variables.
Relación lineal entre variables cuantitativas
Estadístico de covarianza
Propiedades de la covarianza:
Si se suma a la variable X una constante b y a la variable Y una constante c, la covarianza entre las dos nuevas variables transformadas será igual a la covarianza original.
Si se multiplica la variable X por una constante b y la variable Y por una constante c, la covarianza entre las dos nuevas variables transformadas será igual a la covarianza original multiplicada por las constantes bc.
Relación lineal entre variables cuantitativas
( ) ( )( ) ( ) ( )( ) ( )( )
n
yYxX
n
cycYbxbXs
n
iii
n
iii
XY
∑∑==
−−=
+−++−+= 11
( )( ) ( )( )
n
yYxXbc
n
yccYxbbXs
n
iii
n
iii
XY
∑∑==
−−=
−−= 11
Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)
Substituyendo la covarianza y las desviaciones típicas:
Relación lineal entre variables cuantitativas
YX
XYXY ss
sr =
( )( )
( ) ( ) ∑∑
∑
∑∑
∑
==
=
==
=
−−
−=
−−
−−==
n
ii
n
ii
n
iii
n
ii
n
ii
n
iii
YX
XYXY
ynYxnX
yxnYX
yYxX
yYxX
sssr
1
22
1
22
1
1
2
1
2
1
Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)
Asociación lineal positiva ⇒ Sxy>0 ⇒ rxy>0
Asociación lineal negativa ⇒ Sxy<0 ⇒ rxy<0
Ausencia de asociación lineal ⇒ Sxy=0 ⇒ rxy=0
El coeficiente de correlación toma valores entre –1 y 1.
rxy = 1 Asociación lineal exacta de tipo positivo.
rxy = -1 Asociación lineal exacta de tipo negativo.
rxy = 0 Ausencia de asociación lineal.
Relación lineal entre variables cuantitativas
YX
XYXY ss
sr =
Coeficiente de correlación lineal simple (Coeficiente de correlación de Pearson)
Propiedades del coeficiente de correlación:
El valor del coeficiente de correlación entre dos variables no se modifica si una (o ambas) variables se multiplica por una constante.
El coeficiente de correlación toma valores en el intervalo –1 y 1. Los valores máximo y mínimo se alcanzan cuando se da una relación lineal exacta entre las dos variables, de tipo positivo o de tipo negativo, respectivamente.
Valores del coeficiente próximos a 1 indican la existencia de una asociación positiva fuerte entre las variables; valores cercanos a –1 indican la existencia de una asociación negativa fuerte entre las variables; valores cercanos a cero señalan la ausencia de una asociación lineal.
Relación lineal entre variables cuantitativas
Coeficiente de correlación. Ejemplo.
Relación lineal entre variables cuantitativas
X
2220181614121086420
Y
24
22
20
18
16
14
12
10
8
6
4
2
0
i X i Yi iiYX 2iX
2iY
1 12 14,55 174,6 144 211,70 2 10 12,85 128,5 100 165,12 3 11 13,3 146,3 121 176,89 4 13 13,53 175,89 169 183,06 5 15 18,18 272,7 225 330,51 6 14 18,94 265,16 196 358,72 7 12 16,11 193,32 144 259,53 8 11 13,82 152,02 121 190,99 9 19 23,53 447,07 361 553,66
10 20 23,02 460,4 400 529,92 Suma 137 167,83 2415,96 1981 2960,12Media 13,7 16,783
SXY = 11,67
SX = 23371310
1981 221
2
,,Xn
Xn
ii
=−=−∑=
SY = 7937831610
122960 221
2
,,,Yn
Yn
ii
=−=−∑=
950793233
6711 ,,·,
,ss
srYX
XYXY ===
Por tanto, existe asociación positiva muy fuerte entre ambas variables.
Objetivo: analizar las relaciones de dependencia entre una variable dependiente y un conjunto de variables explicativas.
Especificación:
Relación lineal entre variables cuantitativas
Yi = f(X1i, X2i, X3i, ..., Xki, β)
Yi = β1 + β2X2i + β3X3i + β4X4i + ... + βkXki + ui
Y: variable dependiente o endógena.
Xj: variables explicativas, exógenas o regresores.
βj: parámetros, coeficientes de regresión.
u: término de error, término de perturbación o perturbación aleatoria.
Modelo Simple: Yi = β1 + β2Xi + ui
Modelo Múltiple: Yi = β1 + β2X2i + β3X3i + β4X4i + ... + βkXki + ui
Forma funcional lineal
Ejemplo. Función de consumo sanitario
Relación lineal entre variables cuantitativas
0
1000
2000
3000
4000
5000
25000 35000 45000 55000
Con
sum
o
Renta
Función de consumo sanitario
Observaciones muestrales
Ci = α + βRi + ui
E(Ci) = α + βRi
Ejemplo. Función de consumo sanitario
Relación lineal entre variables cuantitativas
Ci= 300,72+0,0677·Ri
0
1000
2000
3000
4000
5000
25000 30000 35000 40000 45000 50000 55000
Co
nsum
o
Renta
Función de consumo sanitario
Observaciones muestrales Lineal (Observaciones muestrales)
Ci = α + βRi + ui
E(Ci) = α + βRi
Obtención de α y β estimados por Mínimos Cuadrados Ordinarios (MCO)
Yi = α + βXi + ui
Relación lineal entre variables cuantitativas
50556065707580859095
100
15 20 25 30 35
X
Y
ei
ei
xˆyˆ βα −=( )( )
( ) xSSxy
xnX
yxnYX
xX
yYxXˆ
n
i
n
iii
n
ii
n
iii
i
22
1
2
1
1
2
1 =−
−=
−
−−=
∑
∑
∑
∑
=
=
=
=β
Obtención de α y β estimados por Mínimos Cuadrados Ordinarios (MCO)
Yi = α + βXi + ui
Relación lineal entre variables cuantitativas
y = 11,364+2,8155x
50556065707580859095
100
15 20 25 30 35
X
Y
ei
ei
xˆyˆ βα −=( )( )
( ) xSSxy
xnX
yxnYX
xX
yYxX
n
i
n
iii
n
ii
n
iii
i
22
1
2
1
1
2
1ˆ =−
−=
−
−−=
∑
∑
∑
∑
=
=
=
=β
Ejemplo. Función de consumo sanitario
Relación lineal entre variables cuantitativas
0
1000
2000
3000
4000
5000
25000 35000 45000 55000
Con
sum
o
Renta
Función de consumo sanitario
Observaciones muestrales Lineal (Observaciones muestrales)
72300,ˆ =α 06770,ˆ =β
Muestra de 25 famílias:
Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000
Ejemplo. Función de consumo sanitario
Relación lineal entre variables cuantitativas
Ci= 300,72+0,0677·Ri
0
1000
2000
3000
4000
5000
25000 35000 45000 55000
Con
sum
o
Renta
Función de consumo sanitario
Observaciones muestrales Lineal (Observaciones muestrales)
72300,ˆ =α 06770,ˆ =β
Muestra de 25 famílias:
Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000
Bondad de ajuste
Relación lineal entre variables cuantitativas
A) B)
( )( )∑∑
−
−== 2
222
yYxXˆ
VTVER
i
iβ
10 2 ≤≤R
OEXPLICATIV es NOmodeloElR ⇔=02
Y de variación la todaEXPLICAmodeloElR ⇔=12
Ejemplo. Función de consumo sanitario
Relación lineal entre variables cuantitativas
Ci= 300,72+0,0677·RiR2 = 0,6169
0
1000
2000
3000
4000
5000
25000 35000 45000 55000
Con
sum
o
Renta
Función de consumo sanitario
Observaciones muestrales Lineal (Observaciones muestrales)
72300,ˆ =α 06770,ˆ =β
Muestra de 25 famílias:
Consumo Renta 2275 30000 3049 30000 2050 30000 2362 30000 2457 30000 2850 35000 2499 35000 2763 35000 2869 35000 2177 35000 3184 40000 3013 40000 3464 40000 2295 40000 2224 40000 3196 45000 3617 45000 3084 45000 2951 45000 4006 45000 3977 50000 3288 50000 4085 50000 3547 50000 3907 50000