Post on 16-Apr-2017
ESTADÍSTICA I
Tablas de Distribución de Frecuencias Bivariadas. Distribución
de Frecuencias marginales y Condicionales. Media Aritmética
Marginal. Covarianza
Ms. Ylder Helí Vargas Alva
CUADRO N° 01
NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD
CUADRO N° 02
NUMERO DE ESTUDIANTES SEGUN ESTADO ACTIVIDAD Y TURNO QUE ASISTEN
Supongamos que se toma una muestra de tamaño
n de una población y que se está investigando, o
se desea estudiar, dos características de la misma.
Sean estas características X e Y. Siguiendo los
procedimientos habituales, la Muestra se divide en
• r clases Ai para la variable X
• s clases Bj para la variables Y
Existirán elementos que pertenecerán simultánea-
mente a AiBj. Los datos los podemos ordenar en
una tabla o matriz llamada Tabla de Contingencia
Estadística Bivariada
Y B1 B2 ..... Bj ..... Bs Total
A1 n11 n12 ..... n1j ..... n1s n1
A2 n21 n22 ..... n2j ..... n2s n2
Ai ni1 ni2 ..... nij ..... nis ni
Ar nr1 nr2 ..... nrj ..... nrs nr
Total n1 n
2 ..... nj ..... n
s n
X
n
= n_
Tabla de Contingencia
Y B1 B2 ..... Bj ..... Bs Total
A1 f11 f12 ..... f1j ..... f1s f1
A2 f21 f22 ..... f2j ..... f2s f2
Ai fi1 fi2 ..... fij ..... fis fi
Ar fr1 fr2 ..... frj ..... frs fr
Total f1 f
2 ..... fj ..... f
s f
X
f
= 1_
Tabla de Contingencia
Notación:
fij := frecuencia conjunta = fr(xi,yj)
fi = = frecuencia marginal =
f j = = frecuencia marginal =
fi/j = = frecuencia condicional =
j
ijf j
iji xyx )(),( rr ff
i
ijf i
jji yyx )(),( rr ff
j
ij
f
f
)(
),()/(
j
ji
jiy
yxyx
r
r
rf
ff
Estadística Bivariada
s
j
iji nn1
Frecuencia Absoluta de la clase Ai; para i= 1, ,2, ... ,r(Independiente de la clases Bj a la que estén asociadas
Suma de los valores de la fila i-ésima )
r
i
ijj nn1
Frecuencia Absoluta de la clase Bj; para j= 1, ,2, ... ,s(Independiente de las clases Ai a la que estén asociadas.
Suma de los valores de la columna j-ésima)
nij Frecuencia Absoluta de la clase conjunta AiBj.(Valor observado en la celda (i,j) de la Tabla de Contingencia)
fij nij
nFrecuencia Relativa
“conjunta” de la clase
conjunta correspondiente a
la intersección de Ai y Bj.
s
j
ijf1
r
i 1
1
Tabla de Contingencia
Para frecuencias relativas , i = 1,....,r se tiene:
Además se verifica que:
s
j
iji ff1
(Suma de los valores de la fila i-ésima
de la tabla de contingencia de frecuencias)
r
i
ijj ff1
n
niif
n
n j
jfj
ij
n
n
j
ij
i/jf
ff
Tabla de Contingencia
niif
nn j
jf
Frecuencia (relativa) “marginal” de la variable X, Conjunto de valores pertenecientes a las clases Ai,
considerandolas independientemente de las calses Bj
Frecuencia (relativa) “marginal” de la variable Y, Conjunto de valores pertenecientes a las clases Bj,
considerandolas independientemente de las calses Ai
Dado el experimento anterior, cuando sólo interesa conocer la
frecuencia de ocurrencia de cada una de las variables por separado
se habla de Frecuencia Marginal de la variable
n
Frecuencia Marginal
Una tela se clasifica en tres categorías A, B y C según cantidad y
severidad de pequeñas imperfecciones. La empresa tiene 5
telares, en un mes dado de producción se registraron los
siguientes datos.
# piezas de tela en la clasificación
Telar A B C Marginal
1 185 16 12 213
2 190 24 21 235
3 170 35 16 221
4 158 22 7 187
5 185 22 15 222
Marginal 888 119 71 1078
Ejemplo
Tabla de Contingencia
Se dice que X es independiente de Y si las frecuencias
condicionales de X/Y son todas iguales; es decir, no
dependen de la clase condicionante, esto es
fi/1 = fi/2 = fi/3 = = fi/s = fi
A
i = 1, 2, 3, ... , r
i1n
1n
i2n
2n
i3n
3n
isn
Sn
i1n
1n
i2n
i3n
isn
2n 3n sn
+ +
+ +
+ +....
+ +....i
n
n
....
....
fi
ii/j ff j ffj/i
ji/jij fff ij if jff
Luego similarmente
j
i/j fijf
fComo
Independencia Estadística
ijn
jn
j
i/jf
ijff
• Cuando se “pregunta” por la frecuencia relativa de una de las varia-
bles, digamos X, restrigida a los elementos observados de una clase
dada de la otra; esto es, estudiar el comportamiento de una variable
dado un valor fijo de la otra.
Frecuencia (relativa) de la variable X en la
clase conjunta AiBj, “dado” que sólo nos
interesa respecto a lo observado en la clase Bj
de la variable Y; para i = 1, 2, .., r
f1/j, f2/j, f3/j, ... , fr/j
Constituye la distribución de frecuencia relativa
condicional de la variable X dada la clase Bj de
la variable Y.
Nótese que se trabaja “condicionado” sobre un
tamaño de muestra “reducido” al número de
observaciones de la clase Bj dada
Frecuencia Condicional
Notación:
Análogamente, se tiene:
fj/i = = frecuencia condicional =
i
ij
f
f
)(
),()/(
i
ji
ijx
yxxy
r
r
rf
ff
Independencia Estadística
X e Y son variables estadísticamente independientes ssi:
ó
ó
)()/( jij yxy rr ff )()/( iyi xyx rr ff
ii/j ff j ffj/i
Estadística Bivariada
Independencia Estadística
como ij/iij fff ijij fff
Asociación de Variables
Datos no agrupados Cov(x,y) =
Datos agrupados : Cov(x,y) =
Coeficiente de Correlación = r =
))((1
yyxxn
ii
))(( yyxx ii if
Cov (x,y)
Sx Sy
Estadística Bivariada
Fallas Anuales
Temperatura 120 140 160 MarginalAverías
2 20 15 10 45
3 12 7 5 24
4 4 10 2 16
5 - 5 10 15
Marginal 36 37 27 100
Obtener :Distribuciones marginales
Distribuciones condicionales (4 averías), Media
y Varianza condicional
Ejercicio
Fallas Anuales
Temperatura 120 140 160 MarginalAverías
2 0,20 0,15 0,10 0,45
3 0,12 0,07 0,05 0,24
4 0,04 0,10 0,02 0,16
5 0 0,05 0,10 0,15
Marginal 0,36 0,37 0,27 1,00
fj/4 ={ 2/8; 5/8; 1/8} Xj/4 =137,5
Vj/4= 2/8(120-137,5)2 +5/8(140-137,5)2
+1//8(160-137,5)2 =
Ejercicio
Curvas de Regresión
X
Y
x , y son variables independiente y dependiente
respectivamente. Además una variable estadística que
representa el error.
Los parámetros 0 y 1 pueden ser estimados a partir de
los datos {(xi , yi)}i=1,...,n mediante método de mínimos
cuadrados.
Entonces
xy 10
iiiii xyyye 10 ˆˆˆ Sea ;
Curvas de regresión (Lineal)
x
y
x: variable independiente y
y : variable dependiente
: una variable estadística que representa el error.
xmx 10
xy 10
Modelo Estadístico (Lineal)
x
y
xy 10
1
0
Modelo Estadístico (Lineal)
x
y xy 10
Los parámetros 0 y 1 pueden ser estimados a partir de los datos
{(xi , yi)}i=1,...,n mediante método de mínimos cuadrados.
Esto es, minimizar el error cuadrático medio min S ei2
xmx 10ii
ei
x
xyi 10
y
Modelo Estadístico (Lineal)
n
i
n
i
iii xy1 1
2
10
2)(minmin
1010
n
i
iE eSC1
2
x
xy
SC
SC1̂ xy 10 ˆˆ
n
i
ix xxSC1
2)(
))(( yyxxSC i
n
i
ixy 1
n
i
ieVNE1
2
Límites de Clase
Ingreso Estandarizado
de una Población
Marca de
Clase
105
Consumo
Promedio
de Leche
Semanal
N° de
Personas
Encuestadas
0 - 100000 0,5 2,13 532
100001 - 200000 1,5 2,82 647
200001 - 300000 2,5 3,70 692
300001 - 400000 3,5 4,25 867
400001 - 500000 4,5 4,86 865
500001 - 600000 5,5 5,16 513
600001 - 800000 7,0 5,23 530
800001 - 1000000 9,0 5,57 181
x
Ejemplo: Curvas de Regresión
x y SCx SCy SCxy SCE
0,5 2,13 14,06 4,35 7,82 2,70 0,32
1,5 2,82 7,56 1,95 3,84 3,10 0,08
2,5 3,70 3,06 0,27 0,90 3,51 0,04
3,5 4,25 0,56 0,00 -0,03 3,91 0,11
4,5 4,86 0,06 0,42 0,16 4,32 0,30
5,5 5,16 1,56 0,89 1,18 4,72 0,19
7,0 5,23 7,56 1,03 2,79 5,33 0,01
9,0 5,57 22,56 1,84 6,44 6,14 0,32
34,0 33,72 57,00 10,74 23,10 33,72 1,374,25 4,215 4,215
1 0.4135965
0 2.4697149
y
x = y =S
Modelo Estadístico: Ejemplo
0.4135965=
SCx
1ˆSCxy
=
ˆˆ 2.4697149 x1y0 = =
SCxy= 23,10
SCx = 57,00
y
x
= 4,215
= 4,25
10,74
% de Ajuste del Modelo =
1 =1,37
= 0,872 87,2%SCE
SCy
Ejemplo
Ejemplo: Curvas de Regresión
t 0 1 2 3 4 5 6
V(t) 30 60 46 32 10 4 17
20 40 26 14 8
20 12
V(t) 25 40 46 29 12 6 17
Sea xt = sen t yt = V(t)
Luego y(t) = 0 + 1 xt + t
t
tt xyQ 2
10,
10,
)(min),(min1010
3,25ˆˆ10 xy 20
),cov(ˆ21
xS
yx
12762yS 45222
,)ˆ( tt yy
% de Ajuste del Modelo =
%%,ˆ
9810098012
2
y
t
S
e
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
a = 2.4697149
b = 0.4135965
Linear Fit:
Y = a + bx
Ajuste Lineal
Ajuste Logarítmico
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
Logarithm Fit:
Y = a + b*ln(x)
Ajuste Polinomial
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
Power Fit:
Y = a xb
a = 2.6890974
b = 0.3543629
Modelo Logístico
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
Logistic Model:
Y =a
1+b*e-cx
a = 5.6469463
b = 2.2230602
c = 0.55970905
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
Richard’s Model:
Y =a
1+b*e(b-cx)(1/d)
a = 5.6606384
b = 0.5984401
c = 0.5415778
d = 0.8782331
Modelo de Richard
Asociación Exponencial
Ingreso
Co
ns
um
o
0.1 1.7 3.3 4.9 6.6 8.2 9.8
6.02
5.32
4.61
3.90
3.19
2.48
1.78
Exponential Association (3):
Y = a (b - e-cx)
a = 4.6333776
b = 1.3115177
c = 0.2709334
Sea yi = h ( xi ) con i = 1,...,n
1. Lineales yi = axi + b
y = ax + b
Sy = a Sx
2. No lineales yi = h( xi )
y = h(x) + h”(x) SX2
Sy2 Sx
2 h’ (x)2
En particular
h(x) = ln x y = ln x - ( Sx2 / x2 )
Sy2 ( Sx
2 / x2 ) = CV 2
2
1
2
1
Transformaciones
Relaciones Linealizables
1. y = K x ln y = a0 + a1 ln x
2. y = K ( / x ) y = a0 a1 x-1
3. y = K ex ln y = a0 + a1 x
4. y = K e-/x ln y = a0 + a1 x-1
5. yt = K + cos t y = a0 + a1 xt
siendo xt = cos t
6. y() = y - 1 = a0 + a1 x
y-1 dy = a1 w = dy
dx dx
ln w = ln a1 + ( 1 - ) ln y
3. Box-Cox Transformaciones (1964)
h (x) = X() =
( x + m ) - 1 0 x > -m
ln ( x + m ) = 0 m > 0
Transformaciones
Sea yi = h ( xi ) con i = 1,...,n
1. Lineales 2. No lineales
• yi = a + bxi • y = a + b ln x
• y = a + bx • y = a e bx
• sy = b sx
3. Linealizables
• y = a x b ln y = ln a + b ln x
• y = a ( b / x ) y = a b x-1
• y = a e bx ln y = ln a + b x
• y = a e-b/x ln y = ln a - b x-1
• yt = a + b cos t y = a + b xt siendo xt = cos t
Transformaciones