02_inferencia_estadistica
-
Upload
francisco-reyes -
Category
Documents
-
view
17 -
download
0
description
Transcript of 02_inferencia_estadistica
-
INFERENCIA ESTADSTICA
SEMANA 2
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 2
NDICE APRENDIZAJES ESPERADOS ........................................................................................................... 3 INTRODUCCIN ............................................................................................................................. 3 1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA ................................... 3 2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS ........................................................... 6 3. VALOR CENTRAL .................................................................................................................... 6 4. PRIMER MOMENTO: ESPERANZA MATEMTICA .................................................................. 7 5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN ................................................................ 7 6. DISTRIBUCIN EXPONENCIAL ............................................................................................. 10 7. DISTRIBUCIN NORMAL ...................................................................................................... 12 8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA NORMAL ...................................... 16 COMENTARIO FINAL .................................................................................................................... 19 REFERENCIAS ............................................................................................................................... 20
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 3
VARIABLES ALEATORIAS CONTINUAS Y DISTRIBUCIONES
DE PROBABILIDAD CONTINUAS
APRENDIZAJES ESPERADOS
Identificar elementos que involucran distribuciones de probabilidad de variables
continuas.
Revisar resolucin de problemas que involucran esperanza, varianza de variables
aleatorias continuas y distribuciones de probabilidad de variables continuas.
INTRODUCCIN
Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo los
costos y los ingresos se presentan por medio de variables expresadas en cantidades decimales.
Adems, las medidas del tiempo, la distancia, la temperatura y el peso encajan en esta
categora. Estas variables se denominan variables continuas, ya que estn medidas en nmeros
reales.
Aunque en la realidad casi todas las variables en algn momento se redondean, es importante
que las variables aleatorias continuas y sus distribuciones de probabilidad sean buenas
aproximaciones en muchos problemas aplicados. Por lo tanto, estos modelos son muy
relevantes y constituyen excelentes instrumentos para las aplicaciones empresariales y
econmicas.
1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE
ALEATORIA
Si los valores o el rango de valores que puede tomar una variable aleatoria tienen una
probabilidad especfica o medida de probabilidad asociada contenida en un intervalo de
nmeros reales, entonces X es una variable aleatoria continua. La regla que asigna las medidas
de probabilidad se denomina distribucin o ley de probabilidad.
Si X es variable aleatoria contnua, la distribucin de probabilidad puede ser descrita por su
funcin de distribucin de probabilidad acumulada denotada por (Olea, 2011, p. 9):
XF x P X x para todo x
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 4
DEFINICIN:
Se llama soporte de X a todos los posibles valores que puede tomar la variable x (Olea, 2011, p.
9).
1 2 3, , ,...X nx x x x
Si X es una variable aleatoria continua, las probabilidades estn asociadas a intervalos de x.
En este caso se define la funcin de densidad Xf x tal que:
(1) b
Xa
P a X b f x dx
Y:
x
X XF x P X x f t dt
Con:
X Xd
f x F xdx
Notar que:
XP x X x dx f x dx
Fuente: Olea (2011, p. 13).
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 5
PROPIEDADES:
0XF y 1XF
0XF x para todo valor de x y es no decreciente.
XF x es continua para la derecha.
Para el caso continuo, la ecuacin (1) se puede escribir como (Olea, 2011, p. 13):
b a
X XP a X b f x dx f x dx
En el caso continuo, el soporte de x se transforma en un intervalo. Mientras que en el caso
discreto:
X i X ix b x ai i
P a X b p x p x
Es decir, para ambos casos:
X XP a X b F b F a
Ejemplo 1: Considere la carga ejercida de 100 kg sobre un punto al azar de una viga de largo 10
m (ver figura). La distribucin de probabilidad de la posicin de carga X se distribuye en forma
uniforme (0,10).
Cuya funcin densidad es constante en el intervalo [0,10] y cero en otro caso:
, 0 10
0,X
c xf x
en otro caso
Mientras que la funcin de distribucin acumulada est dada por:
0, 0
, 0 1010
1, 10
X
x
xF x x
x
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 6
Ejemplo 2: La vida til (T en horas) de mquinas de soldar no es totalmente predecible, pero
puede ser descrita por la distribucin exponencial la cual tiene la siguiente funcin de
densidad:
, 0
0,
t
T
e tf t
en otro caso
En que es una constante positiva.
2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS
Una variable aleatoria puede ser descrita por su funcin de distribucin de probabilidad o de
densidad, o bien por su funcin de distribucin de probabilidad acumulada. Sin embargo, en la
prctica la forma exacta no puede ser totalmente conocida.
En tales casos se requieren ciertas medidas:
Medidas de centralidad.
Medidas de dispersin.
Medidas de asimetras y otras.
3. VALOR CENTRAL
Del rango de los valores posibles de una variable aleatoria, el valor central tiene un inters
especial.
Dado que para cada valor existe una medida de probabilidad, el centro equivale a un promedio
ponderado.
Se define el valor esperado o esperanza o media de una variable aleatoria X a (Olea, 2011, p.
24):
,X X iE X x f x dx Caso continuo
Otras medidas de centralidad corresponden:
Moda: valor con mayor probabilidad. Si se trata de una funcin continua, se obtiene
maximizando la funcin, esto es, derivando e igualando a cero.
Mediana: valor central. Sea xmed el valor que toma la mediana, entonces:
1
2X medF x
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 7
En general, en distribuciones simtricas estos valores coinciden (media, mediana, moda).
Mientras que en distribuciones asimtricas difieren.
4. PRIMER MOMENTO: ESPERANZA MATEMTICA
La nocin del valor esperado como un promedio ponderado puede ser generalizada para
funciones de la variable aleatoria X.
Tambin puede ser necesario conocer la esperanza de una funcin determinada. Dada una
funcin g x , entonces el valor esperado de esta puede ser obtenido como:
,X iE g x g x f x dx Caso continuo
5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN
Ahora, interesa el nivel de dispersin del rango de los valores posibles de una variable
aleatoria, en este caso la medida de dispersin corresponde a la varianza de X, la cual se define
como:
2 22 ,X X X X iVar X E X X f x dx Caso continuo
En trminos de dimensionalidad, es conveniente utilizar la desviacin estndar, ya que la
varianza es una medida ficticia, pues las unidades en las cuales se expresa son cuadrticas (por
ejemplo aos2, pesos2, etc.), es decir:
X Var X
Si 0X , se puede calcular una medida de variabilidad que es adimensional llamada
coeficiente de variacin (c. o. v.).
XX
X
Ejemplo: Sea X una variable aleatoria cuya funcin de densidad dada por:
, 0, 0
0,
x
X
e x f x
en otro caso
Determine lo siguiente: valor esperado, mediana, varianza y c. o. v.
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 8
Solucin:
Para la esperanza:
X XE X x f x dx
0
x x e dx
Se define la siguiente variable auxiliar:
t x
dt dx
dtdx
0
1 t t e dt
Se integra por partes:
0 0
1 1t t tt e dt te e dt
0
1 t t te e
1
0 0 0 1
1
Para la mediana se sabe que:
1
2X medF x
Primero se determina la funcin acumulada:
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 9
x
X XF x f x dx
0
xt
XF x e dt
0
xt e
1 t e
1
12
xmedX medF x e
1
2
xmed e
1ln
2
xmed ln e
2 med ln x
2med
ln x
Para la varianza:
22Var X E X E X
Se calcula primero 2E X :
2 2 XE X x f x dx
2
0
x x e dx
Se integra por partes:
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 10
2 20 0
2x x xx e dx x e x e dx
2
0
2x x x e x e dx
Pero 1xx e dx
de acuerdo a lo calculado en la esperanza:
2
0
2 1x x e
Para el coeficiente de variacin:
2
1
11
XX
X
Con este ejemplo se ha demostrado los parmetros de la distribucin exponencial que a
continuacin se presentan.
6. DISTRIBUCIN EXPONENCIAL
En un proceso de Poisson el tiempo transcurrido entre la ocurrencia de eventos puede ser
descrito por una distribucin exponencial. Si T1 representa al tiempo pasado hasta la
ocurrencia del primer evento en un proceso de Poisson, el evento (T1 > t) implica que en el
intervalo (0, t) no ocurren eventos, es decir (Olea, 2011, p. 67):
0
1 00!
vt
vt
t
vt eP T t P X e
Esto quiere decir que la funcin de distribucin exponencial nace a partir del proceso de
Poisson.
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 11
Por lo tanto, la funcin de distribucin de probabilidad acumulada de T1 est dada por:
1 11 1 1t
TF t P T t P T t e
En la expresin anterior se conoce la funcin de distribucin exponencial acumulada.
Su funcin de densidad se obtiene como sigue:
1 1
t
T T
df t F t e
dt
Que corresponde a la funcin de densidad de una variable aleatoria con distribucin
exponencial.
Adems, esta distribucin tambin carece de memoria, es decir, lo que haya ocurrido con el
valor de la variable que se estudia en los intervalos de tiempo anteriores, no afecta el
resultado de la probabilidad en el intervalo de tiempo en que se est midiendo.
En resumen, una variable aleatoria X con distribucin exponencial de parmetro 0 , tiene
funcin densidad y de distribucin:
Mientras que su valor esperado y varianza es:
Ejemplo: Un motor tiene una vida til de X horas, que puede considerarse como una variable
continua con distribucin exponencial. Si la vida til esperada es de 50 horas y posee un costo
de 320 dlares. Si el motor dura menos de 70 horas se asigna una prdida de 110 dlares
adicionales al fabricante. Calcular el costo esperado.
Solucin:
Si X Vida til en horas de un motor.
50X exp con 1
50
C Costo del motor
Datos:
Costo por motor = US$ 320 si 70X
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 12
Costo + prdida = US$ 430 si 70X
El costo esperado ser la suma de los costos por su probabilidad:
70 70E C C x P X C x P X
Recordar que las probabilidades deben acumular a los percentiles, por lo tanto para
70P X se usa la propiedad de la probabilidad del complemento.
1 70 70E C C x P X C x P X
Se sabe que la distribucin exponencial acumulada tiene la forma:
1 1
70 7050 50320 1 1 430 1E C e e
Eliminando el parntesis interior:
1 1
70 7050 50320 1 1 430 1E C e e
1 1
70 7050 50320 430 1E C e e
78 91 323 96E C , ,
7. DISTRIBUCIN NORMAL
En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin
gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms
frecuencia aparece en fenmenos reales.
La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de
un determinado parmetro. Esta curva se conoce como campana de Gauss.
La importancia de esta distribucin radica en que permite modelar numerosos fenmenos
naturales, sociales y psicolgicos.
La funcin densidad de una variable aleatoria X con distribucin normal , es de la forma
(Santiago, 2006):
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 13
21
2
2
1,
2
x
Xf x e x
Con parmetro de localizacin y parmetro de escala o forma, tales que:
, 0
Para interpretar estos porcentajes obsrvese el siguiente ejemplo.
Si se registra la frecuencia cardiaca de 80 personas y si la media aritmtica de esta distribucin
fuera 80 pulsaciones por minuto y la desviacin estndar fuera de 10 pulsaciones por minuto,
entonces una persona cualquiera elegida al azar tendra un 68% de probabilidades de tener
entre 70 y 90 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a
una desviacin estndar de la media); o tendra un 95,5% de probabilidades de tener entre 60
y 100 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a dos
desviaciones estndar de la media); o tendra un 99,7% de probabilidades de tener entre 50 y
110 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a tres
desviaciones estndar de la media).
Un caso especial es cuando 0 y 1 . Este caso es conocido como distribucin normal
estndar.
2
21
2
x
Xf x e
La ventaja de estandarizar es que la funcin de probabilidad acumulada se encuentra tabulada
(las probabilidades ya estn calculadas). Esta funcin se denota por .
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 14
Sea S una variable aleatoria con distribucin normal estndar, cuya funcin de distribucin de
probabilidad acumulada est dada por:
2
21
2
xs
Ss F s e dx
PROPIEDADES:
1 1 1PS p p
1s s
Fuente: Olea (2011, p. 43).
Sea X una variable aleatoria normal , con funcin de distribucin acumulada XF . Para
dos valores dados a y b (con a < b) se tiene que (Olea, 2011, p. 42):
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 15
X XP a X b F b F a
Fuente: Olea (2011, p. 42).
Ejemplo: Durante una tormenta el drenaje de una comunidad se comporta como una variable
aleatoria normal con una media y desviacin estndar estimada de 1,2 y 0,4 millones de
galones diarios (mgd) respectivamente.
a) Si el sistema de drenaje de aguas pluviales fue diseado para soportar una capacidad
mxima de 1,5 mgd. Cul es la probabilidad de que el sistema colapse?
Solucin:
1,5 1 1,5P X P X
1 1,5X F
1,5 1,21
0,4
1 0,75
1 0,7734
0,2266
b) Cul es la probabilidad que el sistema deba soportar un drenaje entre 1,0 y 1,6 mgd?
Solucin:
1 1,6 1,6 1P X P X P X
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 16
1,6 1X X F F
1,6 1,2 1 1,2
0,4 0,4
1 0,5
1 1 0,5
0,8413 1 0,6915
0,8413 0,3085
0,5328
c) Cul es la carga de agua durante una tormenta que soporta el sistema de drenaje
correspondiente al percentil 90?
Solucin:
0,9P X x
1,20,9
0,4
X xP
0,9x
1,21,28
0,4
x
1,71 x
8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA
NORMAL
La distribucin binomial es una forma lmite de la distribucin de Poisson, cuando n es grande
y p es pequeo. De la misma forma, la distribucin normal es una forma lmite de la
distribucin binomial cuando n es grande y p no tiene un valor cercano a cero o a uno.
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 17
TEOREMA
Sea x una variable aleatoria binomial con media np y desviacin estndar 1np p . La
distribucin de la variable aleatoria tiende a la normal estndar conforme:
xZ
Recordar que la distribucin binomial tiene esperanza E x np y varianza 2 1np p .
Se reemplaza en la variable estandarizada:
1
x npZ
np p
Cuando el nmero de ensayos independientes n
Ejemplo: Supngase que el nmero de bits que se reciben de manera errnea en un canal de comunicacin digital puede modelarse con una variable aleatoria binomial. La probabilidad de
recibir un bits de manera errnea es 51 10 . Si se transmiten 16 millones de bits cul es la probabilidad que se presenten 150 errores?
Solucin:
Sea x Nmero de errores.
516 000 000 1 10x B . . ,
Se pide 150P x :
150 1 150P x P x
Si se resuelve como el modelo binomial:
150
16 000 0005 5
0
16 000 0001 10 1 10
x . . x
x
. .
x
0 772,
Si se resuelve como si se tratara de una distribucin normal, sabiendo que en este caso:
1
x npZ
np p
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 18
5
5 5
16 000 000 10150
16 000 000 10 1 01 1
x .x np
np p
.P x P
. .
5160
160 1 10
zx
P
0 79P z ,
Se aplican propiedades de la distribucin normal estndar:
0 79P z ,
Luego se busca en la tabla Normal Estndar:
0 785,
Observacin 1:
La aproximacin de la distribucin binomial a la normal es buena si se cumple que 5np y
1 5n p .
Observacin 2:
Correccin por continuidad:
En ocasiones la aproximacin normal de una probabilidad binomial se modifica con un factor
de correccin de 0,5 que mejora la aproximacin. Por ejemplo, si 2P X , como X es una
variable discreta, entonces se cumplir que 2 5P X , . De la misma manera, si 2P X ,
entonces 1 5P X , .
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 19
COMENTARIO FINAL
Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo, los
costos y los ingresos pueden presentarse como variables aleatorias continuas.
Las variables aleatorias continuas y sus distribuciones son buenas aproximaciones en muchos
problemas aplicados. Por lo tanto, estos modelos son muy importantes y constituyen
excelentes instrumentos para las aplicaciones empresariales y econmicas.
-
ESTE DOCUMENTO CONTIENE LA SEMANA 2 20
REFERENCIAS
Canavos, G. (1984). Probabilidad y estadstica, aplicaciones y mtodos. 1 edicin. Estados
Unidos: McGraw-Hill.
Montgomery, D. & Runger, G. (1998). Probabilidad y estadstica aplicadas a la ingeniera. 1
edicin. Arizona, Estados Unidos: McGraw-Hill.
Newbold, P.; Carlson, W. & Thorne, B. (2009). Estadstica para la administracin y economa.
6 edicin. Nueva Jersey, Estados Unidos: Pearson, Prentice-Hall.
Olea, R. (2011). Estadstica para ingeniera. Apuntes Curso de verano TAV. Chile. Pontificia
Universidad Catlica de Chile.
Santiago, J. (2006). Apuntes Curso de estadstica II. Santiago, Chile: Universidad de Santiago de
Chile.
PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE: IACC (2013). Variables aleatorias continuas y distribuciones de probabilidad continuas.
Inferencia estadstica. Semana 2.