02_inferencia_estadistica

INFERENCIA ESTADSTICA

SEMANA 2

ESTE DOCUMENTO CONTIENE LA SEMANA 2 2

NDICE APRENDIZAJES ESPERADOS ........................................................................................................... 3 INTRODUCCIN ............................................................................................................................. 3 1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA ................................... 3 2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS ........................................................... 6 3. VALOR CENTRAL .................................................................................................................... 6 4. PRIMER MOMENTO: ESPERANZA MATEMTICA .................................................................. 7 5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN ................................................................ 7 6. DISTRIBUCIN EXPONENCIAL ............................................................................................. 10 7. DISTRIBUCIN NORMAL ...................................................................................................... 12 8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA NORMAL ...................................... 16 COMENTARIO FINAL .................................................................................................................... 19 REFERENCIAS ............................................................................................................................... 20


VARIABLES ALEATORIAS CONTINUAS Y DISTRIBUCIONES

DE PROBABILIDAD CONTINUAS

APRENDIZAJES ESPERADOS

Identificar elementos que involucran distribuciones de probabilidad de variables

continuas.

Revisar resolucin de problemas que involucran esperanza, varianza de variables

aleatorias continuas y distribuciones de probabilidad de variables continuas.

INTRODUCCIN

Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo los

costos y los ingresos se presentan por medio de variables expresadas en cantidades decimales.

Adems, las medidas del tiempo, la distancia, la temperatura y el peso encajan en esta

categora. Estas variables se denominan variables continuas, ya que estn medidas en nmeros

reales.

Aunque en la realidad casi todas las variables en algn momento se redondean, es importante

que las variables aleatorias continuas y sus distribuciones de probabilidad sean buenas

aproximaciones en muchos problemas aplicados. Por lo tanto, estos modelos son muy

relevantes y constituyen excelentes instrumentos para las aplicaciones empresariales y

econmicas.

1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE

ALEATORIA

Si los valores o el rango de valores que puede tomar una variable aleatoria tienen una

probabilidad especfica o medida de probabilidad asociada contenida en un intervalo de

nmeros reales, entonces X es una variable aleatoria continua. La regla que asigna las medidas

de probabilidad se denomina distribucin o ley de probabilidad.

Si X es variable aleatoria contnua, la distribucin de probabilidad puede ser descrita por su

funcin de distribucin de probabilidad acumulada denotada por (Olea, 2011, p. 9):

XF x P X x para todo x


DEFINICIN:

Se llama soporte de X a todos los posibles valores que puede tomar la variable x (Olea, 2011, p.

9).

1 2 3, , ,...X nx x x x

Si X es una variable aleatoria continua, las probabilidades estn asociadas a intervalos de x.

En este caso se define la funcin de densidad Xf x tal que:

(1) b

Xa

P a X b f x dx

Y:

x

X XF x P X x f t dt

Con:

X Xd

f x F xdx

Notar que:

XP x X x dx f x dx

Fuente: Olea (2011, p. 13).


PROPIEDADES:

0XF y 1XF

0XF x para todo valor de x y es no decreciente.

XF x es continua para la derecha.

Para el caso continuo, la ecuacin (1) se puede escribir como (Olea, 2011, p. 13):

b a

X XP a X b f x dx f x dx

En el caso continuo, el soporte de x se transforma en un intervalo. Mientras que en el caso

discreto:

X i X ix b x ai i

P a X b p x p x

Es decir, para ambos casos:

X XP a X b F b F a

Ejemplo 1: Considere la carga ejercida de 100 kg sobre un punto al azar de una viga de largo 10

m (ver figura). La distribucin de probabilidad de la posicin de carga X se distribuye en forma

uniforme (0,10).

Cuya funcin densidad es constante en el intervalo [0,10] y cero en otro caso:

, 0 10

0,X

c xf x

en otro caso

Mientras que la funcin de distribucin acumulada est dada por:

0, 0

, 0 1010

1, 10

X

x

xF x x

x


Ejemplo 2: La vida til (T en horas) de mquinas de soldar no es totalmente predecible, pero

puede ser descrita por la distribucin exponencial la cual tiene la siguiente funcin de

densidad:

, 0

0,

t

T

e tf t

en otro caso

En que es una constante positiva.

2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS

Una variable aleatoria puede ser descrita por su funcin de distribucin de probabilidad o de

densidad, o bien por su funcin de distribucin de probabilidad acumulada. Sin embargo, en la

prctica la forma exacta no puede ser totalmente conocida.

En tales casos se requieren ciertas medidas:

Medidas de centralidad.

Medidas de dispersin.

Medidas de asimetras y otras.

3. VALOR CENTRAL

Del rango de los valores posibles de una variable aleatoria, el valor central tiene un inters

especial.

Dado que para cada valor existe una medida de probabilidad, el centro equivale a un promedio

ponderado.

Se define el valor esperado o esperanza o media de una variable aleatoria X a (Olea, 2011, p.

24):

,X X iE X x f x dx Caso continuo

Otras medidas de centralidad corresponden:

Moda: valor con mayor probabilidad. Si se trata de una funcin continua, se obtiene

maximizando la funcin, esto es, derivando e igualando a cero.

Mediana: valor central. Sea xmed el valor que toma la mediana, entonces:

1

2X medF x


En general, en distribuciones simtricas estos valores coinciden (media, mediana, moda).

Mientras que en distribuciones asimtricas difieren.

4. PRIMER MOMENTO: ESPERANZA MATEMTICA

La nocin del valor esperado como un promedio ponderado puede ser generalizada para

funciones de la variable aleatoria X.

Tambin puede ser necesario conocer la esperanza de una funcin determinada. Dada una

funcin g x , entonces el valor esperado de esta puede ser obtenido como:

,X iE g x g x f x dx Caso continuo

5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN

Ahora, interesa el nivel de dispersin del rango de los valores posibles de una variable

aleatoria, en este caso la medida de dispersin corresponde a la varianza de X, la cual se define

como:

2 22 ,X X X X iVar X E X X f x dx Caso continuo

En trminos de dimensionalidad, es conveniente utilizar la desviacin estndar, ya que la

varianza es una medida ficticia, pues las unidades en las cuales se expresa son cuadrticas (por

ejemplo aos2, pesos2, etc.), es decir:

X Var X

Si 0X , se puede calcular una medida de variabilidad que es adimensional llamada

coeficiente de variacin (c. o. v.).

XX

X

Ejemplo: Sea X una variable aleatoria cuya funcin de densidad dada por:

, 0, 0

0,

x

X

e x f x

en otro caso

Determine lo siguiente: valor esperado, mediana, varianza y c. o. v.


Solucin:

Para la esperanza:

X XE X x f x dx

0

x x e dx

Se define la siguiente variable auxiliar:

t x

dt dx

dtdx

0

1 t t e dt

Se integra por partes:

0 0

1 1t t tt e dt te e dt

0

1 t t te e

1

0 0 0 1

1

Para la mediana se sabe que:

1

2X medF x

Primero se determina la funcin acumulada:


x

X XF x f x dx

0

xt

XF x e dt

0

xt e

1 t e

1

12

xmedX medF x e

1

2

xmed e

1ln

2

xmed ln e

2 med ln x

2med

ln x

Para la varianza:

22Var X E X E X

Se calcula primero 2E X :

2 2 XE X x f x dx

2

0

x x e dx

Se integra por partes:


2 20 0

2x x xx e dx x e x e dx

2

0

2x x x e x e dx

Pero 1xx e dx

de acuerdo a lo calculado en la esperanza:

2

0

2 1x x e

Para el coeficiente de variacin:

2

1

11

XX

X

Con este ejemplo se ha demostrado los parmetros de la distribucin exponencial que a

continuacin se presentan.

6. DISTRIBUCIN EXPONENCIAL

En un proceso de Poisson el tiempo transcurrido entre la ocurrencia de eventos puede ser

descrito por una distribucin exponencial. Si T1 representa al tiempo pasado hasta la

ocurrencia del primer evento en un proceso de Poisson, el evento (T1 > t) implica que en el

intervalo (0, t) no ocurren eventos, es decir (Olea, 2011, p. 67):

0

1 00!

vt

vt

t

vt eP T t P X e

Esto quiere decir que la funcin de distribucin exponencial nace a partir del proceso de

Poisson.


Por lo tanto, la funcin de distribucin de probabilidad acumulada de T1 est dada por:

1 11 1 1t

TF t P T t P T t e

En la expresin anterior se conoce la funcin de distribucin exponencial acumulada.

Su funcin de densidad se obtiene como sigue:

1 1

t

T T

df t F t e

dt

Que corresponde a la funcin de densidad de una variable aleatoria con distribucin

exponencial.

Adems, esta distribucin tambin carece de memoria, es decir, lo que haya ocurrido con el

valor de la variable que se estudia en los intervalos de tiempo anteriores, no afecta el

resultado de la probabilidad en el intervalo de tiempo en que se est midiendo.

En resumen, una variable aleatoria X con distribucin exponencial de parmetro 0 , tiene

funcin densidad y de distribucin:

Mientras que su valor esperado y varianza es:

Ejemplo: Un motor tiene una vida til de X horas, que puede considerarse como una variable

continua con distribucin exponencial. Si la vida til esperada es de 50 horas y posee un costo

de 320 dlares. Si el motor dura menos de 70 horas se asigna una prdida de 110 dlares

adicionales al fabricante. Calcular el costo esperado.

Solucin:

Si X Vida til en horas de un motor.

50X exp con 1

50

C Costo del motor

Datos:

Costo por motor = US$ 320 si 70X


Costo + prdida = US$ 430 si 70X

El costo esperado ser la suma de los costos por su probabilidad:

70 70E C C x P X C x P X

Recordar que las probabilidades deben acumular a los percentiles, por lo tanto para

70P X se usa la propiedad de la probabilidad del complemento.

1 70 70E C C x P X C x P X

Se sabe que la distribucin exponencial acumulada tiene la forma:

1 1

70 7050 50320 1 1 430 1E C e e

Eliminando el parntesis interior:

1 1

70 7050 50320 1 1 430 1E C e e

1 1

70 7050 50320 430 1E C e e

78 91 323 96E C , ,

7. DISTRIBUCIN NORMAL

En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin

gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms

frecuencia aparece en fenmenos reales.

La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de

un determinado parmetro. Esta curva se conoce como campana de Gauss.

La importancia de esta distribucin radica en que permite modelar numerosos fenmenos

naturales, sociales y psicolgicos.

La funcin densidad de una variable aleatoria X con distribucin normal , es de la forma

(Santiago, 2006):


21

2

2

1,

2

x

Xf x e x

Con parmetro de localizacin y parmetro de escala o forma, tales que:

, 0

Para interpretar estos porcentajes obsrvese el siguiente ejemplo.

Si se registra la frecuencia cardiaca de 80 personas y si la media aritmtica de esta distribucin

fuera 80 pulsaciones por minuto y la desviacin estndar fuera de 10 pulsaciones por minuto,

entonces una persona cualquiera elegida al azar tendra un 68% de probabilidades de tener

entre 70 y 90 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a

una desviacin estndar de la media); o tendra un 95,5% de probabilidades de tener entre 60

y 100 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a dos

desviaciones estndar de la media); o tendra un 99,7% de probabilidades de tener entre 50 y

110 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a tres

desviaciones estndar de la media).

Un caso especial es cuando 0 y 1 . Este caso es conocido como distribucin normal

estndar.

2

21

2

x

Xf x e

La ventaja de estandarizar es que la funcin de probabilidad acumulada se encuentra tabulada

(las probabilidades ya estn calculadas). Esta funcin se denota por .


Sea S una variable aleatoria con distribucin normal estndar, cuya funcin de distribucin de

probabilidad acumulada est dada por:

2

21

2

xs

Ss F s e dx

PROPIEDADES:

1 1 1PS p p

1s s


Sea X una variable aleatoria normal , con funcin de distribucin acumulada XF . Para

dos valores dados a y b (con a < b) se tiene que (Olea, 2011, p. 42):


X XP a X b F b F a


Ejemplo: Durante una tormenta el drenaje de una comunidad se comporta como una variable

aleatoria normal con una media y desviacin estndar estimada de 1,2 y 0,4 millones de

galones diarios (mgd) respectivamente.

a) Si el sistema de drenaje de aguas pluviales fue diseado para soportar una capacidad

mxima de 1,5 mgd. Cul es la probabilidad de que el sistema colapse?

Solucin:

1,5 1 1,5P X P X

1 1,5X F

1,5 1,21

0,4

1 0,75

1 0,7734

0,2266

b) Cul es la probabilidad que el sistema deba soportar un drenaje entre 1,0 y 1,6 mgd?

Solucin:

1 1,6 1,6 1P X P X P X


1,6 1X X F F

1,6 1,2 1 1,2

0,4 0,4

1 0,5

1 1 0,5

0,8413 1 0,6915

0,8413 0,3085

0,5328

c) Cul es la carga de agua durante una tormenta que soporta el sistema de drenaje

correspondiente al percentil 90?

Solucin:

0,9P X x

1,20,9

0,4

X xP

0,9x

1,21,28

0,4

x

1,71 x

8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA

NORMAL

La distribucin binomial es una forma lmite de la distribucin de Poisson, cuando n es grande

y p es pequeo. De la misma forma, la distribucin normal es una forma lmite de la

distribucin binomial cuando n es grande y p no tiene un valor cercano a cero o a uno.


TEOREMA

Sea x una variable aleatoria binomial con media np y desviacin estndar 1np p . La

distribucin de la variable aleatoria tiende a la normal estndar conforme:

xZ

Recordar que la distribucin binomial tiene esperanza E x np y varianza 2 1np p .

Se reemplaza en la variable estandarizada:

1

x npZ

np p

Cuando el nmero de ensayos independientes n

Ejemplo: Supngase que el nmero de bits que se reciben de manera errnea en un canal de comunicacin digital puede modelarse con una variable aleatoria binomial. La probabilidad de

recibir un bits de manera errnea es 51 10 . Si se transmiten 16 millones de bits cul es la probabilidad que se presenten 150 errores?

Solucin:

Sea x Nmero de errores.

516 000 000 1 10x B . . ,

Se pide 150P x :

150 1 150P x P x

Si se resuelve como el modelo binomial:

150

16 000 0005 5

0

16 000 0001 10 1 10

x . . x

x

. .

x

0 772,

Si se resuelve como si se tratara de una distribucin normal, sabiendo que en este caso:

1

x npZ

np p


5

5 5

16 000 000 10150

16 000 000 10 1 01 1

x .x np

np p

.P x P

. .

5160

160 1 10

zx

P

0 79P z ,

Se aplican propiedades de la distribucin normal estndar:

0 79P z ,

Luego se busca en la tabla Normal Estndar:

0 785,

Observacin 1:

La aproximacin de la distribucin binomial a la normal es buena si se cumple que 5np y

1 5n p .

Observacin 2:

Correccin por continuidad:

En ocasiones la aproximacin normal de una probabilidad binomial se modifica con un factor

de correccin de 0,5 que mejora la aproximacin. Por ejemplo, si 2P X , como X es una

variable discreta, entonces se cumplir que 2 5P X , . De la misma manera, si 2P X ,

entonces 1 5P X , .


COMENTARIO FINAL

Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo, los

costos y los ingresos pueden presentarse como variables aleatorias continuas.

Las variables aleatorias continuas y sus distribuciones son buenas aproximaciones en muchos

problemas aplicados. Por lo tanto, estos modelos son muy importantes y constituyen

excelentes instrumentos para las aplicaciones empresariales y econmicas.


REFERENCIAS

Canavos, G. (1984). Probabilidad y estadstica, aplicaciones y mtodos. 1 edicin. Estados

Unidos: McGraw-Hill.

Montgomery, D. & Runger, G. (1998). Probabilidad y estadstica aplicadas a la ingeniera. 1

edicin. Arizona, Estados Unidos: McGraw-Hill.

Newbold, P.; Carlson, W. & Thorne, B. (2009). Estadstica para la administracin y economa.

6 edicin. Nueva Jersey, Estados Unidos: Pearson, Prentice-Hall.

Olea, R. (2011). Estadstica para ingeniera. Apuntes Curso de verano TAV. Chile. Pontificia

Universidad Catlica de Chile.

Santiago, J. (2006). Apuntes Curso de estadstica II. Santiago, Chile: Universidad de Santiago de

Chile.

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE: IACC (2013). Variables aleatorias continuas y distribuciones de probabilidad continuas.

Inferencia estadstica. Semana 2.

02_inferencia_estadistica

Documents

Transcript of 02_inferencia_estadistica