02_inferencia_estadistica

20
INFERENCIA ESTADÍSTICA SEMANA 2

description

guia de inferencia estadistica

Transcript of 02_inferencia_estadistica

  • INFERENCIA ESTADSTICA

    SEMANA 2

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 2

    NDICE APRENDIZAJES ESPERADOS ........................................................................................................... 3 INTRODUCCIN ............................................................................................................................. 3 1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE ALEATORIA ................................... 3 2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS ........................................................... 6 3. VALOR CENTRAL .................................................................................................................... 6 4. PRIMER MOMENTO: ESPERANZA MATEMTICA .................................................................. 7 5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN ................................................................ 7 6. DISTRIBUCIN EXPONENCIAL ............................................................................................. 10 7. DISTRIBUCIN NORMAL ...................................................................................................... 12 8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA NORMAL ...................................... 16 COMENTARIO FINAL .................................................................................................................... 19 REFERENCIAS ............................................................................................................................... 20

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 3

    VARIABLES ALEATORIAS CONTINUAS Y DISTRIBUCIONES

    DE PROBABILIDAD CONTINUAS

    APRENDIZAJES ESPERADOS

    Identificar elementos que involucran distribuciones de probabilidad de variables

    continuas.

    Revisar resolucin de problemas que involucran esperanza, varianza de variables

    aleatorias continuas y distribuciones de probabilidad de variables continuas.

    INTRODUCCIN

    Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo los

    costos y los ingresos se presentan por medio de variables expresadas en cantidades decimales.

    Adems, las medidas del tiempo, la distancia, la temperatura y el peso encajan en esta

    categora. Estas variables se denominan variables continuas, ya que estn medidas en nmeros

    reales.

    Aunque en la realidad casi todas las variables en algn momento se redondean, es importante

    que las variables aleatorias continuas y sus distribuciones de probabilidad sean buenas

    aproximaciones en muchos problemas aplicados. Por lo tanto, estos modelos son muy

    relevantes y constituyen excelentes instrumentos para las aplicaciones empresariales y

    econmicas.

    1. DISTRIBUCIN DE PROBABILIDADES DE UNA VARIABLE

    ALEATORIA

    Si los valores o el rango de valores que puede tomar una variable aleatoria tienen una

    probabilidad especfica o medida de probabilidad asociada contenida en un intervalo de

    nmeros reales, entonces X es una variable aleatoria continua. La regla que asigna las medidas

    de probabilidad se denomina distribucin o ley de probabilidad.

    Si X es variable aleatoria contnua, la distribucin de probabilidad puede ser descrita por su

    funcin de distribucin de probabilidad acumulada denotada por (Olea, 2011, p. 9):

    XF x P X x para todo x

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 4

    DEFINICIN:

    Se llama soporte de X a todos los posibles valores que puede tomar la variable x (Olea, 2011, p.

    9).

    1 2 3, , ,...X nx x x x

    Si X es una variable aleatoria continua, las probabilidades estn asociadas a intervalos de x.

    En este caso se define la funcin de densidad Xf x tal que:

    (1) b

    Xa

    P a X b f x dx

    Y:

    x

    X XF x P X x f t dt

    Con:

    X Xd

    f x F xdx

    Notar que:

    XP x X x dx f x dx

    Fuente: Olea (2011, p. 13).

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 5

    PROPIEDADES:

    0XF y 1XF

    0XF x para todo valor de x y es no decreciente.

    XF x es continua para la derecha.

    Para el caso continuo, la ecuacin (1) se puede escribir como (Olea, 2011, p. 13):

    b a

    X XP a X b f x dx f x dx

    En el caso continuo, el soporte de x se transforma en un intervalo. Mientras que en el caso

    discreto:

    X i X ix b x ai i

    P a X b p x p x

    Es decir, para ambos casos:

    X XP a X b F b F a

    Ejemplo 1: Considere la carga ejercida de 100 kg sobre un punto al azar de una viga de largo 10

    m (ver figura). La distribucin de probabilidad de la posicin de carga X se distribuye en forma

    uniforme (0,10).

    Cuya funcin densidad es constante en el intervalo [0,10] y cero en otro caso:

    , 0 10

    0,X

    c xf x

    en otro caso

    Mientras que la funcin de distribucin acumulada est dada por:

    0, 0

    , 0 1010

    1, 10

    X

    x

    xF x x

    x

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 6

    Ejemplo 2: La vida til (T en horas) de mquinas de soldar no es totalmente predecible, pero

    puede ser descrita por la distribucin exponencial la cual tiene la siguiente funcin de

    densidad:

    , 0

    0,

    t

    T

    e tf t

    en otro caso

    En que es una constante positiva.

    2. MEDIDAS DESCRIPTIVAS DE VARIABLES ALEATORIAS

    Una variable aleatoria puede ser descrita por su funcin de distribucin de probabilidad o de

    densidad, o bien por su funcin de distribucin de probabilidad acumulada. Sin embargo, en la

    prctica la forma exacta no puede ser totalmente conocida.

    En tales casos se requieren ciertas medidas:

    Medidas de centralidad.

    Medidas de dispersin.

    Medidas de asimetras y otras.

    3. VALOR CENTRAL

    Del rango de los valores posibles de una variable aleatoria, el valor central tiene un inters

    especial.

    Dado que para cada valor existe una medida de probabilidad, el centro equivale a un promedio

    ponderado.

    Se define el valor esperado o esperanza o media de una variable aleatoria X a (Olea, 2011, p.

    24):

    ,X X iE X x f x dx Caso continuo

    Otras medidas de centralidad corresponden:

    Moda: valor con mayor probabilidad. Si se trata de una funcin continua, se obtiene

    maximizando la funcin, esto es, derivando e igualando a cero.

    Mediana: valor central. Sea xmed el valor que toma la mediana, entonces:

    1

    2X medF x

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 7

    En general, en distribuciones simtricas estos valores coinciden (media, mediana, moda).

    Mientras que en distribuciones asimtricas difieren.

    4. PRIMER MOMENTO: ESPERANZA MATEMTICA

    La nocin del valor esperado como un promedio ponderado puede ser generalizada para

    funciones de la variable aleatoria X.

    Tambin puede ser necesario conocer la esperanza de una funcin determinada. Dada una

    funcin g x , entonces el valor esperado de esta puede ser obtenido como:

    ,X iE g x g x f x dx Caso continuo

    5. SEGUNDO MOMENTO: MEDIDAS DE DISPERSIN

    Ahora, interesa el nivel de dispersin del rango de los valores posibles de una variable

    aleatoria, en este caso la medida de dispersin corresponde a la varianza de X, la cual se define

    como:

    2 22 ,X X X X iVar X E X X f x dx Caso continuo

    En trminos de dimensionalidad, es conveniente utilizar la desviacin estndar, ya que la

    varianza es una medida ficticia, pues las unidades en las cuales se expresa son cuadrticas (por

    ejemplo aos2, pesos2, etc.), es decir:

    X Var X

    Si 0X , se puede calcular una medida de variabilidad que es adimensional llamada

    coeficiente de variacin (c. o. v.).

    XX

    X

    Ejemplo: Sea X una variable aleatoria cuya funcin de densidad dada por:

    , 0, 0

    0,

    x

    X

    e x f x

    en otro caso

    Determine lo siguiente: valor esperado, mediana, varianza y c. o. v.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 8

    Solucin:

    Para la esperanza:

    X XE X x f x dx

    0

    x x e dx

    Se define la siguiente variable auxiliar:

    t x

    dt dx

    dtdx

    0

    1 t t e dt

    Se integra por partes:

    0 0

    1 1t t tt e dt te e dt

    0

    1 t t te e

    1

    0 0 0 1

    1

    Para la mediana se sabe que:

    1

    2X medF x

    Primero se determina la funcin acumulada:

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 9

    x

    X XF x f x dx

    0

    xt

    XF x e dt

    0

    xt e

    1 t e

    1

    12

    xmedX medF x e

    1

    2

    xmed e

    1ln

    2

    xmed ln e

    2 med ln x

    2med

    ln x

    Para la varianza:

    22Var X E X E X

    Se calcula primero 2E X :

    2 2 XE X x f x dx

    2

    0

    x x e dx

    Se integra por partes:

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 10

    2 20 0

    2x x xx e dx x e x e dx

    2

    0

    2x x x e x e dx

    Pero 1xx e dx

    de acuerdo a lo calculado en la esperanza:

    2

    0

    2 1x x e

    Para el coeficiente de variacin:

    2

    1

    11

    XX

    X

    Con este ejemplo se ha demostrado los parmetros de la distribucin exponencial que a

    continuacin se presentan.

    6. DISTRIBUCIN EXPONENCIAL

    En un proceso de Poisson el tiempo transcurrido entre la ocurrencia de eventos puede ser

    descrito por una distribucin exponencial. Si T1 representa al tiempo pasado hasta la

    ocurrencia del primer evento en un proceso de Poisson, el evento (T1 > t) implica que en el

    intervalo (0, t) no ocurren eventos, es decir (Olea, 2011, p. 67):

    0

    1 00!

    vt

    vt

    t

    vt eP T t P X e

    Esto quiere decir que la funcin de distribucin exponencial nace a partir del proceso de

    Poisson.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 11

    Por lo tanto, la funcin de distribucin de probabilidad acumulada de T1 est dada por:

    1 11 1 1t

    TF t P T t P T t e

    En la expresin anterior se conoce la funcin de distribucin exponencial acumulada.

    Su funcin de densidad se obtiene como sigue:

    1 1

    t

    T T

    df t F t e

    dt

    Que corresponde a la funcin de densidad de una variable aleatoria con distribucin

    exponencial.

    Adems, esta distribucin tambin carece de memoria, es decir, lo que haya ocurrido con el

    valor de la variable que se estudia en los intervalos de tiempo anteriores, no afecta el

    resultado de la probabilidad en el intervalo de tiempo en que se est midiendo.

    En resumen, una variable aleatoria X con distribucin exponencial de parmetro 0 , tiene

    funcin densidad y de distribucin:

    Mientras que su valor esperado y varianza es:

    Ejemplo: Un motor tiene una vida til de X horas, que puede considerarse como una variable

    continua con distribucin exponencial. Si la vida til esperada es de 50 horas y posee un costo

    de 320 dlares. Si el motor dura menos de 70 horas se asigna una prdida de 110 dlares

    adicionales al fabricante. Calcular el costo esperado.

    Solucin:

    Si X Vida til en horas de un motor.

    50X exp con 1

    50

    C Costo del motor

    Datos:

    Costo por motor = US$ 320 si 70X

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 12

    Costo + prdida = US$ 430 si 70X

    El costo esperado ser la suma de los costos por su probabilidad:

    70 70E C C x P X C x P X

    Recordar que las probabilidades deben acumular a los percentiles, por lo tanto para

    70P X se usa la propiedad de la probabilidad del complemento.

    1 70 70E C C x P X C x P X

    Se sabe que la distribucin exponencial acumulada tiene la forma:

    1 1

    70 7050 50320 1 1 430 1E C e e

    Eliminando el parntesis interior:

    1 1

    70 7050 50320 1 1 430 1E C e e

    1 1

    70 7050 50320 430 1E C e e

    78 91 323 96E C , ,

    7. DISTRIBUCIN NORMAL

    En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin

    gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms

    frecuencia aparece en fenmenos reales.

    La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de

    un determinado parmetro. Esta curva se conoce como campana de Gauss.

    La importancia de esta distribucin radica en que permite modelar numerosos fenmenos

    naturales, sociales y psicolgicos.

    La funcin densidad de una variable aleatoria X con distribucin normal , es de la forma

    (Santiago, 2006):

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 13

    21

    2

    2

    1,

    2

    x

    Xf x e x

    Con parmetro de localizacin y parmetro de escala o forma, tales que:

    , 0

    Para interpretar estos porcentajes obsrvese el siguiente ejemplo.

    Si se registra la frecuencia cardiaca de 80 personas y si la media aritmtica de esta distribucin

    fuera 80 pulsaciones por minuto y la desviacin estndar fuera de 10 pulsaciones por minuto,

    entonces una persona cualquiera elegida al azar tendra un 68% de probabilidades de tener

    entre 70 y 90 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a

    una desviacin estndar de la media); o tendra un 95,5% de probabilidades de tener entre 60

    y 100 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a dos

    desviaciones estndar de la media); o tendra un 99,7% de probabilidades de tener entre 50 y

    110 pulsaciones por minuto (es decir, su frecuencia cardiaca estara como mximo a tres

    desviaciones estndar de la media).

    Un caso especial es cuando 0 y 1 . Este caso es conocido como distribucin normal

    estndar.

    2

    21

    2

    x

    Xf x e

    La ventaja de estandarizar es que la funcin de probabilidad acumulada se encuentra tabulada

    (las probabilidades ya estn calculadas). Esta funcin se denota por .

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 14

    Sea S una variable aleatoria con distribucin normal estndar, cuya funcin de distribucin de

    probabilidad acumulada est dada por:

    2

    21

    2

    xs

    Ss F s e dx

    PROPIEDADES:

    1 1 1PS p p

    1s s

    Fuente: Olea (2011, p. 43).

    Sea X una variable aleatoria normal , con funcin de distribucin acumulada XF . Para

    dos valores dados a y b (con a < b) se tiene que (Olea, 2011, p. 42):

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 15

    X XP a X b F b F a

    Fuente: Olea (2011, p. 42).

    Ejemplo: Durante una tormenta el drenaje de una comunidad se comporta como una variable

    aleatoria normal con una media y desviacin estndar estimada de 1,2 y 0,4 millones de

    galones diarios (mgd) respectivamente.

    a) Si el sistema de drenaje de aguas pluviales fue diseado para soportar una capacidad

    mxima de 1,5 mgd. Cul es la probabilidad de que el sistema colapse?

    Solucin:

    1,5 1 1,5P X P X

    1 1,5X F

    1,5 1,21

    0,4

    1 0,75

    1 0,7734

    0,2266

    b) Cul es la probabilidad que el sistema deba soportar un drenaje entre 1,0 y 1,6 mgd?

    Solucin:

    1 1,6 1,6 1P X P X P X

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 16

    1,6 1X X F F

    1,6 1,2 1 1,2

    0,4 0,4

    1 0,5

    1 1 0,5

    0,8413 1 0,6915

    0,8413 0,3085

    0,5328

    c) Cul es la carga de agua durante una tormenta que soporta el sistema de drenaje

    correspondiente al percentil 90?

    Solucin:

    0,9P X x

    1,20,9

    0,4

    X xP

    0,9x

    1,21,28

    0,4

    x

    1,71 x

    8. APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA

    NORMAL

    La distribucin binomial es una forma lmite de la distribucin de Poisson, cuando n es grande

    y p es pequeo. De la misma forma, la distribucin normal es una forma lmite de la

    distribucin binomial cuando n es grande y p no tiene un valor cercano a cero o a uno.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 17

    TEOREMA

    Sea x una variable aleatoria binomial con media np y desviacin estndar 1np p . La

    distribucin de la variable aleatoria tiende a la normal estndar conforme:

    xZ

    Recordar que la distribucin binomial tiene esperanza E x np y varianza 2 1np p .

    Se reemplaza en la variable estandarizada:

    1

    x npZ

    np p

    Cuando el nmero de ensayos independientes n

    Ejemplo: Supngase que el nmero de bits que se reciben de manera errnea en un canal de comunicacin digital puede modelarse con una variable aleatoria binomial. La probabilidad de

    recibir un bits de manera errnea es 51 10 . Si se transmiten 16 millones de bits cul es la probabilidad que se presenten 150 errores?

    Solucin:

    Sea x Nmero de errores.

    516 000 000 1 10x B . . ,

    Se pide 150P x :

    150 1 150P x P x

    Si se resuelve como el modelo binomial:

    150

    16 000 0005 5

    0

    16 000 0001 10 1 10

    x . . x

    x

    . .

    x

    0 772,

    Si se resuelve como si se tratara de una distribucin normal, sabiendo que en este caso:

    1

    x npZ

    np p

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 18

    5

    5 5

    16 000 000 10150

    16 000 000 10 1 01 1

    x .x np

    np p

    .P x P

    . .

    5160

    160 1 10

    zx

    P

    0 79P z ,

    Se aplican propiedades de la distribucin normal estndar:

    0 79P z ,

    Luego se busca en la tabla Normal Estndar:

    0 785,

    Observacin 1:

    La aproximacin de la distribucin binomial a la normal es buena si se cumple que 5np y

    1 5n p .

    Observacin 2:

    Correccin por continuidad:

    En ocasiones la aproximacin normal de una probabilidad binomial se modifica con un factor

    de correccin de 0,5 que mejora la aproximacin. Por ejemplo, si 2P X , como X es una

    variable discreta, entonces se cumplir que 2 5P X , . De la misma manera, si 2P X ,

    entonces 1 5P X , .

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 19

    COMENTARIO FINAL

    Muchos indicadores econmicos y empresariales como las ventas, la inversin, el consumo, los

    costos y los ingresos pueden presentarse como variables aleatorias continuas.

    Las variables aleatorias continuas y sus distribuciones son buenas aproximaciones en muchos

    problemas aplicados. Por lo tanto, estos modelos son muy importantes y constituyen

    excelentes instrumentos para las aplicaciones empresariales y econmicas.

  • ESTE DOCUMENTO CONTIENE LA SEMANA 2 20

    REFERENCIAS

    Canavos, G. (1984). Probabilidad y estadstica, aplicaciones y mtodos. 1 edicin. Estados

    Unidos: McGraw-Hill.

    Montgomery, D. & Runger, G. (1998). Probabilidad y estadstica aplicadas a la ingeniera. 1

    edicin. Arizona, Estados Unidos: McGraw-Hill.

    Newbold, P.; Carlson, W. & Thorne, B. (2009). Estadstica para la administracin y economa.

    6 edicin. Nueva Jersey, Estados Unidos: Pearson, Prentice-Hall.

    Olea, R. (2011). Estadstica para ingeniera. Apuntes Curso de verano TAV. Chile. Pontificia

    Universidad Catlica de Chile.

    Santiago, J. (2006). Apuntes Curso de estadstica II. Santiago, Chile: Universidad de Santiago de

    Chile.

    PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE: IACC (2013). Variables aleatorias continuas y distribuciones de probabilidad continuas.

    Inferencia estadstica. Semana 2.