Tema 6. Distribuciones Teóricas de Probabilidad (2!03!2015)

10
Grupo 24 Bioestadística Clase 02-03-2015 1 TEMA 6. DISTRIBUCIONES TEÓRICAS DE PROBABILIDAD. En este tema se van a integrar variables, datos y representaciones. ÍNDICE -Introducción -Variables aleatorias -Función de densidad y función de distribución: ·Variables discretas ·Continuas -Esperanza matemática y varianza de una variable aleatoria MISMOS CONCEPTOS. NUEVOS NOMBRES. Vamos a repasar los conceptos que ya conocemos de estadística descriptiva, pero les vamos a dar nuevos nombres. Los conceptos son los mismos, lo único que cambian son los nombres. INTRODUCCIÓN. Ya conocemos que en medicina vamos a trabajar fundamentalmente con dos tipos de variables: discretas y continuas. Las variables discretas son aquellas que pueden tomar un conjunto delimitado de números enteros, y las continuas aquellas que pueden tomar infinitos valores. A partir de ahora, los denominaremos como espacios muestrales discretos y continuos. Notación: - X, Y,… MAYÚSCULAS, se refiere a la variable. -x1 x2 y1 y2… son los valores que puede tomar X ó Y (la variable). En cuanto a las variables aleatorias, hay que tener en cuenta que no siempre toman los mismos valores, incluso cuando son medidas en las mismas condiciones y circunstancias. Por lo tanto, sería muy útil, si pudiéramos relacionar los valores que toma la variable con la probabilidad de observar dichos valores. Por ejemplo: P [Supervivencia >2 años]: Probabilidad de la que supervivencia del paciente sea mayor de dos años. En el corchete estoy metiendo un suceso a través de una variable que es la supervivencia. P [Remisiones=50] entre 100 pacientes tratados.

description

Comi

Transcript of Tema 6. Distribuciones Teóricas de Probabilidad (2!03!2015)

  • Grupo 24 Bioestadstica Clase 02-03-2015

    1

    TEMA 6. DISTRIBUCIONES TERICAS DE

    PROBABILIDAD.

    En este tema se van a integrar variables, datos y representaciones.

    NDICE

    -Introduccin

    -Variables aleatorias

    -Funcin de densidad y funcin de distribucin:

    Variables discretas

    Continuas

    -Esperanza matemtica y varianza de una variable aleatoria

    MISMOS CONCEPTOS. NUEVOS NOMBRES.

    Vamos a repasar los conceptos que ya conocemos de estadstica descriptiva, pero les

    vamos a dar nuevos nombres. Los conceptos son los mismos, lo nico que cambian son

    los nombres.

    INTRODUCCIN.

    Ya conocemos que en medicina vamos a trabajar fundamentalmente con dos tipos de variables:

    discretas y continuas. Las variables discretas son aquellas que pueden tomar un conjunto

    delimitado de nmeros enteros, y las continuas aquellas que pueden tomar infinitos valores. A

    partir de ahora, los denominaremos como espacios muestrales discretos y continuos.

    Notacin:

    - X, Y, MAYSCULAS, se refiere a la variable.

    -x1 x2 y1 y2 son los valores que puede tomar X Y (la variable).

    En cuanto a las variables aleatorias, hay que tener en cuenta que no siempre toman los mismos

    valores, incluso cuando son medidas en las mismas condiciones y circunstancias.

    Por lo tanto, sera muy til, si pudiramos relacionar los valores que toma la variable con la

    probabilidad de observar dichos valores.

    Por ejemplo:

    P [Supervivencia >2 aos]: Probabilidad de la que supervivencia del paciente sea mayor

    de dos aos. En el corchete estoy metiendo un suceso a travs de una variable que es la

    supervivencia.

    P [Remisiones=50] entre 100 pacientes tratados.

  • Grupo 24 Bioestadstica Clase 02-03-2015

    2

    VARIABLES ALEATORIAS.

    A partir de ahora, vamos a ver cmo las variables son a su vez FUNCIONES. Esta funcin

    asigna a cada suceso del espacio muestral un valor en la recta de los nmeros reales.

    Existen dos tipos fundamentales:

    1. Discretas: Toman un conjunto finito, enumerable y determinado de valores.

    2. Continuas: Pueden tomar infinitos valores en cualquier intervalo de la recta de los

    nmeros reales. La simple medida de altura, peso

    Omega es un espacio muestral en el que hay dos sucesos: A (rojo) y NO A (gris).

    X es la variable, y es la funcin. X hace que si ocurre el suceso A en el espacio muestral, vamos

    a aplicarlo en un intervalo o en un valor de la recta de nmeros reales.

    La probabilidad de que la variable X tome valor en los intervalos de I es igual a la probabilidad

    de que ocurra el suceso A. Es lo que liga los espacios muestrales con la recta de nmeros reales.

    Por ejemplo:

    Fenmeno aleatorio: El tratamiento de cierta enfermedad, valorado por el propio paciente.

    Puede ser:

    - Muy Malo (MM)

  • Grupo 24 Bioestadstica Clase 02-03-2015

    3

    - Malo(M)

    - Sin efecto o indiferente (I)

    - Bueno (B)

    - Muy bueno (BB)

    Espacio muestral (discreto; solo hay una serie de sucesos numerables): ={MM, M, I, B, BB}

    El espacio muestral puede representarse mediante una tabla. Las aplicaciones las decide el

    investigador. Ej: si es MM es -2. La variable puede tomar los valores: -2,-1,0,1,2. Es una

    variable aleatoria discreta y esta es su codificacin. Es una variable cualitativa y por eso

    hacemos una codificacin de sta.

    Cul es la probabilidad de que ocurra el suceso MM?

    P [MM u M]= P [X -1]= 0,3 (para saberlo miramos la frecuencia acumulada,F) Son sucesos que no pueden ocurrir simultneamente, son disjuntos. Son ntimamente

    excluyentes.

    Si aadimos la frecuencia relativa (f) y la frecuencia acumulada (F) de cada resultado a la tabla,

    quedara

    Por ejemplo: Hemos hecho el experimento con varios pacientes y en un 1% el experimento era

    MM.

    f=0,1 es una frecuencia relativa en escala de proporcin. La escala de probabilidad es de 0 a 1,

    por eso tenemos que utilizar la proporcin. Se cumple que la probabilidad de que ocurra el

    suceso MM es la misma probabilidad de que X tome el valor -2.

    F es la frecuencia acumulada.

    Cul es la probabilidad de que el resultado del tratamiento sea muy bueno?

    P [BB]= p[X=2]= 0,2. (Para saberlo miramos en la lnea de la frecuencia relativa,f)

    FUNCIN DE DENSIDAD DE PROBABILIDAD.

    Todas las variables van a tener al menos 2 funciones que me interesan conocer para poder

    predecir el valor que van a tomar esas variables en los pacientes. La funcin de densidad de

    probabilidad f(x) que para variables discretas se denomina funcin de cuanta. Y adems

    necesito la funcin F.

  • Grupo 24 Bioestadstica Clase 02-03-2015

    4

    Se denomina funcin de densidad o cuanta f(x) de una variable aleatoria discreta X, a aquella

    que me devuelve la probabilidad de que la variable X tome un determinado valor x. Por lo tanto,

    para variables discretas:

    Cul es la funcin de cuanta de X para valor -1? 0,2

    f(-1) sera igual a la probabilidad de que X fuera igual a -1.

    Los valores de las variables estn relacionadas con los sucesos que tenemos en el espacio

    muestral.

    Los diagramas en barras o en sectores, son representaciones de la funcin de densidad o de

    cuanta.

    Pregunta: Probabilidad de que el resultado del tratamiento sea indiferente, bueno o muy bueno.

    Sabiendo que,

    F(-1)= P [MM u M]= P [X-1] = 0,3

    P(todo el espacio muestral)=1

    Ojo! Todas las variables tienen funcin de supervivencia.

    FUNCIN DE DISTRIBUCIN DE PROBABILIDAD.

    Se denomina funcin de distribucin F (x) de una variable aleatoria discreta X, a aquella que

    devuelve la probabilidad de que la variable X tome valores menores o iguales a x. Por lo tanto,

    para variables discretas:

    1-03= 07(funcin de supervivencia)

  • Grupo 24 Bioestadstica Clase 02-03-2015

    5

    La representacin que se utiliza para representar la funcin de distribucin, es parecida a la

    ojiva.

    Es una ojiva para una variable discreta, por eso hace esos saltos. La probabilidad de observar

    valor de 2 es constante pero pega saltos en determinados valores. Por qu? Porque solo esos

    valores tienen probabilidad, los dems no aaden probabilidad.

    La probabilidad de los valores menos a -2, es 0. Cuando llega a -2 pega un salto. Por esta razn,

    se le llama funcin en salto ascendente.

    FUNCIN DE SUPERVIVENCIA.

    Se denomina funcin de Supervivencia S (x) de una variable aleatoria discreta X, a aquella que

    me devuelve la probabilidad de que la variable X tome valores mayores a x. Por lo tanto, para

    variables discretas:

  • Grupo 24 Bioestadstica Clase 02-03-2015

    6

    La funcin 1 menos la funcin de distribucin es igual a la funcin de supervivencia.

    Por ejemplo: probabilidad de que el resultado sea indiferente, bueno o muy bueno:

    1-F(-1)=1-03=0,7 es la probabilidad de observar los valores 0,1 y 2.

    Si la funcin de distribucin era una funcin en salto ascendente, la de supervivencia es

    descendente.

    ESPACIOS MUESTRALES Y VARIABLES CONTINUAS.

    El espacio muestral omega tienen infinitos sucesos, puede tomar infinitos valores. Para estos

    espacios muestrales suelen existir variables numricas que se pueden medir en una escala

    continua (Peso, Talla). Qu pasa entonces con la variable? Que sta puede tomar infinitos valores. La probabilidad de cada uno de los valores, sera prcticamente 0. Por lo tanto, en

    variables continuas la funcin de densidad sera prcticamente 0, esto quiere decir que para

    variables continuas la funcin de densidad no nos sirve tal y como la hemos explicado.

  • Grupo 24 Bioestadstica Clase 02-03-2015

    7

    Para la representacin de estas variables, es necesario buscar una funcin f8x) que cumpla las

    siguientes condiciones:

    - El rea bajo toda la curva de densidad [bajo f(x)]= 1. El rea entre menos infinito y ms

    infinito de la funcin de densidad es la integral y tiene que ser igual a 1.El histograma y el

    polgono de frecuencias, son aproximaciones a la funcin de densidad para variables continuas,

    ya que en stas el rea es 1.

    - f(x) tiene que ser positiva (por encima de la variable X).

    - Funcin de distribucin para a es la probabilidad de que x sea menor o igual a a. Cmo calculamos? La integral entre menos infinito y el valor a de f(x)dx. Sera todo el rea bajo la

    curva desde menos infinito hasta a.

    -Cmo calculo la probabilidad de que mi variable est entre 2 valores? La funcin de

    distribucin para el valor b (todo el rea desde menos infinito hasta el valor b, entre la variable

    X y la curva f(x)) la funcin de distribucin para el valor a.

  • Grupo 24 Bioestadstica Clase 02-03-2015

    8

    Concentracin de Hb. La representacin para la funcin de densidad en una variable continua

    sera el polgono de frecuencias.

    La representacin para la funcin de distribucin en una variable continua sera la ojiva. En este

    caso no se queda en escaln, los puntos se unen porque la variable es continua y puede tomar

    cualquier valor entre los que tenemos.

    Utilidad de la ojiva

  • Grupo 24 Bioestadstica Clase 02-03-2015

    9

    Imaginamos que tenemos un paciente con una concentracin de Hb de 12. Cantos pacientes

    tienen una concentracin de Hb de 12 o menos? Vamos a la F(x) y vemos que es el 25%. Est

    relacionado con la idea de percentiles. Cmo de rara es la observacin que yo hago sobre mi

    paciente? Si est en unos percentiles muy bajos, es rara.

    Esta sera la representacin de funcin de supervivencia, que se describe igual siempre para el

    caso continuo y discreto.

    b

  • Grupo 24 Bioestadstica Clase 02-03-2015

    10

    Este es el cuadro de resumen de lo que hemos visto hasta aqu.

    Para trabajar con variables aleatorias, vamos a necesitar dos funciones fundamentales: una es la

    funcin de densidad de probabilidad cuya notacin es f(x) y que se define diferente en el caso

    discreto y en el caso continuo.

    Si estamos en el caso discreto, la definicin es la probabilidad de que X tome un determinado

    valor x.

    Pero si estamos en el caso continuo, esta definicin no nos vale, porque entonces todos los

    valores tendran probabilidad 0. As que construimos una funcin de densidad para esta variable

    continua f(x) que tiene que cumplir las condiciones mencionadas anteriormente.

    La otra funcin que necesitamos es la funcin de distribucin acumulativa. Se define igual para

    el caso discreto que para el caso continuo. Lo nico es que la representacin de la Ojiva en el

    caso discreto es una funcin en salto, mientras que en el caso continuo es una funcin continua.

    La funcin de supervivencia siempre se define igual para el caso continuo y el discreto, y es 1 la funcin de distribucin.

    La funcin de densidad de probabilidad, si estamos en el caso discreto se llama funcin de

    cuanta pero en el caso continuo no se llama as, se llama siempre funcin de densidad de

    probabilidad.

    Utilidad

    Es absolutamente esencial para comparar los resultados que nosotros tenemos en nuestros

    pacientes con las funciones de densidad y de distribucin de las variables. Imaginemos que nos

    da que nuestro paciente tiene un CI de 120. Ese CI Cmo es? Es muy raro? Con qu lo

    comparo? Con las funciones de densidad y de distribucin de la variable para toda la poblacin

    que atiende al centro de salud del hospital. De esa manera yo voy a saber si se separa mucho la

    distribucin tpica de la distribucin de la poblacin.