Resumen BIOESTADÍSTICA

9
BIOESTADÍSTICA Variables 1. Cualitativas: todas aquellas que resumen cualidades de las personas (género, trabajo...). Tendremos que recoger el nombre de la cualidad. Se representan por tablas de frecuencias y gráficos de barras, de sectores. Con 2 variables categóricas Tablas de contingencia (d. marginales, conjunta y condicionada la de la leyenda es la que conocemos) 2. Cuantitativas (numéricas): aquellas que se pueden recoger en una escala numérica (peso, estatura...) 2.1. Discretas: toman un conjunto finito de valores. Ej.: número de hermanos de varias personas (0, 1, 2...). Se representan por Diagramas de Barras y de Sectores. 2.2. Continuas: es aquella variable que puede tomar cualquier valor dentro de un intervalo real. Ej.: estatura, peso. Se representan por: Diagramas de tallo hojas Histograma y polígono de frecuencias (el área total del histograma = área total del polígono = 1) Diagrama de cajas (Mínimo, P25, Mediana, P75 y Máximo) con: R.I. = P75 P25; Bigotes P75+(1,5 R.I.) y P25-(1,5 R.I.) Se suelen hacer tablas de frecuencias: 1. Organizar varias clases o categorías (). Amplitud constante. Límites de las clases con el mismo nº de casas decimales. 2. Fronteras de cada clase (FS = (LS) de una clase (LI) de la siguiente clase ) 3. Marcas de clase (MCi = 2 ) 4. Frecuencia absoluta (ni = nº de sujetos en cada clase) 5. Frecuencia relativa (f = ni / total de sujetos) 6. Frecuencia acumulada (F = la suma de los datos de una clase más los que se encuentran en la anteriores) Ojiva

description

Resumen

Transcript of Resumen BIOESTADÍSTICA

  • BIOESTADSTICA

    Variables

    1. Cualitativas: todas aquellas que resumen cualidades de las personas

    (gnero, trabajo...). Tendremos que recoger el nombre de la cualidad. Se

    representan por tablas de frecuencias y grficos de barras, de sectores. Con

    2 variables categricas Tablas de contingencia (d. marginales, conjunta y

    condicionada la de la leyenda es la que conocemos)

    2. Cuantitativas (numricas): aquellas que se pueden recoger en una

    escala numrica (peso, estatura...)

    2.1. Discretas: toman un conjunto finito de valores. Ej.: nmero de

    hermanos de varias personas (0, 1, 2...). Se representan por Diagramas

    de Barras y de Sectores.

    2.2. Continuas: es aquella variable que puede tomar cualquier valor

    dentro de un intervalo real. Ej.: estatura, peso. Se representan por:

    Diagramas de tallo hojas

    Histograma y polgono de frecuencias (el rea total del histograma =

    rea total del polgono = 1)

    Diagrama de cajas (Mnimo, P25, Mediana, P75 y Mximo) con:

    R.I. = P75 P25; Bigotes P75+(1,5 R.I.) y P25-(1,5 R.I.)

    Se suelen hacer tablas de frecuencias:

    1. Organizar varias clases o categoras (). Amplitud constante.

    Lmites de las clases con el mismo n de casas decimales.

    2. Fronteras de cada clase (FS = (LS) de una clase

    (LI) de la siguiente clase)

    3. Marcas de clase (MCi =

    2 )

    4. Frecuencia absoluta (ni = n de sujetos en cada clase)

    5. Frecuencia relativa (f = ni / total de sujetos)

    6. Frecuencia acumulada (F = la suma de los datos de una clase

    ms los que se encuentran en la anteriores) Ojiva

  • Parmetro: cantidad numrica calculada sobre una poblacin. (ej.: la altura

    media de los individuos de un pas).

    Estadstico: cantidad numrica calculada sobre una muestra. (ej.: la altura

    media de los alumnos de una clase).

    Central: Media: = xi / n (muy sensible a valores extremos)

    Mediana: divide en 2 partes iguales (no es sens. a val. estr.)

    Moda: valor ms repetido

    Posicin: Cuantiles: se define el cuantil de orden como un valor

    de la variable por debajo del cual se encuentra una frecuencia

    acumulada . (ej.: 0,36)

    Percentiles: Pk = cuantil de orden k/100 (P50 = mediana).

    Cuartiles: 1er cuartil = P25= cuantil 0,25 2o cuartil = P50 = cuantil 0,5 = Mediana 3o cuartil = P75 = cuantil 0,75 Deciles

    Dispersin: Amplitud: Max Min (muy sens. a valores extremos)

    Rango Intercuartlico: P75 P25 (no sens. a val. extr.)

    Varianza (S2) =()2

    n (muy sens. a valores extremos)

    Desviacin estndar (S) = S2; ( = 0,68; 2 =

    0,95; 3 = 0,99)

    Coeficiente de Variacin o Variabilidad : CF=S/Media

    Forma: Asimetra (Sesgo): Distribucin Simtrica: Media = Mediana

    Dist. c/ Asimetra Izda: Media < Mediana

    Dist. c/ Asimetra Dcha: Media > Median

    Apuntamento (Kurtosis):

    Leptocrtica (valores concentr.) g2>3 kurtosis > 0

    Mesocrtica (como la normal): g2=3 kurtosis = 0

    Platicrtica (aplanada, valores muy separados): g2

  • Probabilidad

    1. Suceso elemental: cualquier acontecimiento que puede ocurrir como

    resultado de un experimento. Se nombran con letras maysculas: A, B, C

    2. Relacin entre sucesos: Interseccin: A B (A y B) Al mismo tiempo

    Unin: A B (A o B) Uno u otro

    Complementario o no A: () A + = 1

    Disjunto (incompatible/mutuamente excluyente):

    si hay A, no hay B No hay interseccin

    Diferencia: A B = P(A B) P(B)

    Diferencia Simtrica: A B = P(AB) P(AB)

    Axioma de Probabilidad: P(AB)=P(A)+P(B)-P(AB)

    3. Espacios Muestrales (E o ): conjunto de sucesos que pueden ser el

    resultado de un experimento aleatorio. Tienen que ser exhaustivos y que

    sean sucesos mutuamente excluyentes, que no haya interseccin entre

    ellos. P()=1

    4. Tipos de espacios muestrales: Discretos: variables/sucesos discretos

    Continuas: infinitos sucesos posibles

    5. Probabilizacin: Subjetiva: damos el valor que creamos a ese suceso

    Clsica/Laplace: P(R) =

    Frecuentista: P(R) = .

    . .

    6. Independencia: P (E, T) = P(E) P(T) Si no se cumple, hay asociacin

    Independencia: Las d. marg. dan la d. conjunta

    Asociacin: Las d. marginales. no dan la d.

    conjunta estimar Prob. Condicionada: P(E|T) = (,)

    ()

  • 7. Parmetros Importantes: Test Diagnstico (Clnica):

    Valor. Pred. Pos.: P(E|T) = P(E,T) / P(T) prob. de q un individuo

    est enfermo sabiendo que el test fue Positivo.

    Valor. Pred. Neg.: P(|) = P(,) / P() prob. de q un individuo

    no est enfermo sabiendo que el test fue Negativo.

    Medir efectividad de los test (Laboratorio):

    Sensibilidad P(+|E): P(T|E) = P(T,E) / P(E) prob. de q un enfermo

    de Positivo al realizar el test diagnstico.

    Especificidad P(-|): P(|) = P(,) / P() prob. de que una

    persona no enferma de Negativo, al realizar el test diagnstico.

    Falso Negativo (1-Sensibil.) P(-|E): P(|E) prob. de que un

    enfermo de Negativo, al realizar el test diagnstico.

    Falso Positivo (1-Especif.) P(+|): P(T|) prob. de que un sano

    de Positivo, al realizar el test diagnstico.

    8. Probabilidades Condicionadas: = 0 (Independentes): P(E,T)=P(E).P(T)

    P(E|T) = P(E); P(T|E) = P(T)

    = 1 (Asoc. Perfecta) Patognomnico

    entre 0 y 1 Clnica

    9. Teorema de Bayes: Valor Pred. Pos., Sensibilidad, Prevalencia, FPos.

    (|) = (, )

    ()=

    (, )

    (, ) + (, )=

    (|) P(E)

    (|) P(E) + (|) P()

  • Distribuciones de Probabilidad

    1. Variables Discretas y Continuas Espacios Muestrales Discretos y

    Continuos

    2. Frecuencia Relativa Funcin de Densidad (Cont.) o Funcin

    Cuanta (Disc.): f(x) = P[X=x] Repres.: (Disc.: Diagrama de Barras;

    Cont.: Histograma y Polgono de Frecuencias P[aXb] = F[b] - F[a] =

    ()

    )

    3. Frecuencia Acumulada Funcin de Distribucin: F(x) = P[Xx]

    Repres.: Ojiva (Disc.: a saltos; Cont.: contnua)

    4. Funcin de Supervivencia: S(x) = 1 Funcin de Distribucin = 1 F(x)

    = P[Xx] Repres.: Ojiva inversa

    5. Media Esperanza Matemtica

    Modelos de Probabilidad

    1. Bernoulli: 1 experimento 2 resultados

    =[EX=1(xito); FX=0(fracaso)]

    Funcin Cuanta: f(1) = P[X=1] = p (prob. de xito)

    f(0) = P[X=0] = q =(1 p) (prob. de fracaso)

    Funcin Distribucin: F(1) = P[X1] = p + q = 1

    F(0) = P[X0] = (1 p)

    x = E[X] = p | 2x(varianza)=p.q | x=.

    2. Binomial: n experimentos de Bernoulli, de forma independiente.

    Para cada exper. una variable dicotmica X(1,2,n) que toma

    valores 1(xito) o 0(fracaso).

    X1+X2+Xn = X = n de xitos en n pruebas

    X Bi(n,p) | 0Xn n=n pruebas indep. | p=prob. xito en cada prueba n

    Funcin Cuanta: f(x) = P[X=x] = . . (1 )() Stata: di

    binomialp(n,x,p)

    Funcin Distribucin: F(x) = P[Xx] = . . (1 )()

    =0

    Stata: di binomial(n,k,p)

    Muestreo con

    replazamiento

  • Donde: =

    =

    !

    !()!

    x = E[X] = n.p | 2x(varianza)=n.p.q | x=. .

    3. Poisson: Dist. discreta ms utilizada de la binomial, para pZ>3

    5. Aproximaciones: Binomial a Poisson (Lmite I): n +, y p muy peqo

    Poisson a Normal (Lmite II): >10

    Binomial a Normal (Lmite III): nxp>5

  • Asociacin: Var. Cuantitativas Numericas

    Modelo de Regresin: 2 variables: ej. peso y permetro torcico: 2 metodos

    1. Estudio Grafico: Diagramas de Dispersin: Nube (0): asociacin nula;

    Nube (Alargada): pendiente positiva asoc. positiva / negativa negativ.

    2. Estudio Analitico: Calcular media y d.est.; las medias de las 2 variables

    se cruzan en el centro de gravedad

    Covarianza (Sx,y): medida de dispersin respecto al centro de

    gravedad

    Coeficiente de Correlacin (Pearson): entre -1 y +1. Cuanto

    ms se acerquen al cero menos asociacin habr. Hablaremos de una

    asociacin significativa a partir de +/-0,8

    3. Modelo de Regresin Lineal: y=ax+b b = ,

    ^2 = rx,y .

    R2x,y = r2x,y . 100

    Stata:1. Para hacer el anlisis mediante stata haremos un diagrama

    de dispersin: Grficos - Twoway graph Scatter.

    2.Calcularemos las medias y editaremos el grafico para aadir las

    lneas de referencia, as tendremos el punto de gravedad

    3.Haremos el anlisis de regresin Statistics - Lineal models - Lineal regressions. Obtendremos la pendiente b y la constante a.

    Estadstica Inferencial

    Muestreo aleatorio simple mediante tablas. Este se puede hacer con o sin

    reemplazamiento

    Muestreo sistemtico, estratificado y por conglomerados

    Inferencia: dar un salto de la muestra a la poblacin, tomando los

    resultados de la primera. Ese salto va a implicar siempre el error aleatorio.

    Sesgo de seleccin = error sistemtico

    Dos tipos de sesgos:

    Sesgos o errores sistemticos si hay P= 0 de ser incluido. No es

    representativa, hay un sesgo de seleccin

  • Sesgo de informacin si no recogemos la informacin de forma

    idntica en todos los individuos podemos estar cometiendo un sesgo

    de informacin