Resumen BIOESTADÍSTICA

BIOESTADSTICA

Variables

1. Cualitativas: todas aquellas que resumen cualidades de las personas

(gnero, trabajo...). Tendremos que recoger el nombre de la cualidad. Se

representan por tablas de frecuencias y grficos de barras, de sectores. Con

2 variables categricas Tablas de contingencia (d. marginales, conjunta y

condicionada la de la leyenda es la que conocemos)

2. Cuantitativas (numricas): aquellas que se pueden recoger en una

escala numrica (peso, estatura...)

2.1. Discretas: toman un conjunto finito de valores. Ej.: nmero de

hermanos de varias personas (0, 1, 2...). Se representan por Diagramas

de Barras y de Sectores.

2.2. Continuas: es aquella variable que puede tomar cualquier valor

dentro de un intervalo real. Ej.: estatura, peso. Se representan por:

Diagramas de tallo hojas

Histograma y polgono de frecuencias (el rea total del histograma =

rea total del polgono = 1)

Diagrama de cajas (Mnimo, P25, Mediana, P75 y Mximo) con:

R.I. = P75 P25; Bigotes P75+(1,5 R.I.) y P25-(1,5 R.I.)

Se suelen hacer tablas de frecuencias:

1. Organizar varias clases o categoras (). Amplitud constante.

Lmites de las clases con el mismo n de casas decimales.

2. Fronteras de cada clase (FS = (LS) de una clase

(LI) de la siguiente clase)

3. Marcas de clase (MCi =

2 )

4. Frecuencia absoluta (ni = n de sujetos en cada clase)

5. Frecuencia relativa (f = ni / total de sujetos)

6. Frecuencia acumulada (F = la suma de los datos de una clase

ms los que se encuentran en la anteriores) Ojiva

Parmetro: cantidad numrica calculada sobre una poblacin. (ej.: la altura

media de los individuos de un pas).

Estadstico: cantidad numrica calculada sobre una muestra. (ej.: la altura

media de los alumnos de una clase).

Central: Media: = xi / n (muy sensible a valores extremos)

Mediana: divide en 2 partes iguales (no es sens. a val. estr.)

Moda: valor ms repetido

Posicin: Cuantiles: se define el cuantil de orden como un valor

de la variable por debajo del cual se encuentra una frecuencia

acumulada . (ej.: 0,36)

Percentiles: Pk = cuantil de orden k/100 (P50 = mediana).

Cuartiles: 1er cuartil = P25= cuantil 0,25 2o cuartil = P50 = cuantil 0,5 = Mediana 3o cuartil = P75 = cuantil 0,75 Deciles

Dispersin: Amplitud: Max Min (muy sens. a valores extremos)

Rango Intercuartlico: P75 P25 (no sens. a val. extr.)

Varianza (S2) =()2

n (muy sens. a valores extremos)

Desviacin estndar (S) = S2; ( = 0,68; 2 =

0,95; 3 = 0,99)

Coeficiente de Variacin o Variabilidad : CF=S/Media

Forma: Asimetra (Sesgo): Distribucin Simtrica: Media = Mediana

Dist. c/ Asimetra Izda: Media < Mediana

Dist. c/ Asimetra Dcha: Media > Median

Apuntamento (Kurtosis):

Leptocrtica (valores concentr.) g2>3 kurtosis > 0

Mesocrtica (como la normal): g2=3 kurtosis = 0

Platicrtica (aplanada, valores muy separados): g2

Probabilidad

1. Suceso elemental: cualquier acontecimiento que puede ocurrir como

resultado de un experimento. Se nombran con letras maysculas: A, B, C

2. Relacin entre sucesos: Interseccin: A B (A y B) Al mismo tiempo

Unin: A B (A o B) Uno u otro

Complementario o no A: () A + = 1

Disjunto (incompatible/mutuamente excluyente):

si hay A, no hay B No hay interseccin

Diferencia: A B = P(A B) P(B)

Diferencia Simtrica: A B = P(AB) P(AB)

Axioma de Probabilidad: P(AB)=P(A)+P(B)-P(AB)

3. Espacios Muestrales (E o ): conjunto de sucesos que pueden ser el

resultado de un experimento aleatorio. Tienen que ser exhaustivos y que

sean sucesos mutuamente excluyentes, que no haya interseccin entre

ellos. P()=1

4. Tipos de espacios muestrales: Discretos: variables/sucesos discretos

Continuas: infinitos sucesos posibles

5. Probabilizacin: Subjetiva: damos el valor que creamos a ese suceso

Clsica/Laplace: P(R) =

Frecuentista: P(R) = .

. .

6. Independencia: P (E, T) = P(E) P(T) Si no se cumple, hay asociacin

Independencia: Las d. marg. dan la d. conjunta

Asociacin: Las d. marginales. no dan la d.

conjunta estimar Prob. Condicionada: P(E|T) = (,)

()

7. Parmetros Importantes: Test Diagnstico (Clnica):

Valor. Pred. Pos.: P(E|T) = P(E,T) / P(T) prob. de q un individuo

est enfermo sabiendo que el test fue Positivo.

Valor. Pred. Neg.: P(|) = P(,) / P() prob. de q un individuo

no est enfermo sabiendo que el test fue Negativo.

Medir efectividad de los test (Laboratorio):

Sensibilidad P(+|E): P(T|E) = P(T,E) / P(E) prob. de q un enfermo

de Positivo al realizar el test diagnstico.

Especificidad P(-|): P(|) = P(,) / P() prob. de que una

persona no enferma de Negativo, al realizar el test diagnstico.

Falso Negativo (1-Sensibil.) P(-|E): P(|E) prob. de que un

enfermo de Negativo, al realizar el test diagnstico.

Falso Positivo (1-Especif.) P(+|): P(T|) prob. de que un sano

de Positivo, al realizar el test diagnstico.

8. Probabilidades Condicionadas: = 0 (Independentes): P(E,T)=P(E).P(T)

P(E|T) = P(E); P(T|E) = P(T)

= 1 (Asoc. Perfecta) Patognomnico

entre 0 y 1 Clnica

9. Teorema de Bayes: Valor Pred. Pos., Sensibilidad, Prevalencia, FPos.

(|) = (, )

()=

(, )

(, ) + (, )=

(|) P(E)

(|) P(E) + (|) P()

Distribuciones de Probabilidad

1. Variables Discretas y Continuas Espacios Muestrales Discretos y

Continuos

2. Frecuencia Relativa Funcin de Densidad (Cont.) o Funcin

Cuanta (Disc.): f(x) = P[X=x] Repres.: (Disc.: Diagrama de Barras;

Cont.: Histograma y Polgono de Frecuencias P[aXb] = F[b] - F[a] =

()

)

3. Frecuencia Acumulada Funcin de Distribucin: F(x) = P[Xx]

Repres.: Ojiva (Disc.: a saltos; Cont.: contnua)

4. Funcin de Supervivencia: S(x) = 1 Funcin de Distribucin = 1 F(x)

= P[Xx] Repres.: Ojiva inversa

5. Media Esperanza Matemtica

Modelos de Probabilidad

1. Bernoulli: 1 experimento 2 resultados

=[EX=1(xito); FX=0(fracaso)]

Funcin Cuanta: f(1) = P[X=1] = p (prob. de xito)

f(0) = P[X=0] = q =(1 p) (prob. de fracaso)

Funcin Distribucin: F(1) = P[X1] = p + q = 1

F(0) = P[X0] = (1 p)

x = E[X] = p | 2x(varianza)=p.q | x=.

2. Binomial: n experimentos de Bernoulli, de forma independiente.

Para cada exper. una variable dicotmica X(1,2,n) que toma

valores 1(xito) o 0(fracaso).

X1+X2+Xn = X = n de xitos en n pruebas

X Bi(n,p) | 0Xn n=n pruebas indep. | p=prob. xito en cada prueba n

Funcin Cuanta: f(x) = P[X=x] = . . (1 )() Stata: di

binomialp(n,x,p)

Funcin Distribucin: F(x) = P[Xx] = . . (1 )()

=0

Stata: di binomial(n,k,p)

Muestreo con

replazamiento

Donde: =

=

!

!()!

x = E[X] = n.p | 2x(varianza)=n.p.q | x=. .

3. Poisson: Dist. discreta ms utilizada de la binomial, para pZ>3

5. Aproximaciones: Binomial a Poisson (Lmite I): n +, y p muy peqo

Poisson a Normal (Lmite II): >10

Binomial a Normal (Lmite III): nxp>5

Asociacin: Var. Cuantitativas Numericas

Modelo de Regresin: 2 variables: ej. peso y permetro torcico: 2 metodos

1. Estudio Grafico: Diagramas de Dispersin: Nube (0): asociacin nula;

Nube (Alargada): pendiente positiva asoc. positiva / negativa negativ.

2. Estudio Analitico: Calcular media y d.est.; las medias de las 2 variables

se cruzan en el centro de gravedad

Covarianza (Sx,y): medida de dispersin respecto al centro de

gravedad

Coeficiente de Correlacin (Pearson): entre -1 y +1. Cuanto

ms se acerquen al cero menos asociacin habr. Hablaremos de una

asociacin significativa a partir de +/-0,8

3. Modelo de Regresin Lineal: y=ax+b b = ,

^2 = rx,y .

R2x,y = r2x,y . 100

Stata:1. Para hacer el anlisis mediante stata haremos un diagrama

de dispersin: Grficos - Twoway graph Scatter.

2.Calcularemos las medias y editaremos el grafico para aadir las

lneas de referencia, as tendremos el punto de gravedad

3.Haremos el anlisis de regresin Statistics - Lineal models - Lineal regressions. Obtendremos la pendiente b y la constante a.

Estadstica Inferencial

Muestreo aleatorio simple mediante tablas. Este se puede hacer con o sin

reemplazamiento

Muestreo sistemtico, estratificado y por conglomerados

Inferencia: dar un salto de la muestra a la poblacin, tomando los

resultados de la primera. Ese salto va a implicar siempre el error aleatorio.

Sesgo de seleccin = error sistemtico

Dos tipos de sesgos:

Sesgos o errores sistemticos si hay P= 0 de ser incluido. No es

representativa, hay un sesgo de seleccin

Sesgo de informacin si no recogemos la informacin de forma

idntica en todos los individuos podemos estar cometiendo un sesgo

de informacin

Resumen BIOESTADÍSTICA

Documents

Transcript of Resumen BIOESTADÍSTICA