Resumen BIOESTADÍSTICA
-
Upload
antonio-paquito -
Category
Documents
-
view
17 -
download
0
description
Transcript of Resumen BIOESTADÍSTICA
-
BIOESTADSTICA
Variables
1. Cualitativas: todas aquellas que resumen cualidades de las personas
(gnero, trabajo...). Tendremos que recoger el nombre de la cualidad. Se
representan por tablas de frecuencias y grficos de barras, de sectores. Con
2 variables categricas Tablas de contingencia (d. marginales, conjunta y
condicionada la de la leyenda es la que conocemos)
2. Cuantitativas (numricas): aquellas que se pueden recoger en una
escala numrica (peso, estatura...)
2.1. Discretas: toman un conjunto finito de valores. Ej.: nmero de
hermanos de varias personas (0, 1, 2...). Se representan por Diagramas
de Barras y de Sectores.
2.2. Continuas: es aquella variable que puede tomar cualquier valor
dentro de un intervalo real. Ej.: estatura, peso. Se representan por:
Diagramas de tallo hojas
Histograma y polgono de frecuencias (el rea total del histograma =
rea total del polgono = 1)
Diagrama de cajas (Mnimo, P25, Mediana, P75 y Mximo) con:
R.I. = P75 P25; Bigotes P75+(1,5 R.I.) y P25-(1,5 R.I.)
Se suelen hacer tablas de frecuencias:
1. Organizar varias clases o categoras (). Amplitud constante.
Lmites de las clases con el mismo n de casas decimales.
2. Fronteras de cada clase (FS = (LS) de una clase
(LI) de la siguiente clase)
3. Marcas de clase (MCi =
2 )
4. Frecuencia absoluta (ni = n de sujetos en cada clase)
5. Frecuencia relativa (f = ni / total de sujetos)
6. Frecuencia acumulada (F = la suma de los datos de una clase
ms los que se encuentran en la anteriores) Ojiva
-
Parmetro: cantidad numrica calculada sobre una poblacin. (ej.: la altura
media de los individuos de un pas).
Estadstico: cantidad numrica calculada sobre una muestra. (ej.: la altura
media de los alumnos de una clase).
Central: Media: = xi / n (muy sensible a valores extremos)
Mediana: divide en 2 partes iguales (no es sens. a val. estr.)
Moda: valor ms repetido
Posicin: Cuantiles: se define el cuantil de orden como un valor
de la variable por debajo del cual se encuentra una frecuencia
acumulada . (ej.: 0,36)
Percentiles: Pk = cuantil de orden k/100 (P50 = mediana).
Cuartiles: 1er cuartil = P25= cuantil 0,25 2o cuartil = P50 = cuantil 0,5 = Mediana 3o cuartil = P75 = cuantil 0,75 Deciles
Dispersin: Amplitud: Max Min (muy sens. a valores extremos)
Rango Intercuartlico: P75 P25 (no sens. a val. extr.)
Varianza (S2) =()2
n (muy sens. a valores extremos)
Desviacin estndar (S) = S2; ( = 0,68; 2 =
0,95; 3 = 0,99)
Coeficiente de Variacin o Variabilidad : CF=S/Media
Forma: Asimetra (Sesgo): Distribucin Simtrica: Media = Mediana
Dist. c/ Asimetra Izda: Media < Mediana
Dist. c/ Asimetra Dcha: Media > Median
Apuntamento (Kurtosis):
Leptocrtica (valores concentr.) g2>3 kurtosis > 0
Mesocrtica (como la normal): g2=3 kurtosis = 0
Platicrtica (aplanada, valores muy separados): g2
-
Probabilidad
1. Suceso elemental: cualquier acontecimiento que puede ocurrir como
resultado de un experimento. Se nombran con letras maysculas: A, B, C
2. Relacin entre sucesos: Interseccin: A B (A y B) Al mismo tiempo
Unin: A B (A o B) Uno u otro
Complementario o no A: () A + = 1
Disjunto (incompatible/mutuamente excluyente):
si hay A, no hay B No hay interseccin
Diferencia: A B = P(A B) P(B)
Diferencia Simtrica: A B = P(AB) P(AB)
Axioma de Probabilidad: P(AB)=P(A)+P(B)-P(AB)
3. Espacios Muestrales (E o ): conjunto de sucesos que pueden ser el
resultado de un experimento aleatorio. Tienen que ser exhaustivos y que
sean sucesos mutuamente excluyentes, que no haya interseccin entre
ellos. P()=1
4. Tipos de espacios muestrales: Discretos: variables/sucesos discretos
Continuas: infinitos sucesos posibles
5. Probabilizacin: Subjetiva: damos el valor que creamos a ese suceso
Clsica/Laplace: P(R) =
Frecuentista: P(R) = .
. .
6. Independencia: P (E, T) = P(E) P(T) Si no se cumple, hay asociacin
Independencia: Las d. marg. dan la d. conjunta
Asociacin: Las d. marginales. no dan la d.
conjunta estimar Prob. Condicionada: P(E|T) = (,)
()
-
7. Parmetros Importantes: Test Diagnstico (Clnica):
Valor. Pred. Pos.: P(E|T) = P(E,T) / P(T) prob. de q un individuo
est enfermo sabiendo que el test fue Positivo.
Valor. Pred. Neg.: P(|) = P(,) / P() prob. de q un individuo
no est enfermo sabiendo que el test fue Negativo.
Medir efectividad de los test (Laboratorio):
Sensibilidad P(+|E): P(T|E) = P(T,E) / P(E) prob. de q un enfermo
de Positivo al realizar el test diagnstico.
Especificidad P(-|): P(|) = P(,) / P() prob. de que una
persona no enferma de Negativo, al realizar el test diagnstico.
Falso Negativo (1-Sensibil.) P(-|E): P(|E) prob. de que un
enfermo de Negativo, al realizar el test diagnstico.
Falso Positivo (1-Especif.) P(+|): P(T|) prob. de que un sano
de Positivo, al realizar el test diagnstico.
8. Probabilidades Condicionadas: = 0 (Independentes): P(E,T)=P(E).P(T)
P(E|T) = P(E); P(T|E) = P(T)
= 1 (Asoc. Perfecta) Patognomnico
entre 0 y 1 Clnica
9. Teorema de Bayes: Valor Pred. Pos., Sensibilidad, Prevalencia, FPos.
(|) = (, )
()=
(, )
(, ) + (, )=
(|) P(E)
(|) P(E) + (|) P()
-
Distribuciones de Probabilidad
1. Variables Discretas y Continuas Espacios Muestrales Discretos y
Continuos
2. Frecuencia Relativa Funcin de Densidad (Cont.) o Funcin
Cuanta (Disc.): f(x) = P[X=x] Repres.: (Disc.: Diagrama de Barras;
Cont.: Histograma y Polgono de Frecuencias P[aXb] = F[b] - F[a] =
()
)
3. Frecuencia Acumulada Funcin de Distribucin: F(x) = P[Xx]
Repres.: Ojiva (Disc.: a saltos; Cont.: contnua)
4. Funcin de Supervivencia: S(x) = 1 Funcin de Distribucin = 1 F(x)
= P[Xx] Repres.: Ojiva inversa
5. Media Esperanza Matemtica
Modelos de Probabilidad
1. Bernoulli: 1 experimento 2 resultados
=[EX=1(xito); FX=0(fracaso)]
Funcin Cuanta: f(1) = P[X=1] = p (prob. de xito)
f(0) = P[X=0] = q =(1 p) (prob. de fracaso)
Funcin Distribucin: F(1) = P[X1] = p + q = 1
F(0) = P[X0] = (1 p)
x = E[X] = p | 2x(varianza)=p.q | x=.
2. Binomial: n experimentos de Bernoulli, de forma independiente.
Para cada exper. una variable dicotmica X(1,2,n) que toma
valores 1(xito) o 0(fracaso).
X1+X2+Xn = X = n de xitos en n pruebas
X Bi(n,p) | 0Xn n=n pruebas indep. | p=prob. xito en cada prueba n
Funcin Cuanta: f(x) = P[X=x] = . . (1 )() Stata: di
binomialp(n,x,p)
Funcin Distribucin: F(x) = P[Xx] = . . (1 )()
=0
Stata: di binomial(n,k,p)
Muestreo con
replazamiento
-
Donde: =
=
!
!()!
x = E[X] = n.p | 2x(varianza)=n.p.q | x=. .
3. Poisson: Dist. discreta ms utilizada de la binomial, para pZ>3
5. Aproximaciones: Binomial a Poisson (Lmite I): n +, y p muy peqo
Poisson a Normal (Lmite II): >10
Binomial a Normal (Lmite III): nxp>5
-
Asociacin: Var. Cuantitativas Numericas
Modelo de Regresin: 2 variables: ej. peso y permetro torcico: 2 metodos
1. Estudio Grafico: Diagramas de Dispersin: Nube (0): asociacin nula;
Nube (Alargada): pendiente positiva asoc. positiva / negativa negativ.
2. Estudio Analitico: Calcular media y d.est.; las medias de las 2 variables
se cruzan en el centro de gravedad
Covarianza (Sx,y): medida de dispersin respecto al centro de
gravedad
Coeficiente de Correlacin (Pearson): entre -1 y +1. Cuanto
ms se acerquen al cero menos asociacin habr. Hablaremos de una
asociacin significativa a partir de +/-0,8
3. Modelo de Regresin Lineal: y=ax+b b = ,
^2 = rx,y .
R2x,y = r2x,y . 100
Stata:1. Para hacer el anlisis mediante stata haremos un diagrama
de dispersin: Grficos - Twoway graph Scatter.
2.Calcularemos las medias y editaremos el grafico para aadir las
lneas de referencia, as tendremos el punto de gravedad
3.Haremos el anlisis de regresin Statistics - Lineal models - Lineal regressions. Obtendremos la pendiente b y la constante a.
Estadstica Inferencial
Muestreo aleatorio simple mediante tablas. Este se puede hacer con o sin
reemplazamiento
Muestreo sistemtico, estratificado y por conglomerados
Inferencia: dar un salto de la muestra a la poblacin, tomando los
resultados de la primera. Ese salto va a implicar siempre el error aleatorio.
Sesgo de seleccin = error sistemtico
Dos tipos de sesgos:
Sesgos o errores sistemticos si hay P= 0 de ser incluido. No es
representativa, hay un sesgo de seleccin
-
Sesgo de informacin si no recogemos la informacin de forma
idntica en todos los individuos podemos estar cometiendo un sesgo
de informacin