Presentación del curso de Bioestadística

Post on 23-Jun-2015

3.223 views 1 download

Transcript of Presentación del curso de Bioestadística

BioestadísticaLupita Valdez Zazueta

Temas de discusión

Estadística descriptivaProbabilidadEstimaciónPrueba de hipótesisDiseño de ExperimentosEstadística en la computadora

Estadística

Proporciona un conjunto de principios y metodologías para:

• colecta de datos

• su presentación y resumen,

• su interpretación

• Extraer conclusiones y generalidades

Su aplicación en medicina• Estadística vitalesPara facilitar su uso se requiere una comprensión

básica de la forma en que se determinan, que significan y como se emplean

• EpidemiologíaLos datos epidemiológicos muestran la prevalencia de

una enfermedad, la forma en que varía de acuerdo a la estación de año, la ubicación geográfica y como le afectan ciertos factores de riesgo

¿Qué tan sensible es una prueba de diagnóstico para la identificación de la presencia de la enfermedad y con cuanta frecuencia arroja resultados erróneos?

Procedimientos de diagnóstico

Valoración de protocolos de investigación

Ningún estudio proporciona información válida a menos que se diseñe y analice en forma científica.

Participación o dirección en proyectos de investigación

Es indispensable el conocimiento de la estadística y sus métodos de estudio, con él, podremos ser participantes activos en todos los aspectos de la investigación.

Algunas ramas de la estadística

• El diseño de experimentos guía al investigador a planear la manera y cuantos datos colectar.

• La estadística descriptiva resume y describe las características importantes de los datos.

• La inferencia estadística evalúa la información presente en los datos e indica el nuevo conocimiento ganado con esta información.

Objetivos principales de la estadística

• Hacer inferencias sobre una población a partir del análisis de la información de una muestra.

• Esto incluye medir el porcentaje de incertidumbre involucrado en estas inferencias.

• Diseñar el proceso de muestreo y el tamaño de la muestra de manera que las inferencias sean válidas.

• Los datos de un experimento proporcionan un nuevo conocimiento, y este en ocasiones sugiere una revisión de la teoría existente el cual requerirá mas investigación a través de mas experimento y análisis de datos.

Teoría de probabilidades

Estudia los métodos de análisis que son comunes en el tratamiento de fenómenos aleatorios, cualquiera que sea el área donde se presenten

Dos conceptos básicos: Población y muestra

Una población (estadística) es el conjunto de medidas (o registros) correspondientes a la colección completa de unidades de la cual se quiere inferir.

Una muestra de una población estadística es el conjunto de medidas que se colectan en el curso de una investigación

Estadística Descriptiva

Proporciona un conjunto de herramientas tales como tablas, gráficas, promedios, y otras para organizar y resumir la información de la muestra.

• Métodos Gráficos y Tabulares• Métodos Numéricos

Conceptos básicos

• Datos.Los datos estadísticos son valores de una

característica de interés medida en un conjunto de objetos o individuos.

Son la materia prima de las investigaciones.

Tipos de datos

• Cualitativos (categóricos)NominalesOrdinales

• Cuantitativos (numéricos)ContinuosDiscretos

Datos categóricos

• A) NominalesEn esta escala los datos son sólo categorías declasificación.Ejemplos.a) Variable: : Fumador/no fumadorb) Variable: Diabético/no-diabéticoc). Variable: Casado/soltero/divorciado/viudod). Variable: Tipo de sangres: A/B/AB/O

• B)Categóricos ordinalesEn esta escala, los datos también son categoríasde clasificación, pero existe un orden intrínsecoentre las categorías acorde con la variable quese está midiendo.Los datos pueden ser ordenados.

Datos Numéricos• A) DiscretosSe encuentran cuando las observaciones en

cuestión toman sólo un cierto número de valores.

Ejemplos.Conteos de eventos: número de hijos, número

de visitas al doctor.

• B) Numéricos continuosSer obtienen por medio de medicionesEjemplos:Peso, altura, temperatura, edad, presión

sanguínea, nivel de colesterol, % de grasa, etc.

• Estadísticamente, la escala de medición juega un papel muy importante. Las metodologías que se pueden aplicar en el análisis de datos están restringidas por la escala en la cual la variable fue medida.

Población estadística• Conjunto de todos los valores posibles de una

variable.Ejemplos• 1). Todos los pesos obtenidos para un objeto dado.• 2). Todos los valores de color para un conjunto de objetos dados.• 3). Todas las calificaciones obtenidas en una materia por los grupos de una universida

dada.

FrecuenciasClases Absolutas10-20 220-30 830-40 1240-50 750-60 1

30

0 10 20 30 40 50 60

Clases

0

2

4

6

8

10

12

fi

Distribución

Una distribución estadística es una función que indica la frecuencia de cada dato es una población dada

Distribuciones mediante ecuaciones

0 1 2 3 4X

0

0.1

0.2

0.3

0.4

0.5

p(x)

0 2 4 6 8

X0

0.1

0.2

0.3

0.4

0.5

f(x)

xxxCxp 313

21

2x

exxf

-4 -2 0 2 4

X

0

0.1

0.2

0.3

0.4

f(x) Normal Estandar

0 0.2 0.4 0.6 0.8 1

X

0

0.4

0.8

1.2

1.6

2

2.4

f(x) Beta

2

2

21

)(x

exf

11 1 xxxf

Un parámetro es una constante asociada a la distribución de una población estadística.

Ejemplos

Normal

Exponencial

Poisson

, 2

Parámetro

221

21

)(

x

exf

xexf

!x

exf

x

MuestraPorción o parte seleccionada de una

población estadística de interés.

Ejemplos

Población:

Muestra:

Edad de los estudiantes en una universidad.

Estudiantes mayores de 20 años.

Estadísticos

Las características numéricas calculadas a partir de una muestra se denominarán estadísticos.

Ejemplos

s2

proporción

varianza

media

x

Estadística descriptivaProcedimiento matemáticos para

transformar un conjunto de datos en índices que resuman las características de una población o una muestra

Los procedimientos pueden ser tabulares, gráficos o numéricos.

Métodos gráficos1). Tablas de Frecuencias.2). Histogramas.3). Polígonos.4). Ojivas (Distribuciones de frecuencias acumuladas).

Los métodos gráficos permiten estudiar, a partir de la distribución de un conjunto de datos, aspectos tales como: Forma, Localización (centro), Dispersión.

Ofrece un resumen mas compacto de los datos1.- Elegir un intervalo que contenga todos los

puntos.2.- Dividirlo en subintervalos (intervalos de

clase) de la misma longitud. Sus puntos medios se llaman marca de clase.

3.- Frecuencia de clase es el número de valores en una clase. Los dividimos entre el tamaño de la muestra (frec. relativa de clase).

Tabla de Frecuencias Cuantitativas

4.- Frecuencia acumulada de clase es el número de valores que pertenecen a esta y a las anteriores clases. Divididas entre el tamaño de la muestra se llama frecuencia relativa acumulada de clase.

5.- Determine el número de clases (k)

Para determinar el valor de k se puede usar cualquiera de los tres criterios siguientes:

b)k = 1 + 3.3log10(n)

c) Use la tabla siguiente

a) k = n

Métodos Numéricos

Medidas de tendencia central.

Sea x1,x2,..,xn, una muestra aleatoria (m.a.) de tamaño n de una población.

El primer paso para describir un conjunto de datos es definir un representante o centro, existen varios:

a). Media:n

xxx

n

xx n

n

ii

211

Ejemplo 1Valores de colesterol total/LAD en 9

pacientes sin crecimiento de lesión aterosclerótica.

23.69

)6.48.32.70.6( x

Calcule la media:

“Los pacientes muestran en promedio 6.23 mMol/L de colesterol”

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

La media se emplea cuando los datos pueden sumarse; es decir, se miden en una escala numérica.

La media es muy sensible a datos extremos o atípicos.

Notas:

Si colocáramos los datos en una balanza, la media sería el centro.

EjemploCalcule la mediana para los datos del

ejemplo 1

La muestra ordenada queda:

x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Como n=9 es impar por tanto, la mediana es

0.6~5 xx

“El 50% de los pacientes tiene niveles de colesterol mayores (menores) a 6.0 mMol/L”

Para observar como la mediana es menos sensible a datos extremos, eliminemos el dato 8.8. Y la mediana resulta en 5.91

La mediana resultó menos afectada que la media.Nota:

La mediana puede utilizarse tanto para datos numéricos como ordinales.

C). Moda:

EjemploCalcule la moda del ejemplo 1

Es la observación que se presenta con mayor frecuencia en la muestra.

El dato mas frecuente es 6.0 mMol/L., por tanto la moda es 6.

Solución:

Relación entre: Media, mediana (m) y moda(M)

m

M

x

M mx

Figura 1 Figura 2

¿Cuál medida utilizar?

Si la distribución de los datos es simétrica, y la variable es cuantitativa, de acuerdo a la figura 1, las tres medidas de tendencia central coinciden.

Si la variable es cualitativa se prefiere la mediana. Así mismo, si considera la posibilidad de que la muestra contenga datos atípicos.

Las propiedades matemáticas y estadísticas de la media hacen de esta la mas importante. Otras propiedades la hacen elección universal.

Notas:

1). La media es afectada por datos extremos.2). La mediana no es fácil de manipular algebraicamente.3). La moda puede no existir o haber varias modas.

Medidas de Variabilidad

Una medida de variabilidad (o dispersión) es un valor numérico que indica la magnitud de la separación entre los elementos de una muestra o población.

A: 10 20 60 B: 28 29 33

Compare los datos de tiempo de vida en ratones sometidos al tratamiento A y tratamiento B.

Ejemplo

nA=3, nB=3Media= 30, Media =30

Solución

En ambos casos “el tiempo de vida promedio es de 30 semanas”. Sin embargo, existe mayor variabilidad en los datos de tratamiento A.

Veremos algunas formas de medir variabilidad.

Hay al menos dos razones para medir variabilidad.

1)Para tener una idea de la precisión con la que un valor central muestral representa a la población.2)Para conocer la magnitud de la variabilidad y así poder tomar medidas para su control.

Las medidas de dispersión más utilizadas son:

a) El rangob) La varianzac) La desviación estándard) Coeficiente de variación

Comúnmente, la variabilidad se expresa como una desviación promedio de los datos con respecto al centro.

También puede expresarse como la posición de un dato con respecto a los demás.

a)El rango es mínimomáximo R

Ejemplo

La muestra A tiene mayor variabilidad que la B.

Calcule el rango para el ejemplo anterior.Solución:

RA= 50 - 60 = 50 RB = 33- 28 = 5

Nota: Aun cuando el rango es una medida sencilla de variabilidad, solo toma en cuenta dos datos para su cálculo.

b). La varianza es

n

i

i xxn

s

1

22

11

Calcule la varianza de los datos anteriores

70030603020301013

1 2222

As

730333029302813

1 2222

Bs

Preferimos tratamiento B porque tiene menor variabilidad

La varianza se expresa un unidades cuadradas, en el ejemplo anterior son semanas al cuadrado, si calculamos raíz cuadrada se obtiene una medida de variabilidad en las mismas unidades que los datos originales; así se define la desviación estándar o típica.

c). La desviación estándar es

n

i

i xxn

ss

1

22

11

7002 AS72 BS

45.26AS 645.2BSsem sem

sem2sem2

Gracias …

Lupita Valdez Zazueta