Análisis Cuantitativo de Datos (Básico) Medicina Preventiva Facultad de Medicina UJED.

Post on 23-Jan-2016

221 views 1 download

Transcript of Análisis Cuantitativo de Datos (Básico) Medicina Preventiva Facultad de Medicina UJED.

Análisis Cuantitativo Análisis Cuantitativo de Datos (Básico)de Datos (Básico)

Medicina PreventivaMedicina Preventiva

Facultad de MedicinaFacultad de Medicina

UJEDUJED

¿Para qué necesitamos la ¿Para qué necesitamos la estadística?estadística?

“… “… el mundo está lleno de variaciones, y a el mundo está lleno de variaciones, y a veces se hace difícil descubrir las veces se hace difícil descubrir las verdaderas diferencias que surgen como verdaderas diferencias que surgen como consecuencia (de esas variaciones). La consecuencia (de esas variaciones). La estadística no sería necesaria si todas las estadística no sería necesaria si todas las personas fueran idénticas”personas fueran idénticas”

Norman y Streiner. Norman y Streiner. Bioestadística.Bioestadística.

Tema 2. Muestras y Tema 2. Muestras y PoblacionesPoblaciones

EstadísticaEstadística

La La E. E. InferencialInferencial nos permite hacer nos permite hacer generalizaciones de la información generalizaciones de la información obtenida, al obtenerla de una número obtenida, al obtenerla de una número pequeñopequeño de individuos y suponerla –de de individuos y suponerla –de manera válida- para un número manera válida- para un número grandegrande. .

La MUESTRA describe los individuos que se están

estudiando

Esta descripción se GENERALIZA para aplicarse …

…en un (habitualmente) muy grande número de personas, que conforman la

POBLACIÓN de interés

¿Por qué podemos ¿Por qué podemos GENERALIZAR?GENERALIZAR?

Es casi seguro que no podemos levantar datos Es casi seguro que no podemos levantar datos en TODA LA POBLACIÓN, en razón de tiempo en TODA LA POBLACIÓN, en razón de tiempo y costo. Sólo por este hecho, reconocemos que y costo. Sólo por este hecho, reconocemos que nuestros resultados PUEDEN SER nuestros resultados PUEDEN SER DIFERENTES de los “verdaderos” DIFERENTES de los “verdaderos”

Suponemos también que de dos individuos de Suponemos también que de dos individuos de características semejantes (o de plano iguales), características semejantes (o de plano iguales), si entrevistamos a uno, el otro nos daría si entrevistamos a uno, el otro nos daría respuestas muy parecidas, pero … respuestas muy parecidas, pero …

… … no todos son iguales.no todos son iguales.

Esto quiere decir que hay que buscar la Esto quiere decir que hay que buscar la manera de preguntarle a un número tal de manera de preguntarle a un número tal de individuos que tengamos confianza de que individuos que tengamos confianza de que son bastante diferentes entre si (tamaño), son bastante diferentes entre si (tamaño), pero que todas las “diferencias” sean pero que todas las “diferencias” sean tomadas en cuenta (representatividad).tomadas en cuenta (representatividad).

Error AleatorioError Aleatorio

Por muy cuidadosos que seamos en el Por muy cuidadosos que seamos en el proceso de medición, no estamos exentos proceso de medición, no estamos exentos de errores involuntarios.de errores involuntarios.

Estos errores –aleatorios- pueden Estos errores –aleatorios- pueden conducirnos a establecer conclusiones conducirnos a establecer conclusiones falsasfalsas

Tipos de MuestreoTipos de Muestreo

Muestreo Aleatorio Simple: Muestreo Aleatorio Simple: Es la forma más Es la forma más común de obtener una muestra en la selección común de obtener una muestra en la selección al azar, es decir, cada uno de los individuos de al azar, es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser una población tiene la misma posibilidad de ser elegido. elegido.

Muestreo Aleatorio Sistemático: Muestreo Aleatorio Sistemático: Es una Es una técnica de muestreo que requiere de una técnica de muestreo que requiere de una selección aleatoria inicial de observaciones selección aleatoria inicial de observaciones seguida de otra selección de observaciones seguida de otra selección de observaciones obtenida usando alguna regla obtenida usando alguna regla

Tipos de MuestreoTipos de Muestreo

Muestreo Aleatorio Estratificado: Muestreo Aleatorio Estratificado: Una Una muestra es estratificada cuando los elementos muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia de la muestra son proporcionales a su presencia en la población. en la población.

Muestreo Aleatorio por Área o Muestreo Aleatorio por Área o Conglomerado: Conglomerado: Requiere de elegir una Requiere de elegir una muestra aleatoria simple de unidades muestra aleatoria simple de unidades heterogéneas entre sí de la población llamadas heterogéneas entre sí de la población llamadas conglomeradosconglomerados

Conforme a su experiencia personal, la Conforme a su experiencia personal, la siguiente gráfica puede representar el siguiente gráfica puede representar el número de hijos de las madres en el número de hijos de las madres en el municipio? municipio?

Número de Hijos por Madre

0.00

0.05

0.10

0.15

0.20

0.25

0.30

1 2 3 4 5 6 7 8 9 10 11 12 13

Fre

cuen

cia

Rel

ativ

a

¿Está de acuerdo en que, al día hoy, es ¿Está de acuerdo en que, al día hoy, es mas probable encontrar mamás con 4 mas probable encontrar mamás con 4 hijos que con 10 ?hijos que con 10 ?

¿Qué piensa de “3 hijos” comparado con ¿Qué piensa de “3 hijos” comparado con “6 hijos”? ¿Es más probable ?“6 hijos”? ¿Es más probable ?

¿Y de “2 hijos” vs. “4 hijos”?¿Y de “2 hijos” vs. “4 hijos”?

ProbabilidadProbabilidad

Hay una relación muy estrecha entre los Hay una relación muy estrecha entre los conceptos conceptos Frecuencia RelativaFrecuencia Relativa y y ProbabilidadProbabilidad, al grado de que después de , al grado de que después de realizar un número muy, pero muy grande realizar un número muy, pero muy grande de observaciones, podríamos decir que de observaciones, podríamos decir que son lo mismo. son lo mismo.

Recordemos que el valor máximo de la Recordemos que el valor máximo de la frec. relativa acumulada es 1.frec. relativa acumulada es 1.

Al medir el número de hijos de las mamás Al medir el número de hijos de las mamás del municipio y compararlos contra los de del municipio y compararlos contra los de la col. Carlos Luna, seguramente las la col. Carlos Luna, seguramente las medidas de tendencia central serían medidas de tendencia central serían diferentes, pero muy cercanos. diferentes, pero muy cercanos.

Así mismo, sus gráficas tendrían la misma Así mismo, sus gráficas tendrían la misma “forma” (distribución).“forma” (distribución).

¿Se pueden comparar?¿Se pueden comparar?

Un principio básico de estadística nos dice Un principio básico de estadística nos dice que para cada variable en estudio, su que para cada variable en estudio, su medición nos produce una distribución medición nos produce una distribución particular –única- propia de la población.particular –única- propia de la población.

Esto sugiere que NO PODEMOS Esto sugiere que NO PODEMOS COMPARAR DIRECTAMENTE las COMPARAR DIRECTAMENTE las distribuciones.distribuciones.

Teorema Central del LímiteTeorema Central del Límite

El TCL establece que si reunimos muestras El TCL establece que si reunimos muestras del mismo tamaño de una distribución del mismo tamaño de una distribución no no normalnormal, la distr. de sus medias será , la distr. de sus medias será Normal, siempre que las muestras sean Normal, siempre que las muestras sean suficientemente grandes.suficientemente grandes.

Distribución NormalDistribución Normal

Puede tomar cualquier valor (-Puede tomar cualquier valor (-∞∞, + , + ∞∞) ) Son más probables los valores cercanos a la Son más probables los valores cercanos a la media (media (μμ)) Conforme nos separamos de Conforme nos separamos de μμ , la probabilidad , la probabilidad va decreciendo de igual forma a derecha e va decreciendo de igual forma a derecha e izquierda (es simétrica). izquierda (es simétrica). Conforme nos separamos de ese valor Conforme nos separamos de ese valor μμ , la , la probabilidad va decreciendo de forma más o probabilidad va decreciendo de forma más o menos rápida dependiendo de la desviación menos rápida dependiendo de la desviación estándar ( estándar ( σσ ). ).Su probabilidad acumulada total es 1.Su probabilidad acumulada total es 1.

Distribución NormalDistribución Normal

0.1%

34.1%34.1%

13.6%13.6%

2.2%

2.2%

0.1%

μ-3σ -2σ -σ σ 2σ 3σ

Distr. Normal TípicaDistr. Normal Típica

Para hacer comparables las distribuciones Para hacer comparables las distribuciones N(N(μμ,,σσ)) hay que hacer que tengan una hay que hacer que tengan una misma media y una misma desv. misma media y una misma desv. estándar.estándar.

Mediante una sencilla transformación Mediante una sencilla transformación algebraica, se logra que todas las algebraica, se logra que todas las desviaciones estándar tengan desviaciones estándar tengan μμ=0 y =0 y σσ=1=1

La pregunta por responderLa pregunta por responder

x-1s 1s

-2s2s 3s-3s

μ-3σ

-2σ -1σσ

2σ 3σ

Muestra (estadísticos)

Población (parámetros)

¿ x es igual a μ ?

Nivel de Confianza (NC)Nivel de Confianza (NC)

μ

-3σ-2σ -1σ

σ2σ 3σ

Área de Rechazo (α)

Área de Aceptación = 1 – Área de Rechazo

2.5%

2.5%

NC = (100 – 5) % = 95 %

Pruebas de HipótesisPruebas de Hipótesis

Hip. Nula (“por default”): Hip. Nula (“por default”): x = x = μμ– Consideraremos iguales a Consideraremos iguales a xx y a y a μμ, “culpando” , “culpando”

de la diferencia, si la hay, a los errores de la diferencia, si la hay, a los errores aleatorios.aleatorios.

Hip. Alternativa : Hip. Alternativa : x ≠ x ≠ μμ– Consideraremos que además de los errores Consideraremos que además de los errores

aleatorios, hay otros factores que influyen en aleatorios, hay otros factores que influyen en la diferencia entre la diferencia entre xx y a y a μμ..

μ

-3σ-2σ -1σ

σ2σ 3σ

x-1s 1s

-2s2s 3s-3s

Si x “cae” en el área de aceptación, aceptaremos la hip. Nula y entonces, supondremos que x y μ son iguales.

95%

¿De qué tamaño debe ser la ¿De qué tamaño debe ser la muestra?muestra?

La fórmula varía dependiendo si se La fórmula varía dependiendo si se conoce o no el tamaño de la población.conoce o no el tamaño de la población.

Sin embargo, en ambos casos se debe Sin embargo, en ambos casos se debe tener en cuentatener en cuenta– Un nivel de confianza ( Un nivel de confianza ( αα ) )– La disposición de los individuos a participar La disposición de los individuos a participar

en el estudio ( p )en el estudio ( p )– Un margen de error ( Un margen de error ( εε ) )

Caso: No se conoce el tamaño de Caso: No se conoce el tamaño de la poblaciónla población

Z2 p q

ε2Tamaño de la muestra =

Si α = 0.05 entonces Z = 1.96Para α = 0.01 , Z = 2.58q = 1 – p ( opción más desfavorable, p = 0.50 )

¿Son infalibles las pruebas de ¿Son infalibles las pruebas de hipótesis?hipótesis?

Lamentablemente NO SOMOS perfectos, y Lamentablemente NO SOMOS perfectos, y podemos equivocarnos al aceptar la podemos equivocarnos al aceptar la hipótesis nula –aun cuando hagamos bien hipótesis nula –aun cuando hagamos bien las operaciones-.las operaciones-.

Esa posibilidad de equivocarnos se puede Esa posibilidad de equivocarnos se puede medir.medir.

Tipos de ErroresTipos de Errores

E. Tipo I : decidir que SI existe diferencia E. Tipo I : decidir que SI existe diferencia cuando en realidad no la hay. Su cuando en realidad no la hay. Su probabilidad se indica con probabilidad se indica con αα

Error Tipo II: decidir que NO existe Error Tipo II: decidir que NO existe diferencia cuando si la hay (diferencia cuando si la hay (ββ))

Probabilidades Asociadas a los Probabilidades Asociadas a los ErroresErrores

μx βα