Clases bioestadistica1
-
Upload
henry-andrade -
Category
Education
-
view
23 -
download
0
Transcript of Clases bioestadistica1
FACULTAD DE MEDICINADIVISIÓN DE POSTGRADO
VI CURSO PERFECCIONAMIENTO NO CONDUCDE ENTE A GRADO ACADÉMICO:
"HERRAMIENTAS PARA TUTORES: METODOLOGÍA DE LA
INVESTIGACIÓN CIENTÍFICA Y BIOESTADÍSTICA"
MEDIDAS BÁSICAS EN BIOESTADÍSTICA
Lic.: Henry Andrade RuizCorreo. [email protected]@msn.com
Programa Doctoral
“Formación, Empleo y Desarrollo Regional”
1. Conceptos básicos en estadística.
2. Escalas de medición
3. Medidas de tendencia central: media, moda
y mediana
4. Medidas de dispersión: desviación
estándar, error estándar
5. Distribución normal (de gauss). Test de
normalidad de los datos
6. Elaboración de tablas y gráficos
Estructura de la presentación
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
¿QUÉ ES LA BIOESTADÍSTICA?
Es la Ciencia que aplica el análisis estadístico a los
problemas y objetos de estudio de la biología
¿QUÉ ES LA ESTADÍSTICA?
“Conjunto de conocimientos y métodos usados en la recolección, organización presentación y análisis de la información relativa a un fenómeno determinado permitiéndole al investigador tomar decisiones en fenómenos donde este presente la incertidumbre”
José Manuel Armas.
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
BIOESTADÍSTICA: NOCIONES ELEMENTALES
INCERTIDUMBREMEDICINA
LA ESTADISTICA COMO HERRAMIENTA FUNDAMENTAL EN LA INVESTIGACIÓN MÉDICA
MANEJO
ACTIVIDADES PREVENTIVAS, DIAGNOSTICAS, TERAPÉUTICAS Y
PRONOSTICAS
PRACTICA
CLÍNICA
GENERA
INVESTIGACION
1. Conceptos Básicos en Estadística.
Aspectos que el investigador debe tener en cuenta sobre las
técnicas estadísticas
1. Centrar el problema de la investigación en su campo
de especialización. (objetivos, variables, hipótesis,
relaciones básicas de las variables).
2. Mantener el diseño y el análisis tan simple como sea
posible para no exagerar en el uso de técnicas
estadísticas (análisis de datos).
Medidas Básicas en Bioestadística
RAMAS DE LA ESTADÍSTICA
Estadística Descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Estadística Inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, toma de decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
1. Conceptos Básicos en Estadística.
Medidas Básicas en Bioestadística
1. Conceptos Básicos en Estadística.
Individuos o elementos: personas u objetos que contienen cierta
información que se desea estudiar.
Población: conjunto de individuos o elementos que cumplen ciertas
propiedades comunes.
Muestra: subconjunto representativo de una población.
Parámetro: función definida sobre los valores numéricos de
características medibles de una población.
Estadístico: función definida sobre los valores numéricos de una
muestra.
2. Escalas de medición
Medidas Básicas en Bioestadística
¿QUÉ ES UNA VARIABLE?
Es una característica observable que varía entre los diferentes
individuos de una población. La información que disponemos de cada
individuo es resumida en variables.
EjemploEl grupo sanguíneo
{A, B, AB, O} Var. CualitativaSu nivel de felicidad “declarado”
{Deprimido, Muy Feliz} Var. OrdinalEl número de hijos
{0,1,2,3,...} Var. Numérica discretaLa altura
{1’62 ; 1’74; ...} Var. Numérica continua
VARIABLES CATEGÓRICAS VARIABLES NUMÉRICAS
CUALITATIVAS CUANTITATIVAS
(0) NOMINALNingún atributo
(1) ORDINALUn atributo
(2) (INTERVALO)Dos atributos
(3) RAZÓNTres atributos
Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen Orden Distancia Origen
Posee categorías que no se pueden ordenar por alguna jerarquía
Posee categorías que se pueden ordenar por alguna jerarquía, pero no se puede medir la distancia entre ellas
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual
Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida
Género Estado Civil Instrucción Intensidad Temperatura
Hora (24 h) Peso Hijos
Masculino Soltero Primaria Leve -10º C 00 horas 00 Kg 1
Femenino Casado Secundaria Moderado 0º C 12 horas 25 Kg 3
Divorciado Universitaria Severo 15º C 22 horas 40 Kg 5
Dicotómicas: tiene solo dos categorías
Continuas : proviene de medir con números enteros o fraccionaros, entre dos valores siempre existe números intermedios
Politómicas: tienen más de dos categoríasDiscretas: provienen de contar, sólo admite valores enteros
Medidas Básicas en Bioestadística
3. Medidas de tendencia central: media, moda y mediana
MEDIA
Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media muestral se define como la suma de todos los valores observados, dividido por el número total de observaciones.
n
xX
n
ii
1
Medidas Básicas en Bioestadística
3. Medidas de tendencia central: media, moda y mediana
MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, divide el conjunto de datos en dos partes iguales. 50-50
MODALa medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal.
Nota: Cuando la media, mediana y moda son iguales en un conjunto de datos, estos deben proceder de una distribución normal
4. Estadísticos de posición
Percentil: Dividen a la muestra en 100 partes iguales• La mediana es el percentil 50• El percentil de orden 15 deja por debajo al 15% de
las observaciones. Por encima queda el 85%
Cuartiles: Dividen a la muestra en 4 grupos con frecuencias similares.• Primer cuartil = Percentil 25 =• Segundo cuartil = Percentil 50 = mediana• Tercer cuartil = Percentil 75 =
5. Importancia de la media, mediana y estadísticos de posición en el análisis estadístico
6.Permiten definir grupos de comparación categorizando variables cuantitativas
7. La muestra se homogeniza al categorizar la variable ya que los grupos tienen
aproximadamente el mismo número de elementos.
8. Permiten determinar puntos de corte donde se encuentra significancia
estadística.
Virtudes
Resiliencia total
P< 84,09 >= 84,09
Media (Ds) Media (Ds)
Sabiduría 4,04 (0,4) 4,4 (0,35) 0,000
Coraje 4,08 (0,4) 4,45 (0,33) 0,000
Humanidad 4,12 (0,42) 4,46 (0,36) 0,000
Justicia 4,17 (0,43) 4,42 (0,42) 0,000
Templanza 3,87 (0,47) 4,14 (0,47) 0,000
Trascendencia 4,11 (0,42) 4,43 (0,36) 0,000
Cuadro N° 1.Comparación del puntaje promedio de las virtudes por resiliencia total
Universidad de Los Andes - Facultad de MedicinaMérida, Venezuela. Año 2011
Resiliencia
Grupo de Edad
P≤ 21 > 21
Media (DS) Media (DS)Inicio
Escala de Resiliencia 75,94 (13,11) 80,00 (9,70) 0,26
Competencia personal, tenacidad y control 85,89 (12,8)
92,09 (11,22) 0,08
Confianza en si mismo 67,67 (17,25)77,38
(14,41) 0,04
Aceptación positiva al cambio 79,51 (13,15)82,14
(13,51) 0,48
Optimismo 72,18 (16,03)71,88
(17,12) 0,95
Cuadro N° 2.Comparación de la resiliencia por grupo de edad
Facultad de Farmacia y Bioanálisis ULA. Año 2011
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Así como las medidas de tendencia central nos permiten identificar el
punto central de los datos, las Medidas de dispersión nos permiten
reconocer que tanto se dispersan los datos alrededor del punto
central; es decir, nos indican cuanto se desvían las observaciones
alrededor de su promedio aritmético (Media)
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
VARIANZA
Esta medida nos permite identificar la diferencia promedio que hay entre cada
uno de los valores respecto a su punto central (media) al cuadrado.
1
)( 22
n
xxS i
DesventajasEs sensible a valores extremos (alejados de la media).Su interpretación no es sencilla ya que las unidades de medida están cuadrado.
VentajasDe gran utilidad para determinar tamaños muestrales en estudios posteriores
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Desviación Estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de
los datos respecto a su punto central o media.
2SS DesventajasEs sensible a valores extremos (alejados de la media).
Ventajas
Tiene las misma dimensionalidad (unidades) que la variable original.
Cierta distribución que veremos más adelante (normal o gaussiana) quedará
completamente determinada por la media y la desviación típica. De gran utilidad
para pruebas de hipótesis e intervalos de confianza
Medidas Básicas en Bioestadística
6. Medidas de dispersión: desviación estándar, error estándar y varianza
Error Estándar o Típica de la Media Muestral
Mide el grado de variabilidad de la media muestral con respecto a la media
poblacional. Se determina mediante el cociente entre la desviación estándar y
la raíz de n.
n
SSx
Es de gran utilidad para la inferencia estadística, para la elaboración de
intervalos de confianza para la media poblacional y para las pruebas de
hipótesis ya que permiten definir el estadístico de prueba.
7. Distribución normal (de gauss). Test de normalidad de los datos
La distribución normal o gaussiana es la distribución de probabilidad
más importante de la estadística, es una variable aleatoria continua con
media µ y varianza σ2 .
Propiedades de la distribución normal
8.Tiene forma de campana ya que es simétrica con respecto a la media
9. Todas las medidas de tendencia central son iguales (media, moda y
mediana)
10. Es unimodal
11. Rango de variación desde hasta
Medidas Básicas en Bioestadística
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss). Test de normalidad de los datos
La distribución normal en las pruebas estadísticas.
Existen pruebas estadísticas paramétricas y no paramétricas, las primeras
son de mayor precisión para detectar las relaciones existentes entre
variables, si es que estas existen, para llevar acabo este tipo de prueba es
necesario que los valores de la variable dependiente sigan una distribución
normal. Para ello se emplea la prueba de kolmogorov-smirnov para probar
normalidal
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Áreas de la Inferencia Estadística
1. Estimación
a) Estimación Puntual
b) Estimación Por Intervalos de Confianza
2. Prueba de Hipótesis
a) Pruebas de hipótesis para diferencias entre medias y/o proporciones dos muestras (independientes, dependientes)
b) Experimentos de un factor (análisis de varianza para más de dos muestras)
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza.
La estimación por intervalos se refiere al proceso de determinar un intervalo de valores, el cual incluirá el verdadero valor del parámetro, con un nivel de confianza determinado y expresado en términos de probabilidades.
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza.
Teorema del Límite Central.Si es la media de una muestra aleatoria de tamaño “n” tomada de una población con media µ y varianza finita , entonces la forma límite de la distribución de
X
2
nσ/
μXZ
Cuando n , se aproxima a la Distribución N(0,1)
∞
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza de µ con σ conocida
Si es la media de una muestra aleatoria de tamaño “n” de una población con varianza , conocida, un intervalo de confianza de (1-α) 100% para µ está dado por
X2
nzx
nzx
2/2/
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Estimación Por Intervalos de Confianza para µ1-µ2 con σ1 y σ2 conocida
Si son las medias de muestras aleatorias independientes de tamaño “n1 y n2” de poblaciones normales con varianzas conocidas , respectivamente, un intervalo de confianza de (1-α) 100% para µ1-µ2 está dado por
2
2
1
12/2121
2
2
1
12/21 )()(
nnzxx
nnzxx
21XyX
2
2
2
1 y
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Conceptos básicos.
Hipótesis estadística: es una aseveración o conjetura con respecto a una o más poblaciones.
Hipótesis nula y alternativa: la hipótesis nula se refiere a la hipótesis que deseamos someter a prueba se denota con H0. El rechazo de H0 conduce a la aceptación de la hipótesis alternativa que se denota con H1.
Prueba de Hipótesis.
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Situaciones posibles al probar una hipótesis estadística
Resultado de la prueba
Realidad
H0 es verdadera H0 es falsa
Aceptar H0 Decisión correcta Error tipo II
Rechazar H0 Error tipo I Decisión correcta
Tipos de errores que se puede incurrir al probar una hipótesis estadística
Medidas Básicas en Bioestadística
7. Distribución normal (de gauss).
Procedimiento para pruebas de hipótesis.
1. Establecer las hipótesis nula y alternativa
2. Definir el nivel de significación α
3. Seleccionar la estadística de prueba apropiada (t-studen, F, otros.)
4. Calcular el valor de la estadística de prueba, a partir de los datos de la
muestra
5. Decisión
Medidas Básicas en Bioestadística
5. Distribución normal (de gauss).
Pruebas con respecto a una sola media (varianza conocida)
Estadística de prueba
nσ/
μXZ 0
Medidas Básicas en Bioestadística
5. Distribución normal (de gauss).
Pruebas con respecto a dos medias (varianza conocida)
Estadística de prueba
2
2
2
1
2
1
2121)μμ()XX(
Z
nn
Elaboración de gráficos y tablas
Obligación de revelar la fuente del dato
Artículo 16. Todas las personas naturales y jurídicas, privadas y públicas
que difundan información estadística están en la obligación de indicar la
fuente del dato.
Tutela del Secreto Estadístico
Artículo 19. Están amparados por el secreto estadístico los datos
personales obtenidos directamente o por medio de información
administrativa, que por su contenido, estructura o grado de desagregación
identifiquen a los informantes.