1. Estadistica Introduccion.ppt

19
Tema 1: Introdución 1 Bioestadística Tema 1: Introducción a la estadística

Transcript of 1. Estadistica Introduccion.ppt

  • Tema 1: Introducin*BioestadsticaTema 1: Introduccin a la estadstica

    Tema 1: Introducin

  • Tema 1: Introducin*Para qu sirve la estadstica?La Ciencia se ocupa en general de fenmenos observables

    La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes

    Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocstico)

    La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza

    La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variablidad no es la excepcin sino la regla Carrasco de la Pea (1982)

    Tema 1: Introducin

  • Tema 1: Introducin*DefinicinLa Estadstica es la Ciencia de la

    Sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de

    deducir las leyes que rigen esos fenmenos,

    y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

    DescriptivaProbabilidadInferencia

    Tema 1: Introducin

  • Tema 1: Introducin*Pasos en un estudio estadsticoPlantear hiptesis sobre una poblacinLos fumadores tienen ms bajas laborales que los no fumadoresEn qu sentido? Mayor nmero? Tiempo medio?

    Decidir qu datos recoger (diseo de experimentos)Qu individuos pertenecern al estudio (muestras)Fumadores y no fumadores en edad laboral.Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas?Qu datos recoger de los mismos (variables)Nmero de bajasTiempo de duracin de cada bajaSexo? Sector laboral? Otros factores?

    Recoger los datos (muestreo)Estratificado? Sistemticamente?

    Describir (resumir) los datos obtenidostiempo medio de baja en fumadores y no (estadsticos)% de bajas por fumadores y sexo (frecuencias), grficos,...

    Realizar una inferencia sobre la poblacinLos fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

    Cuantificar la confianza en la inferenciaNivel de confianza del 95%Significacin del contraste: p=2%

    No tenis que entenderlo (an)

    Tema 1: Introducin

  • Tema 1: Introducin*Mtodo cientfico y estadstica

    Tema 1: Introducin

  • Tema 1: Introducin*Poblacin y muestraPoblacin (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).Normalmente es demasiado grande para poder abarcarlo.

    Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)Debera ser representativoEsta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).

    Tema 1: Introducin

  • Tema 1: Introducin*VariablesUna variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables.

    En los individuos de la poblacin espaola, de uno a otro es variable:

    El grupo sanguneo {A, B, AB, O} Var. CualitativaSu nivel de felicidad declarado {Deprimido, Ni fu ni fa, Muy Feliz} Var. OrdinalEl nmero de hijos{0,1,2,3,...} Var. Numrica discretaLa altura{162 ; 174; ...} Var. Numrica continua

    Tema 1: Introducin

  • Tema 1: Introducin*Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)

    Nominales: Si sus valores no se pueden ordenarSexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

    Ordinales: Si sus valores se pueden ordenarMejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

    Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

    Discretas: Si toma valores enterosNmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

    Continuas: Si entre dos valores, son posibles infinitos valores intermedios.Altura, Presin intraocular, Dosis de medicamento administrado, edadTipos de variables

    Tema 1: Introducin

  • Tema 1: Introducin*Es buena idea codificar las variables como nmeros para poder procesarlas con facilidad en un ordenador.Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.Sexo (Cualit: Cdigos arbitrarios)1 = Hombre2 = MujerRaza (Cualit: Cdigos arbitrarios)1 = Blanca2 = Negra,...Felicidad Ordinal: Respetar un orden al codificar.1 = Muy feliz2 = Bastante feliz3 = No demasiado felizSe pueden asignar cdigos a respuestas especiales como0 = No sabe99 = No contesta...Estas situaciones debern ser tenidas en cuentas en el anlisis. Datos perdidos (missing data)

    Tema 1: Introducin

  • Tema 1: Introducin*Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico.No todo est permitido con cualquier tipo de variable.

    Tema 1: Introducin

  • Tema 1: Introducin*Los posibles valores de una variable suelen denominarse modalidades.

    Las modalidades pueden agruparse en clases (intervalos)Edades: Menos de 20 aos, de 20 a 50 aos, ms de 50 aosHijos:Menos de 3 hijos, De 3 a 5, 6 o ms hijos

    Las modalidades/clases deben forman un sistema exhaustivo y excluyenteExhaustivo: No podemos olvidar ningn posible valor de la variableMal: Cul es su color del pelo: (Rubio, Moreno)?Bien: Cul es su grupo sanguneo?Excluyente: Nadie puede presentar dos valores simultneos de la variableEstudio sobre el ocioMal: De los siguientes, qu le gusta: (deporte, cine)Bien: Le gusta el deporte: (S, No)Bien: Le gusta el cine: (S, No)Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

    Tema 1: Introducin

  • Tema 1: Introducin*Presentacin ordenada de datosLas tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.

    GneroFrec.Hombre4Mujer6

    Tema 1: Introducin

    Grfico1

    4

    6

    Hoja1

    Gnero

    Hombre4

    Mujer6

    Hoja1

    Hoja2

    Hoja3

  • Tema 1: Introducin*Bioestadstica. U. Mlaga.Tablas de frecuenciaExponen la informacin recogida en la muestra, de forma que no se pierda nada de informacin (o poca).

    Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad

    Frecuencias relativas (porcentajes): Idem, pero dividido por el total

    Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricasMuy tiles para calcular cuantiles (ver ms adelante)Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%

    Tema 1: Introducin

  • Tema 1: Introducin*Datos desordenados y ordenados en tablasVariable: GneroModalidades:H = HombreM = Mujer

    Muestra:

    M H H M M H M M M H

    equivale a HHHH MMMMMM

    GneroFrec.Frec. relat.porcentajeHombre44/10=0,4=40%Mujer66/10=0,6=60%10=tamao muestral

    Tema 1: Introducin

  • Tema 1: Introducin*EjemploCuntos individuos tienen menos de 2 hijos?frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos

    Qu porcentaje de individuos tiene 6 hijos o menos?97,3%

    Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual?2 hijos

    50%

    Tema 1: Introducin

  • Tema 1: Introducin*Bioestadstica. U. Mlaga.Grficos para v. cualitativasDiagramas de barrasAlturas proporcionales a las frecuencias (abs. o rel.)Se pueden aplicar tambin a variables discretas

    Diagramas de sectores (tartas, polares)No usarlo con variables ordinales.El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

    PictogramasFciles de entender.El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

    Tema 1: Introducin

  • Tema 1: Introducin*Grficos diferenciales para variables numricasSon diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.Diagramas barras para v. discretasSe deja un hueco entre barras para indicar los valores que no son posibles

    Histogramas para v. continuasEl rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

    Tema 1: Introducin

  • Tema 1: Introducin*Diagramas integralesCada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)

    Tema 1: Introducin

  • Tema 1: Introducin*Qu hemos visto?Definicin de estadsticaPoblacinMuestraVariablesCualitativasNumricasPresentacin ordenada de datosTablas de frecuenciasabsolutasrelativasacumuladasRepresentaciones grficasCualitativasNumricasDiferencialesIntegrales

    Tema 1: Introducin

    *