Aspectos Generales de Estadística-Parte 1

download Aspectos Generales de Estadística-Parte 1

of 38

description

Aspectos Generales de Estadística en Análisis Químico

Transcript of Aspectos Generales de Estadística-Parte 1

Diapositiva 1

ASPECTOS GENERALES DE ESTADSTICAAnlisis Industrial - Unidad 2

01ESTADISTICADefinicin prcticaHERRAMIENTA UTILIZADA PARA DISCRIMINAR ENTRE LAS PARTES SISTEMATICA (DETERMINADA) Y AL AZAR (INDETERMINADA) DE UNA SEAL O RESULTADO ANALITICOEstadsticay = D + dResultadoanalticoSistemticaAl azar12MEDIDAS DE TENDENCIA CENTRALSon aquellas que nos indican alrededor de que valor se agrupan el mayor nmero de observaciones.

MEDIA (valor medio promedio). Es la que se obtiene sumando todos los valores y dividiendo el total entre el nmero de observaciones. Su notacin es Estadstica

Ejemplo: Calcule la media para el siguiente conjunto de datos:39, 29, 43, 52, 39, 44, 40, 31, 44, 35R/

23MEDIDAS DE TENDENCIA CENTRAL2. MEDIANA. Es el valor de la variable que divide en dos partes iguales al nmero total de observaciones. Su notacin es Md. EstadsticaRegla 1. Si el nmero de datos es impar, la mediana es el dato que queda exactamente en el medio del arreglo ordenado.

Datos Menores , Md, Datos MayoresEjemplo: Calcule la media para el siguiente conjunto de datos:39, 29, 43, 52, 39, 44, 40, 31, 44Datos ordenados: 29, 31, 39, 39, 40, 43, 44, 44, 52

R/ Md = 4034MEDIDAS DE TENDENCIA CENTRALLA MEDIANAEstadsticaRegla 2. Si el nmero de datos es par, la mediana es el promedio de los dos datos medios del arreglo ordenado.

Datos Menores , a , b , Datos MayoresEjemplo: Calcule la mediana para el siguiente conjunto de datos:39, 29, 43, 52, 39, 44, 40, 31, 44, 35Datos ordenados: 29, 31, 35, 39, 39, 40, 43, 44, 44, 52

R/ Md = 39.545MEDIDAS DE TENDENCIA CENTRAL3. MODA. Es el valor de la variable que se presenta con mayor frecuencia. Su notacin es Mo.EstadsticaEjemplo: Cual es la moda para el siguiente conjunto de datos:39, 29, 43, 52, 39, 44, 40, 31, 39, 35

Los datos de ordenan de menor a mayor:29, 31, 35, 39, 39, 39, 40, 43, 44, 52

R/ Mo = 39Recuerde que la moda es el valor que aparece con mayor frecuencia en un conjunto de datos56MEDIDAS DE DISPERSINSon aquellas que registran la variacin que presentan los valores de las observaciones, es decir, informan sobre la dispersin de los datos

Estadstica RANGO ABSOLUTO. Es la diferencia entre el valor mayor y el valor menor de un grupo de datos.

R = valor mas grande - valor ms pequeo

67MEDIDAS DE DISPERSIN2. VARIANZA. Mide la dispersin de los valores respecto a la media y se expresa en unidades cuadradas. Su notacin es S2 para una muestra.Estadstica

3. DESVIACION ESTANDAR. Es la raz cuadrada de la varianza. Representa todas las diferencias de las observaciones respecto a la media. Su notacin es S

78RESUMEN SIMBOLOGA ESTADSTICA = Sumatoria o total = Media Md = MedianaMo = ModaR = RangoS2 = Varianza S = Desviacin Estndar n = Total de Observaciones de una muestra

Estadstica8PRUEBAS DE SIGNIFICACIN TAMBIEN LLAMADASPRUEBAS DE HIPTESIS NULAUN PROCEDIMIENTO SISTEMTICO QUE NOS PERMITE DECIDIR SI UN CONJUNTO DE MEDICIONES REPETIDAS MUESTRA EVIDENCIA DE ERROR SISTEMTICO

EL PROPSITO DE UNA PRUEBA DE SIGNIFICACIN ES SACAR UNA CONCLUSIN ACERCA DE UNA POBLACIN UTILIZANDO DATOS PROVENIENTES DE UNA MUESTRAPruebas de significacin9COMPARACIN DE UNA MEDIA EXPERIMENTAL CON UN VALOR CONOCIDOEJEMPLO:En un mtodo nuevo para determinar selenourea en agua, se obtuvieron los siguientes valores para muestras de agua de grifo adicionadas con 50 ng/mL de selenourea: 50.4, 50.7, 49.1, 49.0, 51.1 ng/mL

Hay alguna evidencia de error sistemtico?

10La cuestion es si la diferencia entre el resultado y el valor real es estadsticamente significativa, o si se debe a meras variaciones al azar.Pruebas de significacinPROCEDIMIENTOPaso 1:Hiptesis nula (H0) : se adopta la hiptesis nula de que no hay error sistemtico. sea = 5011Pruebas de significacin

Paso 2:Prueba estadstica:Nota: lo que se compara es el valor absoluto de tcalc

Paso 3:Valores crticos: compare el resultado de la prueba estadstica (tcalc) con valores tcrit (ver tabla siguiente):

tcrit = 2.78 (P = 0.05, f = 4)

P = el nivel de significacinf = grados de libertad (n-1)

El nivel de significacin (P = 0.05) proporciona la probabilidad de rechazar una hiptesis nula cuando esta es verdadera. En este caso 5 %.

Utilizando este nivel de significacin se rechaza en promedio, la hiptesis nula, aunque de hecho sea verdadera, 1 de cada 20 veces

Si tcalc excede el valor tcrit, la hiptesis nula se rechaza.

12Pruebas de significacinValores crticos de t13Pruebas de significacin

Paso 4:Decisin: Como tcalc < tcrit, la hiptesis nula se retiene.Por lo tanto no es significativamente diferente de 50.Es decir, no hay evidencia de error sistemtico.

Nota importantsima:Hay que sealar que esto no significa que no existan errores sistemticos, si no que no se ha podido constatar su existencia.14Pruebas de significacinPRUEBAS DE SIGNIFICACIN

ENFASIS SOBRE LO IMPORTANTEH0 ES UNA DECLARACIN DE QUE NO HAY DIFERENCIA, ES DECIR, QUE CUALQUIER DISCREPANCIA OBSERVADA ES DEBIDA SOLO AL AZAR.

H0 ES LA HIPOTESIS QUE EL INVESTIGADOR ESPERA RETENER.

EL NIVEL DE SIGNIFICANCIA P ES EL RIESGO (LA PROBABILIDAD) QUE EL INVESTIGADOR EST DISPUESTO A TOMAR SI RECHAZARA INCORRECTAMENTE LA H0 VERDADERA.15Pruebas de significacin15COMPARACIN DE DOS MEDIAS EXPERIMENTALESSE QUIEREN COMPARAR LOS RESULTADOS DE UN NUEVO MTODO ANLITICO CON AQUELLOS OBTENIDOS POR UN SEGUNDO MTODO (REFERENCIA)CONOCIDOS:

16Pruebas de significacinCOMPARACIN DE DOS MEDIASCASO I:s1 y s2 no son significativamente diferentes

H0:Los dos mtodos no producen resultados diferentes, sea 1 no es 2tcalc tiene f1 + f2 (o sea, n1+ n2- 2) grados de libertad

Con17Pruebas de significacin

Prueba estadstica:grados de libertad redondeado al entero mas cercanoCOMPARACIN DE DOS MEDIAS18Con

Pruebas de significacinCASO II:s1 y s2 son significativamente diferentes

H0:Los dos mtodos no producen resultados diferentes, sea 1 no es 2

Prueba estadstica:USO CORRECTO DE LA PRUEBA t PARA COMPARAR DOS MEDIASS1 = S2 ?Use la prueba F para resolver este condicionalNOCASO II

SI

CASO I

Pruebas de significacin1919Ejemplo (caso I): En una serie de experimentos para la determinacin de estao en productos alimenticios, Las muestras fueron llevadas a ebullicin con HCI a reflujo para diferentes tiempos:

COMPARACIN DE DOS MEDIASEs significativamente diferente la cantidad media de estao encontrada para los dos tiempos de ebullicin?Pruebas de significacin20Estao (mg/Kg)555759565659575558595959Estao (mg/Kg)

30 min

75 min

Muestra20Paso 1. Realice una prueba F para varianzas de dos muestras: Hiptesis Nula : S21 = S22.

SOLUCION DEL PROBLEMA CON MICROSOFT EXCELPruebas de significacin21

Conclusin: Como Fcalc < Fcrit entonces se retiene la hiptesis nula. Se asume varianzas iguales.30 min75 min555757555958565956595959 _ x57.0057.83 s1.6731.602

Datos con S mas altaDatos con S mas bajaEsto significa 1 cola con P = 0.05Ojo - Truco:Cambiar este nmero a 0.025 sise quiere dos colas con P = 0.05Prueba F para varianzas de dos muestras(Dos colas)Variable 1Variable 2Media5757.8333333Varianza2.82.56666667Observaciones66Grados de libertad55F1.09090909P(F Qcrit , el resultado sospechoso puede descartarse.PRUEBA Q PARA DATOS ANMALOSAplicar la prueba-Q a los siguientes datos del contenido de estroncio (g/mL) en una muestra, para ver si el valor sospechoso puede o no descartarse: 1.15, 1.02, 1.10, 1.88. Pruebas de significacin

EJEMPLO DE PRUEBA t POR PAREJASLa siguiente tabla proporciona la concentracin de plomo (mg/ml) por dos mtodos diferentes para 4 muestras:Los dos mtodos proporcionan valores para las concentraciones medias de plomo que difieren significativamente ?MUESTRAEXTRACCIN OXIDATIVAEXTRACCIN DIRECTA17176261683504846057Pruebas de significacin3737