PROYECTO FINAL DE ESTADISTICA.docx

25
Centro ver acruzano De educación superior Clave: 30psu2057v TR ABAJO: “PROYECTO FINAL M ATERIA: ESTADÍSTICA II DOCENTE: I.S.C JOSÉ ALBERTO MARTÍNEZ CHÁVEZ ALUMNA: ALEJANDRA MARTINEZ SANTIAGO LICENCIATURA: GRUPO;

description

trabajo de estadistica de varias unidades

Transcript of PROYECTO FINAL DE ESTADISTICA.docx

Centro veracruzano De educacin superior Clave: 30psu2057v

TRABAJO:PROYECTO FINAL

MATERIA:ESTADSTICA II

DOCENTE:I.S.C JOS ALBERTO MARTNEZ CHVEZ

ALUMNA:ALEJANDRA MARTINEZ SANTIAGO

LICENCIATURA: GRUPO; PEDAGOGA 501

TANTOYUCA, VER., A 09 DE NOVIEMBRE DE 2013

NDICEUNIDAD 3: DISTRIBUCIN DE MUESTRO3.1 Estimacin puntual 203.2 Distribucin muestral de la media 213.3 Intervalos de confianza para la media utilizando distribucin normal213.4 Distribucin t de student223.5 Intervalos de confianza para la media utilizando t de student22

UNIDAD 4: PRUEBAS DE HIPTESIS 4.1 Conceptos bsicos del procedimiento de la prueba de hiptesis 244.2 Pruebas de hiptesis264.3 Pruebas de hiptesis de las medias294.4 Prueba de la diferencia entre dos medias utilizando la distribucin normal314.5 Prueba de la diferencia entre dos medias utilizando la distribucin t de student31

UNIDAD 3: DISTRIBUCIN DE MUESTREOLa Estadstica se encarga bsicamente del estudio de datos obtenidos de manera aleatoria o al azar, los cuales son recopilados de experimentos que fueron diseados cuidadosamente por los investigadores. Estos datos forman las muestras obtenidas de un conjunto de datos mayor conocida como poblacin.Generalmente el trmino muestra se llega a confundir entre lo que el investigador considera de ella comparada con el concepto que maneja el resto de la gente, para poder interpretar esto consideremos un ejemplo sencillo.Cuando el investigador desea llevar a cabo un estudio de comparacin digamos que del peso entre dos grupos de nios, a los cuales se les muestrear tomando los valores del peso entre los nios que fueron seleccionados para el experimento.Ya realizada la toma de los datos de peso de los nios de los dos grupos, la gente pensar que los nios considerados es la muestra, mientras que el investigador realmente est considerando los datos de los pesos obtenidos de los dos grupos de nios como la muestra, ya que para los fines de su trabajo lo importante es los pesos ms que los nios, y estos son los valores de trabajo que son cuantitativos, ya sea discretos o continuos.Otro de los conceptos que se manejan es cuando el investigador trabaja con una poblacin, la cual puede ser finitamente contable o infinitamente contable, (finita o infinita), estrictamente hablando las poblaciones a trabajar son finitas, aunque cueste mucho trabajo o sea casi imposible el poder cuantificarlas, por ejemplo los granitos de arena de la playa o del mar, realmente es una cantidad finita de granitos los que existen, lo difcil es poder cuantificarlas, cuando se tienen este tipo de poblaciones por fines prcticos se consideran como poblaciones infinitas.Las tcnicas de la Estadstica Inferencial son las que se encargan del estudio de las muestras aleatorias que fueron obtenidas de poblaciones consideradas como infinitas, su media y varianza son:

La distribucin de ellas est regida por el Teorema del Lmite Central:SiX1, X2,,Xnforman una muestra aleatoria de una poblacin infinita cuya media esmy la varianza ess2 entonces la distribucin lmite de la funcin es:

De una poblacin de tamao N, se pueden sacar N combinado n muestras diferentes de tamao n. Con cada una de estas muestras es posible obtener un estimador, ya sea la media, proporcin, varianza, etc. La distribucin de estos estimadores se conoce como distribucin en el muestreo.El conocer la distribucin en el muestreo de algunos de estos estimadores es til en el desarrollo terico de los temas correspondientes a estimacin por intervalo y pruebas de hiptesis.

3.1 Estimacion puntualUna estimacin espuntualcuando se usa un solo valor extrado de la muestra para estimar el parmetro desconocido de la poblacin. Al valor usado se le llama estimador.La media de la poblacin se puede estimar puntualmente mediante la media de la muestra:La proporcin de la poblacin se puede estimar puntualmente mediante la proporcin de la muestra:La desviacin tpica de la poblacin se puede estimar puntualmente mediante la desviacin tpica de la muestra, aunque hay mejores estimadores: Esunadistribucin de probabilidadque surge del problema desestimarlamediade unapoblacinnormalmente distribuidacuando eltamao de la muestraes pequeo. sta es la base de la popular prueba t de Studentpara la determinacin de las diferencias entre dos medias muestrales y para la construccin delintervalo de confianzapara la diferencia entre las medias de dos poblaciones.La distribucintes ms ancha y ms plana en el centro que la distribucin normal estndar como resultado de ello se tiene una mayor variabilidad en las medias de muestra calculadas a partir de muestras ms pequeas. Sin embargo, a medida que aumenta el tamao de la muestra, la distribucintse aproxima a la distribucin normal estndar.Condiciones:Se utiliza en muestras de 30 o menos elementos.La desviacin estndar de la poblacin no se conoceDiferencias:La distribucin t student es menor en la media y ms alta en los extremos que una distribucin normal.Tiene proporcionalmente mayor parte de su rea en los extremos que la distribucin normal.Uso de la tabla de distribucin t:La tabla de distribucin t es ms compacta que z y muestra las reas y valores de t para unos cuantos porcentajes exclusivamente (10%,5%,2% y 1%)Una segunda diferencia de la tabla es queno se centraen la probabilidad de que el parmetro de la poblacin que esta siendo estimado caigadentrodel intervalo de confianza.Por el contrario, mide la probabilidad de que ese parmetrono caiga dentro del intervalo de confianzaUna tercera diferencia en el empleo de la tabla consiste en que hemos de especificar los grados de libertad con que estamos trabajando.3.2 DISTRIBUCION MUESTRAL DE LA MEDIA3.3 INTERVALOS DE CONFIANZA PARA LA MEDIA UTILIZANDO LA DISTRIBUCION NORMALDada una variable aleatoria condistribucin normalN(,), el objetivo es la construccin de un intervalo de confianza para el parmetro, basado en una muestra de tamaonde la variable.Desde el punto de vista didctico hemos de considerar dos posibilidades sobre la desviacin tpica de la variable: que sea conocida o que sea desconocida y tengamos que estimarla a partir de la muestra. El caso de conocida, ya comentado anteriormente, no pasa de ser un caso acadmico con poca aplicacin en la prctica, sin embargo es til desde el punto de vista didctico.Caso de varianza conocidaDada una muestraX1,...,Xn, el estadstico

Se distribuye segn una Normal estndar. Por tanto, aplicando el mtodo del pivote podemos construir la expresin

Dondez/2es el valor de una distribucin Normal estndar que deja a su derecha una probabilidad de/2,de la que se deduce el intervalo de confianza

Caso de varianza desconocidaDada una muestraX1,...,Xn, el estadstico

Se distribuye segn unatde student de n1 grados de libertad. Por tanto, y siguiendo pasos similares a los del apartado anterior, el intervalo de confianza resultante es

Dondet/2es el valor de una distribucin t de Student con n1 grados de libertad que deja a su derecha una probabilidad de/2.3.4 DISTRIBUCIN T DE STUDENTLas distribuciones t de Student fueron descubiertas por William S. Gosset (1876-1937) en 1908 cuando trabajaba para la compaa de cervezas Guinness en Dubln (Irlanda). No pudo publicar sus descubrimientos usando su propio nombre porque Guinness haba prohibido a sus empleados que publicaran informacin confidencial. Gosset firm sus publicaciones usando el nombre de "Student". Gosset tena buena relacin con Karl Pearson que haba sido su maestro. Necesitaba una distribucin que pudiera usar cuando el tamao de la muestra fuera pequeo y la varianza desconocida y tena que ser estimada a partir de los datos. Las distribuciones t se usan para tener en cuenta la incertidumbre aadida que resulta por esta estimacin. Fisher comprendi la importancia de los trabajos de Gosset para muestras pequeas.Si el tamao de la muestra es n entonces decimos que la distribucin t tiene n-1 grados de libertad. Hay una distribucin t diferente para cada tamao de la muestra. Estas distribuciones son una familia de distribuciones de probabilidad continuas. Las curvas de densidad son simtricas y con forma de campana como ladistribucin normal estndar. Sus medias son 0 y sus varianzas son mayores que 1 (tienen colas ms pesadas). Las colas de las distribuciones t disminuyen ms lentamente que las colas de la distribucin normal. Si los grados de libertad son mayores ms prxima a 1 es la varianza y la funcin de densidad es ms parecida a la densidad normal.LaDistribucin de Student, se utiliza cuando el tamao de muestra es pequeo. Se entiende tamao muestral pequeo cuando es menor a 30.

Algunaspropiedadesde la distribucin son:

1.- Es una distribucin continua

2.-Tiene forma de campana y es simtrica.

3.-Hay una familia de distribuciones "T".

4.-Todas tienen media igual a cero.

5.-Sus desviaciones estndares difieren de acuerdo con el tamao de muestra "n".

6.-La forma de la distribucin "T" es ms extendida que la forma de la distribucin Normal "Z".

7.-A medida que aumenta "n" (el tamao de muestra) la distribucin "T" se parece ms a la distribucin "Z".

8.-La distribucin "T" tiene grados de libertad, que son "n-1".

3.5 INTERVALOS DE CONFIANZA UTILIZANDO LA DISTRIBUCION T DE STUDENT

UNIDAD 4: PRUEBAS DE HIPOTESISDentro del proceso de inferencia, adems de la estimacin puntual y la por intervalo, en muchas ocasiones es necesario hacer pruebas de hiptesis, las cuales se hacen con base en la informacin muestral.En este captulo se ver la prueba de hiptesis para la media, la proporcin, la varianza, la diferencia de medias, la diferencia de proporciones, el cociente de varianzas, la prueba de independencia y la prueba de bondad de ajuste.Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de una poblacin determinada. Este supuesto debe comprobarse con la informacin suministrada por una muestra aleatoria obtenida de dicha poblacin.Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben ser mutuamente excluyentes; una es la hiptesis nula que se nota como H0y la otra es la hiptesis alternativa que se nota como H1.Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesis nula o se rechace. Si se rechaza la hiptesis nula (H0) se acepta hiptesis alternativa (H1). Para establecer esta regla de decisin la distribucin de probabilidad se divide en dos categoras mutuamente excluyentes: la que lleva al rechazo de H0, es decir est en la zona de rechazo y la que lleva al no rechazo de H0, es decir, est en la zona de no rechazo.Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba de hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0) es en realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de significancia (). Puesto que cuando se comete un error tipo I, seguiramos una accin errnea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H1dado que H0es verdadera.Por otro lado, podemos no rechazar H0siendo en realidad falsa, a este error se le llama ERROR TIPO II.4.1 CONCEPTOS BASICOS DE LA PRUEBA DE HIPOTESISLa Prueba de Hiptesis es un procedimiento basado en evidencia muestral y en la teora de la probabilidad para la aceptacin o rechazo de hiptesis de investigacin.Se dice que est basado en evidencia muestral porque a partir de una muestra se obtienen la media y la desviacin estndar requerida para hacer los clculos.Se dice que est basado en la teora de la probabilidad porque durante el procedimiento se requiere hacer uso de la "Distribucin Normal" o de la "Distribucin t de Student".Existen diferentes mtodos o procedimientos para realizar una Prueba de Hiptesis, dependiendo del tipo de problema y de la informacin con que se cuenta. Sin embargo, todos los procedimientos incluyen los siguientes 5 pasos:

Paso 1: Plantear Hiptesis Nula e Hiptesis Alternativa.La Hiptesis Nula se denota normalmente como Ho y la Hiptesis Alternativa como Hi. La Hiptesis alternativa siempre plantea lo que queremos demostrar y la Hiptesis Nula se encarga de negarlo.Por ejemplo:Si queremos demostrar que las personas prefieren carros de color rojo, las hiptesis se plantearan de la siguiente forma:Hiptesis Alternativa: Hi: Las personas prefieren carros de color rojo.Hiptesis Nula: Ho: Las personas no prefieren carros de color rojo.

Paso 2:Determinar Nivel de Significancia.El nivel de significancia indica la probabilidad de rechazar la hiptesis nula cuando es verdadera y se denota con la letra griega:

En otras palabras el nivel de significancia nos proporciona el rango que nos permite aceptar la Hiptesis Alternativa.El nivel de significancia generalmente se considera de 0,05 para proyectos de investigacin, 0.01 para aseguramiento de calidad y 0.10 para encuestas de mercadotecnia y polticas.

Paso 3:Evidencia Muestral. Se refiere al clculo de la media y la desviacin estndar a partir de la muestra.

Paso 4: Aplicacin de la Distribucin de Probabilidad apropiada.Las dos Distribuciones de Probabilidad que se usan dependiendo de los datos son: Distribucin Normal y Distribucin "t" de Student.

Paso 5: Reporte de resultados. En base a la evidencia disponible se acepta o se rechaza la hiptesis alternativa.

4.3 PRUEBAS DE HIPOTESIS DE LAS MEDIAS

4.4 PRUEBA DE LA DIFERENCIA ENTRE DOS MEDIAS UTILIZANDO LA DISTRIBUCIN NORMALLa Prueba de Hiptesis para medias usando Distribucin Normal se usa cuando se cumplen las siguientes dos condiciones:* Es posible calcular las media y la desviacin estndar a partir de la muestra. * El tamao de la muestra es mayor o igual a 30.El procedimiento obedece a los 5 pasos esencialesPaso 1: Plantear Hiptesis Nula (Ho) e Hiptesis Alternativa (Hi).La Hiptesis alternativa plantea matemticamente lo que queremos demostrar.La Hiptesis nula plantea exactamente lo contrario.Paso 2: Determinar Nivel de Significancia. (Rango de aceptacin de hiptesis alternativa)

- 0.05 para proyectos de investigacin- 0.01 para aseguramiento de calidad- 0.10 para encuestas de mercadotecnia y polticas.Paso 3: Evidencia Muestral. Se calcula la media y la desviacin estndar a partir de la muestra.

Paso 4: Se aplica la Distribucin Normal para calcular la probabilidad de error (P) por medio de la frmula:

Donde:

Paso 5: En base a la evidencia disponible se acepta o se rechaza la hiptesis alternativa.Si la probabilidad de error (P) es mayor que el nivel de significancia: SE RECHAZA HIPTESIS ALTERNATIVASi la probabilidad de error (P) es menor que el nivel de significancia : SE ACEPTA HIPTESIS ALTERNATIVA

4,4 PRUEBA DE LA DIFERENCIA ENTRE DOS MEDIAS UTILIZANDO LA DISTRIBUCIN T D STUDENTLa Prueba de Hiptesis para medias usando Distribucin t de Student se usa cuando se cumplen las siguientes dos condiciones:

* Es posible calcular las media y la desviacin estndar a partir de la muestra.* El tamao de la muestra es menor a 30.El procedimiento obedece a los 5 pasos esenciales:

Paso 1: Plantear Hiptesis Nula (Ho) e Hiptesis Alternativa (Hi).La Hiptesis alternativa plantea matemticamente lo que queremos demostrar.La Hiptesis nula plantea exactamente lo contrario.

Paso 2: Determinar Nivel de Significancia. (Rango de aceptacin de hiptesis alternativa)

Se considera: - 0.05 para proyectos de investigacin- 0.01 para aseguramiento de calidad- 0.10 para encuestas de mercadotecnia y polticas.

Paso 3: Evidencia Muestral. Se calcula la media y la desviacin estndar a partir de la muestra.

Paso 4: Se aplica la Distribucin t de Student para calcular la probabilidad de error (P) por medio de la frmula:

Paso 5: En base a la evidencia disponible se acepta o se rechaza la hiptesis alternativa.Si la probabilidad de error (P) es mayor que el nivel de significancia: SE RECHAZA HIPTESIS ALTERNATIVASi la probabilidad de error (P) es menor que el nivel de significancia : SE ACEPTA HIPTESIS ALTERNATIVA

http://matepedia-estadistica.blogspot.mx/p/prueba-de-hipotesis-para-medias-una-cola.html