Presentacion de estadistica_4

23
ESTADISTICA ESTADISTICA Modulo: Procesamiento de Modulo: Procesamiento de Datos Datos Profesores: Marcelo Profesores: Marcelo Rioseco Rioseco Marjorie Sámuel Marjorie Sámuel

Transcript of Presentacion de estadistica_4

Page 1: Presentacion de estadistica_4

ESTADISTICAESTADISTICA

Modulo: Procesamiento de Modulo: Procesamiento de DatosDatos

Profesores: Marcelo RiosecoProfesores: Marcelo Rioseco

Marjorie SámuelMarjorie Sámuel

Page 2: Presentacion de estadistica_4

ESTADISTICAESTADISTICA

¿Para que sirve la estadística?¿Para que sirve la estadística?• RecopilarRecopilar• OrganizarOrganizar• Procesar datosProcesar datos

¿Que tipos de estadística encontramos?¿Que tipos de estadística encontramos?

1.1. Estadística Descriptiva o DeductivaEstadística Descriptiva o Deductiva

2.2. Estadística Inferencial o InductivaEstadística Inferencial o Inductiva

Page 3: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

•Pruebas ParamétricasPruebas Paramétricas

Se llaman así porque su cálculo implica Se llaman así porque su cálculo implica una estimación de los parámetros de la una estimación de los parámetros de la población con base en muestras población con base en muestras estadísticas. Mientras más grande sea la estadísticas. Mientras más grande sea la muestra más exacta será la estimación, muestra más exacta será la estimación, mientras más pequeña, más mientras más pequeña, más distorsionada será la media de las distorsionada será la media de las muestras por los valores raros extremos. muestras por los valores raros extremos.

Page 4: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

Ventajas de las Pruebas ParamétricasVentajas de las Pruebas Paramétricas

• Tienen mas poder de contrasteTienen mas poder de contraste• Más poder de eficiencia. Más poder de eficiencia. • Más sensibles a los rasgos de los datos Más sensibles a los rasgos de los datos

recolectados. recolectados. • Menos posibilidad de errores. Menos posibilidad de errores. • Completas (dan estimaciones Completas (dan estimaciones

probabilísticas bastante exactas).probabilísticas bastante exactas).

Page 5: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

• Prueba t (student): : Es una prueba Es una prueba parametrica que es utilizada para parametrica que es utilizada para comparar las medias de dos grupos comparar las medias de dos grupos independientes. Nos permite establecer independientes. Nos permite establecer diferencias estadísticamente significativas diferencias estadísticamente significativas entre las medias de dos grupos.entre las medias de dos grupos.

• Para esto se ve el valor de Para esto se ve el valor de p o de p o de significancia estadística debe ser significancia estadística debe ser mayor que 0.05.mayor que 0.05.

Page 6: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

• ¿Que es el nivel de significancia?¿Que es el nivel de significancia?• La probabilidad de que un evento La probabilidad de que un evento

ocurra oscila entre 0 y 1, donde:ocurra oscila entre 0 y 1, donde:• 0= significa la imposibilidad de 0= significa la imposibilidad de

ocurrenciaocurrencia• 1=la certeza de que ocurra el 1=la certeza de que ocurra el

fenómeno fenómeno

Page 7: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

• Anova: Es una prueba estadística Anova: Es una prueba estadística para analizar si dos o mas grupos para analizar si dos o mas grupos difieren significativamente entre si, difieren significativamente entre si, en cuanto a sus medias y en cuanto a sus medias y varianzas.varianzas.Se utiliza para la Se utiliza para la comparación de medias de 2 o mas comparación de medias de 2 o mas grupos. grupos.

Page 8: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

• Pruebas no parametricasPruebas no parametricas: Se : Se denominan pruebas no paramétricas denominan pruebas no paramétricas aquellas que no presuponen una aquellas que no presuponen una distribución de probabilidad para los distribución de probabilidad para los datos, por ello se conocen también datos, por ello se conocen también como de distribución libre como de distribución libre ((distribution freedistribution free).).

• Las pruebas no parametricas mas Las pruebas no parametricas mas utilizadas utilizadas

Page 9: Presentacion de estadistica_4

Tipos de pruebasTipos de pruebas

• Prueba de Wilcoxon para contrastar datos Prueba de Wilcoxon para contrastar datos pareados.pareados.

• Prueba de Mann-Whitney para muestras Prueba de Mann-Whitney para muestras independientesindependientes

• Prueba de Kruskal-Wallis para comparar K muestrasPrueba de Kruskal-Wallis para comparar K muestras• Prueba de Friedman para comparar K muestras Prueba de Friedman para comparar K muestras

pareadas (bloques)pareadas (bloques)• Coeficiente de correlación de Spearman para rangosCoeficiente de correlación de Spearman para rangos

• Prueba de rachas de Wald-WolfowitzPrueba de rachas de Wald-Wolfowitz• ..

Page 10: Presentacion de estadistica_4

Pregunta de investigación Pregunta de investigación Asociación de 2 variables (dep, Asociación de 2 variables (dep,

indep)indep)

Correlación Spearman Regresión lineal

CuantitativaCuantitativa

2 Prueba T

+3 ANOVA

categóricaCuantitativa

Regresión logísticacuantitativacategórica

chi-cuadradacategóricacategórica

Prueba Tipos de variable

Dependiente independiente

Page 11: Presentacion de estadistica_4

Comparacion de Comparacion de variables (diferencias)variables (diferencias)

Kruskal wallis

Número de variables independientes

2 grupos datos pareados >2grupos

chi-cuadrada*

Wilcoxon Mann-Whitney

Prueba t pareadaPrueba tCuantitativa

Ordinal

Categórica

Variable

Page 12: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

• Las medidas de distribución nos Las medidas de distribución nos permiten identificar la forma en que permiten identificar la forma en que se separan o aglomeran los valores de se separan o aglomeran los valores de acuerdo a su representación gráfica. acuerdo a su representación gráfica. Estas medidas describen la manera Estas medidas describen la manera como los datos tienden a reunirse de como los datos tienden a reunirse de acuerdo con la frecuencia con que se acuerdo con la frecuencia con que se hallen dentro de la información hallen dentro de la información

• Sus principales medidas son la Sus principales medidas son la AsimetríaAsimetría y la y la CurtosisCurtosis

Page 13: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

ASIMETRÍA ASIMETRÍA

Esta medida nos permite identificar si Esta medida nos permite identificar si los datos se distribuyen de forma los datos se distribuyen de forma uniforme alrededor del punto central uniforme alrededor del punto central (Media aritmética). La asimetría (Media aritmética). La asimetría presenta tres estados diferentes, cada presenta tres estados diferentes, cada uno de los cuales define de forma uno de los cuales define de forma concisa como están distribuidos los concisa como están distribuidos los datos respecto al eje de asimetría.datos respecto al eje de asimetría.

Page 14: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

• Se dice que la Se dice que la asimetría es positivaasimetría es positiva cuando la mayoría de los datos se cuando la mayoría de los datos se encuentran hacia el lado izquierdo de la encuentran hacia el lado izquierdo de la curva (por debajo de la media curva (por debajo de la media aritmética). aritmética).

• La curva es La curva es SimétricaSimétrica cuando se cuando se distribuyen aproximadamente la misma distribuyen aproximadamente la misma cantidad de valores en ambos lados de la cantidad de valores en ambos lados de la media media

Page 15: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

• Asimetría negativaAsimetría negativa : cuando la : cuando la mayor cantidad de datos se mayor cantidad de datos se aglomeran hacia la derecha de la aglomeran hacia la derecha de la curva. (por encima de la media)curva. (por encima de la media)

Page 16: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

• El El Coeficiente de asimetríaCoeficiente de asimetría, se , se representa mediante la ecuación representa mediante la ecuación matemática, matemática,

Page 17: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

Donde (g1) representa el coeficiente de Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los asimetría de Fisher, (Xi) cada uno de los valores, (valores, ( X ) la media de la muestra y (ni) la X ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frecuencia de cada valor. Los resultados de esta ecuación se interpretan:ecuación se interpretan:  (g1 = 0): Se acepta que la distribución es (g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la Simétrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la misma cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo media. Este valor es difícil de conseguir por lo que se tiende a tomar los valores que son que se tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5). cercanos ya sean positivos o negativos (± 0.5).

Page 18: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

(g1 > 0):(g1 > 0): La curva es asimétricamente La curva es asimétricamente positiva por lo que los valores se positiva por lo que los valores se tienden a reunir más en la parte tienden a reunir más en la parte izquierda que en la derecha de la izquierda que en la derecha de la media. media.

(g1 < 0):(g1 < 0): La curva es asimétricamente La curva es asimétricamente negativa por lo que los valores se negativa por lo que los valores se tienden a reunir más en la parte tienden a reunir más en la parte derecha de la media. derecha de la media.

Page 19: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

CURTOSIS CURTOSIS Esta medida determina el grado de Esta medida determina el grado de concentración que presentan los concentración que presentan los valores en la región central de la valores en la región central de la distribución. distribución. Por medio del Por medio del Coeficiente de Coeficiente de CurtosisCurtosis, podemos identificar si , podemos identificar si existe una gran concentración de existe una gran concentración de valores valores •  

Page 20: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

Distribución mesocúrtica: Distribución mesocúrtica: presenta un grado de presenta un grado de concentración medio alrededor concentración medio alrededor de los valores centrales de la de los valores centrales de la variable (el mismo que variable (el mismo que presenta una distribución presenta una distribución normal). normal).

Page 21: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

Distribución leptocúrtica: presenta un Distribución leptocúrtica: presenta un elevado grado de concentración elevado grado de concentración alrededor de los valores centrales de la alrededor de los valores centrales de la variable. variable.

Distribución platicúrtica: presenta un Distribución platicúrtica: presenta un reducido grado de concentración reducido grado de concentración alrededor de los valores centrales de la alrededor de los valores centrales de la variable.variable.

..

Page 22: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución

Page 23: Presentacion de estadistica_4

Medidas de DistribuciónMedidas de Distribución