Clase10 analisisdedatos

40
Análisis Análisis de los datos de los datos 1

Transcript of Clase10 analisisdedatos

Page 1: Clase10 analisisdedatos

Análisis Análisis de los datosde los datos

11

Page 2: Clase10 analisisdedatos

ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS

Programas Computacional

es

SPSS

MinitabSAS

Stats

Distribución de frecuencias

Medidas de tendencia central

Medidas de variabilidad

ANALISIS DE DATOS

CUANTITATIVOS

• Media.• Mediana .• Moda

• Rango.•Desviación estándar.• Varianza

Gráficas

Puntuaciones Z

La matriz de datos

Descriptiva

Estadística

Inferencial

Se efectúa mediante

Y la

22

Page 3: Clase10 analisisdedatos

ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS

Análisis paramétricos

Análisis no paramétricos

• Coeficientes de correlación.• Prueba t• Prueba de diferencias de proporciones.• Análisis de varianza

• Chi cuadrada.• Spearman y Kendall• Coeficientes para tabulaciones cruzadas

Estadística

Inferencial

Estimar parámetros

Probar hipótesis

Distribución muestral

ANALISIS DE DATOS

CUANTITATIVOS

33

Page 4: Clase10 analisisdedatos

ANALISIS DE DATOS CUANTITATIVOSANALISIS DE DATOS CUANTITATIVOS

REPORTAR RESULTADO

S

Análisis estadístico de variables e hipótesis

Explorar datos

Evaluar la confiabilidad y validez

Ejecutarlo

PASOS

Seleccionar el Programa

ANALISIS DE DATOS

CUANTITATIVOS

44

Page 5: Clase10 analisisdedatos

55

Page 6: Clase10 analisisdedatos

66

Page 7: Clase10 analisisdedatos

77

Page 8: Clase10 analisisdedatos

Estadísticos total-elemento

Media de la escala si se elimina el elemento

Varianza de la escala si se elimina el elemento

Correlación elemento-total corregida

Alfa de Cronbach si se eleimina el elemento

p1 34.1076923 82.34490161 0.51572306 0.919112855p2 33.7230769 79.48861061 0.52288378 0.920134007p3 33.6846154 78.83774597 0.66698428 0.914934288p4 34.2230769 81.7405486 0.5724501 0.917646698p5 33.7153846 76.59278473 0.72957994 0.912909884p6 33.4923077 77.49218843 0.73055437 0.912938363p7 33.9923077 79.99218843 0.59421838 0.917112935p8 33.5692308 78.21610018 0.718686 0.913392359p9 34.1384615 79.67060227 0.6206626 0.916319238p10 33.9461538 80.33041145 0.69171183 0.914638589p11 34.3615385 83.31788909 0.51620397 0.919064274p13 33.9230769 80.47465713 0.62045497 0.91633199p14 33.8076923 80.69916518 0.58154149 0.917416627p15 33.9461538 80.15986881 0.666663 0.915133921p16 34.2384615 84.64812165 0.44031547 0.920740118p17 33.4384615 75.82951699 0.76835231 0.911583916

88

Page 9: Clase10 analisisdedatos

Análisis de los datos en el Análisis de los datos en el proceso de Investigaciónproceso de Investigación

Se busca decidir que Se busca decidir que pruebas estadísticas son pruebas estadísticas son apropiadas para analizar apropiadas para analizar los datos dependiendo de los datos dependiendo de las hipótesis formuladas y las hipótesis formuladas y los niveles de medición de los niveles de medición de las variableslas variables

99

Page 10: Clase10 analisisdedatos

¿Qué análisis pueden efectuarse ¿Qué análisis pueden efectuarse en los datos?en los datos?

Los análisis de datos dependen de 3 Los análisis de datos dependen de 3 factores:factores:

a.a. El nivel de medición de las variablesEl nivel de medición de las variables

b.b. La manera que se hayan formulado las hipótesis.La manera que se hayan formulado las hipótesis.

Cada método tiene su razón de ser y un Cada método tiene su razón de ser y un propósito especifico.propósito especifico.

No se deben hacer mas análisis de los No se deben hacer mas análisis de los necesariosnecesarios

1010

Page 11: Clase10 analisisdedatos

Nom inal Ordinal

Categoricos(Cualitativo)

Discreto Continuo

Num erico(Cuantitativo)

D atos

1111

Page 12: Clase10 analisisdedatos

VariablesVariablesVariablesVariables

1212

Page 13: Clase10 analisisdedatos

Los principales análisis que pueden Los principales análisis que pueden efectuarse son:efectuarse son:

1.1. Estadística descriptiva para cada Estadística descriptiva para cada variablevariable

2.2. Puntuaciones “Z”Puntuaciones “Z”

3.3. Cálculos y Razones de estadísticos Cálculos y Razones de estadísticos inferencialinferencial

4.4. Análisis paramétricos Análisis paramétricos

5.5. Análisis no paramétricosAnálisis no paramétricos

6.6. Análisis multivariablesAnálisis multivariables

1313

Page 14: Clase10 analisisdedatos

1. 1. Estadísticas descriptivas para Estadísticas descriptivas para cada variablecada variable

““La primera tarea es describir los datos, La primera tarea es describir los datos, valores o puntaciones obtenidas para valores o puntaciones obtenidas para cada variable... ¿cómo pueden cada variable... ¿cómo pueden describirse estos datos ? Describiendo describirse estos datos ? Describiendo la la distribución de las puntuaciones o distribución de las puntuaciones o frecuenciasfrecuencias” ” (Fernadez- Collao, Baptista y (Fernadez- Collao, Baptista y Elkes) Elkes)

1414

Page 15: Clase10 analisisdedatos

Distribución de frecuencia:Distribución de frecuencia: Es un conjunto de puntuaciones Es un conjunto de puntuaciones

ordenadas en sus respectivas ordenadas en sus respectivas categorías.categorías.

Variable : conductor preferidoVariable : conductor preferido

Categorías Códigos FrecuenciasCategorías Códigos Frecuencias

AMT 1 50AMT 1 50

LEM 2 88LEM 2 88

FGI 3 12FGI 3 12

MML 4 MML 4 0303

TOTAL 153 TOTAL 153

1515

Page 16: Clase10 analisisdedatos

Distribución de frecuencia resumida:Distribución de frecuencia resumida:

Variable: calificación en la prueba de Variable: calificación en la prueba de motivaciónmotivación

CATEGORIAS FRECUENCIASCATEGORIAS FRECUENCIAS

55 o menos 0355 o menos 03

56-60 1656-60 16

61-65 0961-65 09

66-70 03 66-70 03

71-75 07 71-75 07

76-80 0976-80 09

81-85 0481-85 04

86-90 1186-90 11

91-96 91-96 0101

TOTAL 63 TOTAL 63

1616

Page 17: Clase10 analisisdedatos

HISTOGRAMA

CATEGORÍAS

P

O

R

C

E

N

T

A

J

E

S

1717

Page 18: Clase10 analisisdedatos

GRADO DE CONOCIMIENTOGRADO DE CONOCIMIENTO GRAFICO N° 05GRAFICO N° 05

26%

27%

23%

24%

20%

21%

22%

23%

24%

25%

26%

27%

28%

Muy alto Alto Bajo Muy bajo1818

Page 19: Clase10 analisisdedatos

Modelo de Gráfico Modelo de Gráfico

Gráfico 7.Gráfico 7. Cantidades deCantidades de sanciones por bimestre sanciones por bimestre recibidas por cada aula de la Escuela Militar de Chorrillos.recibidas por cada aula de la Escuela Militar de Chorrillos.

0

20

40

60

80

100

1er 2do 3er 4to

4° A

4° B

4° C

1919

Page 20: Clase10 analisisdedatos

RECURSOSRECURSOSGRAFICO N° 02GRAFICO N° 02

27%

23%

30%

20%

0% 5% 10% 15% 20% 25% 30% 35%

Definitivamente si

Probablemente si

Probablemente no

Definitivamente no

2020

Page 21: Clase10 analisisdedatos

30% 29%

22%

19%

0%

5%

10%

15%

20%

25%

30%

35%

Definitivamente si Probablemente si Probablemente no Definitivamente no

2121

Page 22: Clase10 analisisdedatos

Modelo de TablaModelo de Tabla

Tabla 5Tabla 5Tasas de error para grupos de menor y mayor edad.Tasas de error para grupos de menor y mayor edad.

Tasa mediaTasa media Desviacion Desviacion Tamaño de Tamaño de de errorde error Estándar Estándar la la

muestramuestra

Grado de Grado de Menor MayorMenor Mayor Menor Mayor Menor Menor Mayor Menor Mayor Mayor

DificultadDificultad edadedad edadedad edadedad edad edad edad edad edad edad

BajoBajo .05 .05 .14.14 .08 .08 .15 .15 12 12 18 18

ModeradoModerado .05 .05 .17.17 .07 .07 .15 .15 15 15 12 12

AltoAlto .11 .11 .26.26 .10 .10 .21 .21 16 16 14 14

2222

Page 23: Clase10 analisisdedatos

Frecuencias relativas y acumuladas Frecuencia relativasFrecuencia relativas: son los resultados (%) : son los resultados (%)

de casos de cada categoría.de casos de cada categoría. Frecuencias acumuladasFrecuencias acumuladas:: son los que se va son los que se va

acumulando en cada categoría.acumulando en cada categoría. Frecuencias absolutas: son los puntajes : son los puntajes

directos, sin tener trasformación alguna.directos, sin tener trasformación alguna.

Las distribución de frecuencias, Las distribución de frecuencias, generalmente las frecuencias relativa, generalmente las frecuencias relativa, pueden presentarse en forma de histograma pueden presentarse en forma de histograma o gráficas de otro tipo.o gráficas de otro tipo.

2323

Page 24: Clase10 analisisdedatos

Variable: cooperación del personal en el desarrollo de Variable: cooperación del personal en el desarrollo de

la empresa XXla empresa XX

Categorías códigos frecuencia Frecuencia Categorías códigos frecuencia Frecuencia frecuenciafrecuencia

(cooperación) absoluta relativas ( %) (cooperación) absoluta relativas ( %) acumuladaacumulada

- Si se ha - Si se ha

Obtenido 1 91 74.6% 91Obtenido 1 91 74.6% 91

- No se ha - No se ha

Obtenido 2 05 4.1% 96Obtenido 2 05 4.1% 96

- No - No

Respondieron 3 Respondieron 3 2626 21. 21.3% 122 3% 122

TOTAL 122 100%TOTAL 122 100%

2424

Page 25: Clase10 analisisdedatos

2. Puntuaciones “z”2. Puntuaciones “z”

“… “… Son las trasformaciones que se pueden hacer a los Son las trasformaciones que se pueden hacer a los valores o puntuaciones obtenidas, con el propósito de valores o puntuaciones obtenidas, con el propósito de analizar sus distancia respecto a la media, en unidades analizar sus distancia respecto a la media, en unidades de desviaciones estándar ….”(Sampieri,Collado,Lucio).de desviaciones estándar ….”(Sampieri,Collado,Lucio).

Siendo la formula : Siendo la formula : X = valor a trasformarX = valor a trasformar X = media de distribuciónX = media de distribución S= desviación estándar S= desviación estándar Z= trasformación en Z= trasformación en

unidades de unidades de Desviación estándar Desviación estándar

Z =Z = X - X X - X

SS

2525

Page 26: Clase10 analisisdedatos

3. Razones y tasas3. Razones y tasas

RazónRazón: es la relación entre dos categorías. : es la relación entre dos categorías. Ejm:Ejm: categorías frecuencias categorías frecuencias

absolutas absolutas Masculino Masculino 60 60

FemeninoFemenino 3030

La razón de H y M es La razón de H y M es 6060 =2 =2 3030

^ Por cada dos H hay una M.^ Por cada dos H hay una M.

2626

Page 27: Clase10 analisisdedatos

Tasa:Tasa: es la relación entre el número de casos, es la relación entre el número de casos, frecuencias y el número total de observaciones, frecuencias y el número total de observaciones, multiplicada por un múltiplo de 10. (100 ó 1000). multiplicada por un múltiplo de 10. (100 ó 1000).

Ejemplo:Ejemplo:

TasaTasa = Nº de nacidos vivos en ciudad Nº de nacidos vivos en ciudad X 1000 X 1000

Nª de habitantes en la ciudad Nª de habitantes en la ciudad

T. De nacidos vivos = T. De nacidos vivos = 10 00010 000 X 1000 = 33.33

300 000300 000

Hay 33.33 nacidos vivos por cada 1000 habitantes Hay 33.33 nacidos vivos por cada 1000 habitantes

Tasa=Tasa=Nª. de eventos durante un períodoNª. de eventos durante un período X 100 X 100 ó 1000ó 1000 Nª. total de eventos posibles

2727

Page 28: Clase10 analisisdedatos

4. Cálculos y Razones de estadísticos 4. Cálculos y Razones de estadísticos inferencialinferencial

La estadística inferencial puede ser utilizada La estadística inferencial puede ser utilizada para dos procedimientos.(Wiersma,1986).para dos procedimientos.(Wiersma,1986).

a) Probar hipotesis:a) Probar hipotesis:

b) Estimar paramétros (determinar las b) Estimar paramétros (determinar las estadísticas de la población).estadísticas de la población).

2828

Page 29: Clase10 analisisdedatos

5. Análisis Paramétricos5. Análisis ParamétricosPara realizar análisis paramétricos debe partirse de Para realizar análisis paramétricos debe partirse de

los siguientes supuestos:los siguientes supuestos:

1.1. La distribución poblacional de la La distribución poblacional de la variable dependiente es normal.variable dependiente es normal.

2.2. El nivel de medición de la variable El nivel de medición de la variable dependiente es por intervalos o dependiente es por intervalos o razón.razón.

3.3. Cuando dos o más poblaciones son Cuando dos o más poblaciones son estudiadas, tienen una varianza.estudiadas, tienen una varianza.

2929

Page 30: Clase10 analisisdedatos

Pruebas paramétricas mas usadas son :Pruebas paramétricas mas usadas son :

Coeficiente de correlación de Coeficiente de correlación de PearsonPearson

Prueba “T”Prueba “T”Prueba de contraste de la diferencia Prueba de contraste de la diferencia

de proporciones.de proporciones.Análisis de varianza unidireccional Análisis de varianza unidireccional

(ANOVA Oneway)(ANOVA Oneway)Análisis de varianza factorial (Análisis de varianza factorial (ANOVA)ANOVA)Análisis de covarianza (Análisis de covarianza (ANCOVA)ANCOVA)

3030

Page 31: Clase10 analisisdedatos

6. Análisis no Paramétricos6. Análisis no Paramétricos Las distribuciones pueden ser no normales.Las distribuciones pueden ser no normales. Las variables deben ser categóricas.Las variables deben ser categóricas.

Pruebas estadísticas mas utilizadas:Pruebas estadísticas mas utilizadas:1.1. La ji cuadrada o X2.La ji cuadrada o X2.2.2. Los coeficiente de correlación e Los coeficiente de correlación e

independencia para tabulaciones independencia para tabulaciones cruzadas.cruzadas.

3.3. Los coeficientes de correlación por Los coeficientes de correlación por rangos ordenados de Spearman y rangos ordenados de Spearman y kendall. kendall.

3131

Page 32: Clase10 analisisdedatos

7. ANÁLISIS MULTIVARIADO7. ANÁLISIS MULTIVARIADOSon aquellos en que se analiza la relación Son aquellos en que se analiza la relación

entre varias variables independiente y al entre varias variables independiente y al menos una dependiente. menos una dependiente.

XX1 1

XX22 VD VD XX33

XX4 4

3232

Page 33: Clase10 analisisdedatos

PROCESAMIENTO, ANÁLISIS EPROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INTERPRETACIÓN DE LA

INFORMACIÓNINFORMACIÓN

Al presentar la información a través de Al presentar la información a través de

cuadros, éstos deberán contener cuadros, éstos deberán contener

preferentemente una o dos variables (Tabla preferentemente una o dos variables (Tabla

de doble entrada), ya que la descripción e de doble entrada), ya que la descripción e

interpretación de cuadros de más de dos interpretación de cuadros de más de dos

variables pueden resultar inadecuadas.variables pueden resultar inadecuadas.

3333

Page 34: Clase10 analisisdedatos

PROCESAMIENTO, ANÁLISIS EPROCESAMIENTO, ANÁLISIS EINTERPRETACIÓN DE LA INTERPRETACIÓN DE LA

INFORMACIÓNINFORMACIÓN

Los métodos para el análisis Los métodos para el análisis

estadístico de los datos deberán estadístico de los datos deberán

elegirse según los objetivos elegirse según los objetivos

planteados y de acuerdo con las planteados y de acuerdo con las

hipótesis que se deseen hipótesis que se deseen

contrastar. contrastar. 3434

Page 35: Clase10 analisisdedatos

PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO

CASOS DE INTERES PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

Estudios con una sola muestra Estimación de la media ( ) Estimación de la proporción ( ) Prueba de hipótesis para ( ) Prueba de hipótesis para ( ) Bondad de ajuste

“t” – Student “Z”

“t” – Student “Z”

Kolmogorov; 2

3535

Page 36: Clase10 analisisdedatos

PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO

CASOS DE INTERES PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

Estudios con dos muestras Muestras Independientes Diferencia de promedios Independencia (2 x 2); n <20 Independencia (2 x 2) Independencia (r x c) Numérica y categórica Ambas numéricas Diferencias en tendencia central Experimental y control

“t” – Student

U de Mann Whitney

Fisher 2 Yates

2 sin corregir Mediana

Kolmogorov Wald Moses

3636

Page 37: Clase10 analisisdedatos

PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO

CASOS DE INTERES PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

Estudios con dos muestras Muestras Relacionadas Diferencia pre pos test Antes después (dicotómica) Diferencia de dos muestras Hay relación en las variables Ambas nominales Ambas numéricas Ambas ordinales

“t” pareada

Regresión; r de Pearson

Wilcoxon

McNemar o Kappa De los signos

Riesgo relativo

Odds Ratio

R de Sperman

3737

Page 38: Clase10 analisisdedatos

PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO

CASOS DE INTERES PRUEBAS PARAMETRICAS

PRUEBAS NO PARAMETRICAS

Estudios con más de dos muestras

Muestras Independientes Diferencia de promedios Numérica y Ordinal Muestras Relacionadas Variables numéricas Homogeneidad (dicotómica) Concordancia

ANVA

ANVA Bloques aleat.

Kruskal Wallis

Mediana

Friedman Q de Cochran

Kendall

3838

Page 39: Clase10 analisisdedatos

PRINCIPALES METODOS DE ANÁLISIS ESTADÍSTICO

METODOS DE ANALISIS MULTIVARIANTES

PRUEBAS MULTIVARIANTES

I. Métodos predictivos

Regresión lineal múltiple Análisis de la covarianza Análisis de la varianza Regresión logística múltiple Análisis discriminante

II. Métodos reductivos Componentes principales

Análisis factorial Correlación canónica Análisis cluster Análisis de correspondencias

3939

Page 40: Clase10 analisisdedatos

Coeficiente de Correlación de PearsonCoeficiente de Correlación de Pearson Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00, Interpretación: El coeficiente r de Pearson puede variar de – 1.00 a + 1.00,

donde:donde:- 1.00 Correlación negativa perfecta (“A mayor X, menos Y”, de manera proporcional. Es

decir, cada vez que X aumenta una unidad, Y disminuye siempre una cantidad constante). Esto también se aplica “a menor X, mayor Y”

- 0.90 Correlación negativa muy fuerte.

- 0.75 Correlación negativa considerable.

- 0.50 Correlación negativa media.

- 0.25 Correlación negativa débil.

- 0.10 Correlación negativa muy débil.

0.00 No existe correlación alguna entre las variables

+ 0.10 Correlación positiva muy débil

+ 0.25 Correlación positiva débil.

+ 0.50 Correlación positiva media.

+ 0.75 Correlación positiva considerable.

+ 0.90 Correlación positiva muy fuerte.

+ 1.00 Correlación positiva perfecta4040