Jornada 1 y 2

Post on 24-Jun-2015

97 views 0 download

Transcript of Jornada 1 y 2

MAESTRÍA EN DOCENCIA UNIVERSITARIA

ESTADÍSTICA APLICADA A LA EDUCACIÓN

8-9 /15-16 Febrero 2014

Ing. Edmundo Recalde Posso, MBA

edmundorecalde@gmail.com

• Objetivos del curso:

1. Aplicar la estadística básica en el tratamiento de datos.

2. Interpretar los resultados estadísticos.

3. Desarrollar experimentos simples aplicados a la educación.

• Metodología:– Para cada tema a tratar se utilizará la siguiente

distribución: • Presentaciones power point

• Ejemplos

• Ejercicios para los participantes

• Aplicaciones en Excel

• Formar grupos de máximo 3 personas

Contenido y distribución del tiempoMAÑANA: 8H00-13H00TARDE: 14H00-18H00

• Jornada 1(8 de febrero 2014)– Bases de la estadística, Medidas de tendencia central,

medidas de dispersión. Aplicaciones con Excel

• Jornada 2 (9 febrero 2014)– Medidas de posición, medidas de forma, distribución

normal. Aplicaciones con excel

• Jornada 3 (15 febrero 2014)– Muestreo, Hipótesis, correlación y regresión, t student,

chi cuadrado, aplicaciones con excel

• Jornada 4 (16 febrero 2014) – Diseño e implantación de experimento, análisis de

varianza de uno y dos factores. Aplicaciones con excel

Que debe tener el participante

• Calculadora.

• Computador.

• Tablas estadísticas.

Evaluación:

– Talleres: 20% (D1, D2, D3, D4): (10 p)

– Tareas: 20% (D1, D2, D3): (10 p)

– Pruebas: 20% (D2, D3, D4): (10 p)

– Pr. de Inv.: 40% (D4): (20 p)

NOTA: 50/50.

Bibliografía

• Triola, M. 2004 Probabilidad y Estadística

Pearson Educación Novena Edición México 648 p.

• Pérez, C. 2002 Estadística aplicada a través

de Excel Pearson Educación S.A. Madrid-España 596 p.

• Reyes, C. 1999 Diseño de experimentos

aplicados Editorial Trillas México 348 p.

• Gutiérrez, H. 2003 Análisis y Diseño de

Experimentos Editorial McGraw Hill México 559 p.

8

La Estadística es la Ciencia de la

• Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

9

10

� La estadística en el diseño de los experimentos:� Es una colección de métodos para planear

experimentos, obtener datos, y después organizar, resumir presentar, analizar interpretar y llegar a conclusiones basadas en los datos.

11

� Herramienta indispensable para la toma de decisiones.

12

� Investigación de mercados.� Control de la Calidad� Medicina e Investigación� Agricultura� Censos poblacionales� Sociología.� Ingeniería

13

� Indice de Precios al Consumidor Urbano IPC - SEPTIEMBRE 2007

� Variación Mensual: 0,71%� Variación Anual: 2,58%� En lo que va del año: 2,09%� Canasta Analítica Fam. Básica464,90� Canasta Analít.Familiar Vital323,87

14

POBLACION:Es la colección completa de

todos los elementos (puntuaciones, personas, mediciones, etc) a estudiar.

MUESTRA:Es un subconjunto de los

miembros seleccionados de una población.

15

16

17

� Tamaño de la muestra:� Número de unidades que constituyen una muestra.

� Variable: Característica de interés acerca de cada elemento de una población o m.

� Dato: Valor de la variable� Datos: Conjunto de valores de la variable� Observaciones: conjunto de modalidades o

valores de cada variable estadística medidos en un mismo individuo

18

� Experimento: Actividad realizada según un plan definido cuyos resultados producen un conjunto de datos.

19

� Parámetro: Número que describe algunas propiedades de la población

� Estadístico: Número que describe algunas propiedades de la muestra.

LA ESTADISTICA ES PARA LA MUESTRA LO QUE EL PARAMETRO ES PARA LA

POBLACION.

20

Variable es la cantidad o carácter que puede ser medido y se halla sujeto a variación.

- Cualitativas- Cuantitativas

- Discretas (Si toman valores enteros)- Número de hijos, Número de plantas,

- Contínuas ( si entre dos valores, son posibles infinitos valores)- Altura, presión sanguínea, dosis de medicamento.

21

� NOMINAL: Datos consistentes en nombres, etiquetas o categorías.� Ej. SI/NO.� ORDINAL: Cuando pueden agruparse por algún orden, aunque

no es posible establecer diferencias entre ellos.� Ej. Calificación de A, B, C, D.

� INTERVALO: Semejante al ordinal pero que los datos si tienen significado. Los datos no tienen un punto de partida natural desde cero.� Ej. La temperatura.

� RAZÓN: Semejante al nivel de intervalo pero este tiene un punto de partida o cero inherente.� Ej. Precios del litro de leche.

22

SIMBOLOGIA

DESCRIPCION

X, Y, Z Variables

.a, b, c Constantes

∑ Sumatoria

i

Elementos de un conjunto ( iésima)

j Elementos de un conjunto ( jésima)

23

24

Varianza de la población

Media aritméticaMedia aritmética ponderada

Moda Desviación media

iXn

i

∑= 1

25

Desde

Hasta Observaciones

26

Presentación ordenada de datos

0

1

2

3

4

5

6

7

Hombre Mujer

• Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.

Género Frec.

Hombre 4

Mujer 6

Agrupamiento de los datos en clases condensa los datos originales.

Frecuencia absolutaFrecuencia relativaFrecuencia acumulada

27

28

• Diagramas de barras– Alturas proporcionales a las frecuencias (abs. o

rel.)

– Se pueden aplicar también a variables discretas

• Diagramas de sectores (tartas, polares)– No usarlo con variables ordinales.

– El área de cada sector es proporcional a su frecuencia (abs. o rel.)

• Pictogramas– Fáciles de entender.

– El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.

29

30

� Distribucion binomial

31

32

33

34

35

� Graficas en 3D

36

� Modelos en 3D

37

� Ternary plots

38

39

40

41

� Reduccion de datos

42

� Rotacion de datos en un espacio de 3D

43

� Si no hay variación no existiría la estadística.� Bastaría solo una medición para obtener lo que

estamos buscando

44

45

46

“Todo tiene una causa, no hay causa sin efecto, ni efecto que no tenga una causa”

47

VARIABLE INDEPENDIENTE

VARIABLE

DEPENDIENTE

CAUSA EFECTO

EJEMPLOS EJEMPLOS

FACTOR EN ESTUDIO VARIABLES

� APLICADO A LOS PROCESOS

48

� Las personas no son recordadas por el número de veces que fracasan, sino por el número de veces que tienen éxito.

� Thomas Alva Edison

49

50

Antes de

involucrarse en el

proceso de

investigación

Después de

involucrarse en el

proceso de

investigación

Tema 2:Medidas de tendencia central

Maestría en Docencia UniversitariaEstadística Aplicada a la Educación

Ing. Edmundo Recalde Posso, MBA

La media

Valor que pretende representar en un solo número las características mas relevantes de un conjunto de datos.

Media de la población

Media de la muestra

NiX /∑

niX /∑

=

=

Ejemplo:

5 6 10 14 18 20 22

13.6

La media

5 6 10 14 18 20 22

13.6

5 6 10 14 18 20 45

16.9

Media ponderada

Ejemplo:

Las calificaciones obtenidas por 26 estudiantes de un curso de estadística fueron:

Calificaciones No. Estudiantes10 59 48 67 46 35 24 2

Xi f

∑ NXif

Desarrollo del ejemplo:

La mediana

• Valor de la variable que ocupa el lugar central.

– Ventajas. No influye en ella los valores extremos (estadístico robusto).

– Tiene utilidad en los gráficos de control de procesos.

2 5 7 9 12

Media ?

Mediana ?

2 5 7 9 125

Media ?

Mediana ?

2 5 7 9 12

Media 7

Mediana 7

2 5 7 9 125

Media 29.6

Mediana 7

• Ejemplo:

– Hallar la mediana de los siguientes datos:

• 15,12, 20, 18, 22.

• PASOS:

• 1. Ordenar: 12 – 15 – 18 – 20 – 22.

• 2. Valor central: 18 (Me).

Mediana con datos no agrupados

Calificaciones No. estudiantes

10 5

9 4

8 6

7 4

6 3

5 2

4 2

Me = ?

Pasos:1. Calcular fa.

2. Calcular N/2.

3. Localizar la primera fa > N/2

4. La Me es entonces el valor de la variable correspondiente.

Mediana con datos no agrupados

Calificaciones No. estudiantes

10 5

9 4

8 6

7 4

6 3

5 2

4 2

Me = 8

Pasos:1. Calcular fa.

2. Calcular N/2.

3. Localizar la primera fa > N/2

4. La Me es entonces el valor de la variable correspondiente.

Mediana con datos agrupados

Intervalos No.

75-79 3

80-84 4

85-89 8

90-94 10

95-99 15

100-104 20

Pasos:1. Calcular fa.

2. Calcular N/2.

3. Localizar la primera fa > N/2

4. Aplicar la fórmula:

La Moda (Mo)

• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal

La Moda (Mo)

• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal

2 7 6 5 7 8 Mo

4 3 1 4 3 6 Mo

9 6 3 5 2 Mo

5 5 8 7 8 5 6 8 7 2 7 Mo

?

?

?

?

5 8 9 4 5 Mo= ?

La Moda (Mo)

• Es el valor de la variable que más veces se repite.– Tipos: Bimodal, trimodal, multimodal

2 7 6 5 7 8 Mo

4 3 1 4 3 6 Mo

9 6 3 5 2 Mo

5 5 8 7 8 5 6 8 7 2 7 Mo

7

3 y 4

-

5, 7, 8

5 8 9 4 5 Mo= 5

Moda con datos no agrupados

Calificaciones No. estudiantes

10 5

9 4

8 6

7 4

6 3

5 2

4 2

Mo = ?

Pasos:1. Localizar la mayor f.2. La variable correspondiente a la mayor frecuencia es la moda.

Resolución Mo

Calificaciones No. estudiantes

10 5

9 4

8 6

7 4

6 3

5 2

4 2

Mo = 8

Moda con datos agrupadosEdad No. trabajadores

61-65 4

56-60 7

51-55 16

46-50 27

41-45 41

36-40 67

31-35 99

26-30 191

21-25 83

Pasos:1. Localizar el intervalo

con mayor frecuencia.

2. Aplicar la siguiente fórmula:

Donde:d1= diferencia entre frecuencia modal y frecuencia del intervalo menor de la serie.d2= Diferencia entre la frecuencia modal y la frecuencia del intervalo mayor de la serie

Resolución de Moda

Edad No. trabajadores

61-65 4

56-60 7

51-55 16

46-50 27

41-45 41

36-40 67

31-35 99

26-30 191

21-25 83

Mo = 28.2 años

Tema 3:Medidas de dispersión

Maestría en Docencia UniversitariaEstadística Aplicada a la Educación

Ing. Edmundo Recalde Posso, MBA

Medidas de Dispersión

Si los valores están próximas entre sí o si por el contrario están muy dispersos.

Medidas de dispersión

• Rango

• Desviación media

• Varianza

• Desviación estándar

• Coeficiente de variación

• RANGO: Diferencia entre el mayor y el menor valor

• Ejemplos:

8 23 4 30 7 6 10

14 20 11 8 6 11 16 5

R =?

R = ?

• Resolución:

8 23 4 30 7 6 10

14 20 11 8 6 11 16 5

R = 30-4 = 26

R = 20-5 = 15

• DESVIACION MEDIA:

• EJEMPLO:

• Los siguientes son las calificaciones de un grupo de estudiantes:

• 12, 14, 16, 12, 15, 14, 17, 19, 16

– Cuál es la desviación media?

– RESOLVAMOS

• EJEMPLO:

• 12, 14, 16, 12, 15, 14, 17, 19, 16

• DM= 1.90

LA VARIANZA:

Medida de variación igual al cuadrado de la desviación estándar

σ 2S

2

Unidades elevadas al cuadrado?

Y su uso?ANALISIS DE VARIANZA

(ADEVA)

La varianza

8 cms.

8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8

9=

72

9= 8

…Consideremos el siguiente cambio

¿Cuál es el nuevo promedio de estos 9 rectángulos?

8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8

9=

72

9= 8 cm

... ¡el mismo promedio! Pero... ¿ha habido variación?

8 cms.

10 cm

6 cm

…la varianza

Rojo +2

Azul -2

8 cms.

10 cm

6 cm

Si sumamos estas diferencias de la altura respecto del promedio, tenemos

0 + 0 + 0 + 0 + 2 + 0 + 0 – 2 + 0 = 0

Este valor nos parece indicar que ¡no ha habido variabilidad! Y sin

embargo, ante nuestros ojos, sabemos que hay variación.

…la varianza

8 cms.

10 cms

6 cms

Una forma de eliminar los signos negativos:

es elevar al cuadrado todas las diferencias, y luego sumar...

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 = 8

Y este resultado repartirlo entre todos los rectángulos, es decir lo

dividimos por el número de rectángulos que es 9

02 + 02 + 02 + 02 + 22 + 02 + 02 + (– 2)2 + 02 =

9 9

8= 0,89

…la varianza es entonces?

8 cms.

10 cms

6 cms

Se dice entonces que la varianza fue de 0,89 cm2

La desviación estándar

• Medida de variación de todos los valores con respecto a la media.

• Simbología s (para la muestra)

• Positivo y si es cero lo valores son el mismo número.

• Las unidades de desviación estándar son las mismas de los datos originales (kg, pie, minutos, etc.)

Fórmulas para Desviación estándar

Fórmula para la población

Fórmula para la muestra

σ

s =

=

…Regresemos a los rectángulos

8 cm

10 cm

6 cm

La varianza fue de 0,89

0,89 0,943=

La raíz cuadrada de la varianza se llama desviación estándar

Que nos dice la desviación estándar?

8 cm

10 cm

6 cm

Que la desviación estándar haya sido de 0,943 significa que en promedio la

altura de los rectángulos variaron (ya sea aumentando, ya sea

disminuyendo) en 0,943 centímetros.

Es claro que esta situación es “en promedio”, puesto que sabemos que

los causantes de la variación fueron los rectángulos quinto y octavo.

Esta variación hace repartir la “culpa” a todos los demás rectángulos

que se “portaron bien”.

La desviación estándar mide la dispersión de los datos respecto del

promedio

…la varianza

8 cm

10 cm

6 cm4 cm

8 cm 8 cm 8 cm7 cm

8 cm

¿Cuál es la varianza y la desviación estándar de las alturas de los rectángulos?

En primer lugar debemos calcular el promedio

8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8

9= 7,44

Luego debemos calcular la varianza

…la varianza

8 cm

10 cm

6 cm4 cm

8 cm 8 cm 8 cm7 cm

8 cm

Promedio

7,44

0,56-3,44

0,56 0,56 2,56 0,56 -0,44 -1,44

0,56

0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562

9

22,2224

9=

= 2,469Este es el valor de la varianza

…la varianza10 cm

8 cm

6 cm4 cm

8 cm 8 cm 8 cm7 cm

8 cm

Promedio

7,44

Si la varianza fue de 2,469, entonces la desviación estándar es de...

2,469 1,57=

Lo que significa que, en promedio, los rectángulos se desviaron más o

menos (más arriba o más abajo) en 1,57 cm.

• COEFICIENTE DE VARIACION (%)

– Grado de precisión del diseño y la conducción del experimento.

100xS

CV =

Ejemplo de interpretación de CV

• Si el CV 0-10 %

• Si el CV 10-15%

• Si el CV 15-25 %

• Si el CV >25 %

MUY BUENO

BUENO

MALO

A DESECHAR

Tema 4:Medidas de posición

Maestría en Ciencias de la EducaciónEstadística en Educación

Mgs. Edmundo Recalde Posso

MEDIDAS DE POSICIÓN

- Cuartiles

- Quintiles

- Centiles

Cuartiles

Q1 Q3Q2

0% 50% 75% 100%25%

�� � �� �

��4 �� � 1�

������ � �� �

��4 �� � 1�

����

K = 1, 2, 3

Quintiles

Q1 Q3Q2

0% 40% 60% 100%20%

�� � �� �

��5 �� � 1�

������ � �� �

��5 �� � 1�

����

K = 1, 2, 3, 4

Q4

80%

Centiles

0% 100%

�� � �� �

��100

�� � 1�

������ � �� �

��100

�� � 1�

����

K = 1, 2, 3, …, 99

Medidas de forma

- Medidas de asimetría

- Curtosis.

Medidas de asimetría

Medidas de asimetría

g1=0g1>0

g1<0

http://www.spssfree.com/spss/analisis3.html

Curtosis

http://www.uv.es/ceaces/base/descriptiva/curtosis.htm

Curtosis

Fórmula de cálculo (g2)

• g2=0 (MESOCÚRTICA) +/- 0,5.

• g2>0 (LEPTOCÚRTICA)

• g2<0 (PLATICÚRTICA)

Asimetría y curtosis

Si g1= +/- 0,5

Y g2= +/- 0,5

Distribución normal

Distribución NO normal

SI

NO

INFERENCIA

La distribución normal

Estadística en Educación

Ing. Edmundo Recalde, MBA

Distribución normal

• Distribucion de poisson

Medidas de posicionamiento relativo

Introducción

- Abraham Moivre (1667-1754). -Desarrollo

- Friedrich Gauss (1777-1855) –Ecuación de la curva.

Es la distribución de probabilidad más importante en estadística.

En Educación la mayoría de los casos se aproximan a una distribución normal.

Características

• Asintótica.

• Area total =1.

• Simétrica.

• Se debe transformar cualquier valor de la variable a una variable normal tipificada.

Fuente de la imagen: http://www.uv.es/ceaces/pdf/normal.pdf

Características

La campana de Gauss

Fuente de imagen: http://rudy-gonzalez.blogspot.com/2010/09/distribucion-normal.html

Distribución normal tipificada

Fuente imagen: http://www.disfrutalasmatematicas.com/datos/distribucion-normal-estandar.html

Puntuación z

• Se calcula convirtiendo un valor a una escala estandarizada

Número de desviaciones estándar que un valor x

se encuentra por arriba o por debajo de la media

σ

µ−=

XZ

s

XZ

−=

Criterios de puntuaciones z

Valores infrecuentes Valores infrecuentesValores comunes

-1-2-3 0 1 2 3

Ejemplo

• Michael Jordan mide: 78 pulgadas (NBA)

• Rebecca Lobo mide 76 pulgadas (WNBA)

• Los hombres: media 69 pulgadas (S = 2.8 )

• Las mujeres: Media 63.6 pulg. (s= 2.5)

• Para comparar sus estaturas con respecto a las poblaciones de hombres y mujeres hay que estandarizar dichas estaturas.

Resolución de ejemplo

• Transformamos a puntuaciones z:

– Jordan:z = 3.21

– Lobo: z = 4.96

• INTERPRETACION:– La estatura de Jordan está a 3.21 desviaciones estándar por arriba de

la media, pero la estatura de Lobo está a 4.96 desviaciones estándar

por arriba de la media.

• Es decir:– La estatura de Lobo entre las mujeres es relativamente mayor que la estatura

de Jordan entre los hombres.

• Otro ejemplo:– Mugsy Bogues alcanzó el éxito con una

estatura de 5 pies y 3 pulgadas

– Estatura media de los hombres 69 pulg.

– Desviación estándar de 2.8 pulg.

– Quien desea calcular z =?.

• Primero debemos tener las mismas unidades de medida, entonces:– 5 pies y 3 pulgas = 63 pulgadas.

QUE OBTENEMOS DE AQUÍ:

Siempre que un valor sea menor que la media, su puntuación z correspondiente será negativa.