ornadas de introducción a la investigación estadística

52
ESTADÍSTICA COORDINACIÓN 2012 LICEO N° 2 HÉCTOR MIRANDA PROF. TERESITA FUSTER BARDIER BREVE INTRODUCCIÓN PARA DOCENTES

description

ornadas de introducción a la investigación estadística para los profesores del liceo. nº2

Transcript of ornadas de introducción a la investigación estadística

Page 1: ornadas de introducción a la investigación estadística

ESTADÍSTICA

COORDINACIÓN 2012

LICEO N° 2 HÉCTOR MIRANDA

PROF. TERESITA FUSTER BARDIER

BREVE INTRODUCCIÓN PARA DOCENTES

Page 2: ornadas de introducción a la investigación estadística

OBJETIVOS

El objetivo principal del curso es mostrar a

los colegas docentes una breve

introducción a la Estadística, algunas de sus

aplicaciones relacionadas con el trabajo

diario del docente, formas de presentar los

datos ya procesados y la lectura de los

mismos.

2

Page 3: ornadas de introducción a la investigación estadística

CONTENIDO DEL CURSO

Estadística: qué es, para qué sirve, cómo

pueden usarla los docentes.

Investigación estadística

Datos estadísticos: formas de recolección.

Variables estadísticas

Variables de resumen

Gráficos y tablas: construcción y lectura

3

Page 4: ornadas de introducción a la investigación estadística

DEFINICIÓN

Es la ciencia que tiene por objeto la

recolección, la organización, el

análisis y la presentación de datos,

con el fin de brindar información

que facilite la toma de decisiones.

4

Page 5: ornadas de introducción a la investigación estadística

APLICACIONES (ejemplos)

Recopilación de datos de los alumnos, análisis de los mismos y toma de decisiones a nivel grupal e individual.

Prueba diagnóstica

Análisis comparativo de escritos o pruebas, ya sea dentro del grupo o entre diferentes grupos.

Análisis de los datos de promoción, relacionarlos (si es posible) con otros datos de los alumnos y análisis comparativos.

Recordar que todos estos ejemplos deben utilizarse como base para otros análisis y tomas de decisiones y no como un fin en sí mismos.

5

Page 6: ornadas de introducción a la investigación estadística

INVESTIGACION ESTADÍSTICA

Objetivos de la investigación.

Pregunta problema.

Hipótesis (si la hubiera).

¿Investigación cualitativa o cuantitativa?

Determinación de la forma de recoger los

datos.

Determinación del tipo de formulario a

emplear.

6

Page 7: ornadas de introducción a la investigación estadística

INVESTIGACIÓN CUANTITATIVA

Plan de tabulados (de acuerdo al objetivo

planteado).

Determinación de las preguntas a incluir

(para cumplir con el plan de tabulados).

Recogida de datos (trabajo de campo).

Introducción, depuración y análisis de los

datos.

Publicación de resultados.

7

Page 8: ornadas de introducción a la investigación estadística

CONCEPTOS BÁSICOS Población: Una población finita (o simplemente

población) es un conjunto finito de elementos. O sea, puede determinarse sin ambigüedad si un elemento pertenece o no al conjunto. Denominaremos población objetivo, a la población finita sobre la cual deseamos obtener alguna información estadística.

Muestra: Es un subconjunto de la población: no tenemos los datos totales de la población, sino solamente de una parte de ella. En estos casos, las conclusiones extraídas de estos datos pueden extenderse o no a la población dependiendo de cómo se haya extraído la muestra.

8

Page 9: ornadas de introducción a la investigación estadística

RECOLECCIÓN DE DATOS

Registros administrativos

Censos

Encuestas por muestreo

9

Page 10: ornadas de introducción a la investigación estadística

RECOLECCIÓN DE DATOS

REGISTROS ADMINISTRATIVOS: son datos que

fueron recolectados con fines no estadísticos,

pero que pueden ser una base para el análisis

estadístico.

CENSOS: los datos se recogen directamente con

finalidad estadística. Se aplica el cuestionario a

toda la población objetivo.

10

Page 11: ornadas de introducción a la investigación estadística

RECOLECCIÓN DE DATOS ENCUESTAS: las encuestas también se aplican

con fines estadísticos. La diferencia con el censo es que se recolectan datos de una porción de la población.

ENCUESTAS POR MUESTREO ALEATORIO: tienen detrás un diseño de muestreo que permite expandir eficazmente sus resultados al total de la población.

ENCUESTAS POR MUESTREO NO ALEATORIO: no tienen un diseño muestral detrás. Sus resultados no pueden generalizarse al total poblacional.

11

Page 12: ornadas de introducción a la investigación estadística

VARIABLES ALEATORIAS Una variable es cualquier dato sujeto a medida o cuenta. Es aleatoria si no se puede predecir su valor. Ejemplos:

La hora de salida del sol cada día no es una variable aleatoria, ya que los astrónomos saben de antemano la hora exacta de la misma para cada día del año.

La cantidad de lluvia caída durante un período específico sí es una variable aleatoria, ya que no puede predecirse.

También son variables aleatorias:

La cantidad de alumnos inscriptos en cada liceo determinado año.

El número de alumnos que promueven el curso.

12

Page 13: ornadas de introducción a la investigación estadística

VARIABLES ALEATORIAS Cualitativas: También se llaman categóricas. Los

datos están divididos en clases o categorías. Por ejemplo: sexo del alumno, orientación, etc.

Pueden clasificarse en:

Nominales: las categorías no siguen ningún ordenamiento. Ejemplo: sexo, barrio en el que vive el alumno.

Ordinales: las categorías presentan cierto orden lógico. Ejemplo, preguntas de opinión cuya valoración es Bueno, Regular, Malo.

13

Page 14: ornadas de introducción a la investigación estadística

VARIABLES ALEATORIAS Cuantitativas: Son datos numéricos. Se clasifican

en:

Discretas: son aquellos datos que se pueden contar o numerar. Ejemplos: edad del alumno, cantidad de alumnos matriculados en cada clase; cantidad de profesores de Matemática; cantidad de horas libres que tiene el Liceo por día.

Continuas: datos numéricos que pueden tomar cualquier valor (en general, entre ciertos límites). Por ejemplo: salario por hora docente en el tiempo o en diferentes grados; altura y peso de una persona.

14

Page 15: ornadas de introducción a la investigación estadística

ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIVARIADAS

Distribución de frecuencia y frecuencia acumulada

La frecuencia de una variable (ya sea discreta o

cualitativa) es la cantidad de veces que el dato se

repite. Normalmente los datos se presentan

agrupados según una tabla de frecuencias, que

puede contener frecuencias absolutas (número de

casos) o frecuencias relativas (porcentajes).

Si la variable es ordinal o cuantitativa puede

presentarse una distribución de frecuencia que

acumula cantidades desde la menor a la mayor.

15

Page 16: ornadas de introducción a la investigación estadística

ESTADÍSTICA DESCRIPTIVA El siguiente ejemplo corresponde a respuestas a la

pregunta sobre la opinión del estudiante sobre

Matemática, recogida en la prueba diagnóstica 2011

de 3 grupos de 5° año.

Opinión sobre Matemática

Frecuencia

absoluta Frecuencia

relativa Frecuencia

acumulada

No me gusta 2 3,17 3,17

Me disgusta algo 2 3,17 6,35

Ni me gusta ni me

disgusta 12 19,05 25,40

Me gusta algo 29 46,03 71,43

Me gusta mucho 18 28,57 100,00

Total 63 100

16

Page 17: ornadas de introducción a la investigación estadística

GRAFICAS UNIVARIADAS

El tipo de gráfica depende de la variable con la cual se está trabajando: Variables cualitativas: gráficas de

barras, gráficas de torta o circulares.

Variables cuantitativas discretas: histogramas, gráficas de puntos.

Variables cuantitativas continuas: gráficas de puntos.

17

Page 18: ornadas de introducción a la investigación estadística

Gráficas de barras

18

0

5

10

15

20

25

30

35

No me gusta Me disgusta

algo

Ni me gusta ni

me disgusta

Me gusta algo Me gusta

mucho

Número de alumnos

Siguiendo el ejemplo anterior: número de alumnos

por opinión sobre Matemática

Page 19: ornadas de introducción a la investigación estadística

Gráficas circulares

19

Total de alumnos

Femenino

Masculino

Para los alumnos que realizaron la misma prueba

diagnóstica. La variable utilizada es el sexo de los

alumnos.

Page 20: ornadas de introducción a la investigación estadística

Histogramas

20

0

5

10

15

20

25

30

35

40

45

15 16 17 18 19

Numero de alumnos

Siguiendo el ejemplo visto anteriormente, la variable

es la edad de los alumnos en años cumplidos al

momento de la prueba.

Page 21: ornadas de introducción a la investigación estadística

Gráficas de puntos

21

0

5

10

15

20

25

30

35

40

45

14 15 16 17 18 19 20

N° de alumnos

En el mismo ejemplo anterior, la gráfica

representa el número de alumnos según la edad.

Page 22: ornadas de introducción a la investigación estadística

MEDIDAS DE RESUMEN

22

Se tratan de medidas que ofrecen un resumen

de la distribución de los datos, con la menor

pérdida de información posible.

Se utilizan también para comparar distribuciones

distintas de la misma variable (diferencia

temporal o geográfica, por ejemplo)

Se consideran dos tipos de variables de

resumen: las medidas de tendencia central (o

de posición y las medidas de dispersión.

Page 23: ornadas de introducción a la investigación estadística

Variables cualitativas

El único resumen que puede darse es la

variable de tendencia central llamada

MODO (o Moda)

Representa el o los valores de la variable

con mayor frecuencia.

Por ejemplo, en los casos vistos anteriormente :

Opinión sobre Matemática: el modo es “Me

gusta algo”

Sexo de los alumnos: el modo es: “Femenino”

23

Page 24: ornadas de introducción a la investigación estadística

Variables cualitativas

Medidas de tendencia central:

Modo

Media

Medidas de posición:

Percentiles o cuantiles

Cuartiles, quintiles, deciles

Medidas de dispersión:

Rango

Varianza (o variancia)

Desvío (o desviación) estándar (o típica)

24

Page 25: ornadas de introducción a la investigación estadística

Variables cuantitativas Tendencia central: modo

Modo: valor o valores de la variable que tiene la

mayor frecuencia.

En el ejemplo de las edades de los alumnos, el modo es

16.

25

Page 26: ornadas de introducción a la investigación estadística

Variables cuantitativas Tendencia central: media

26

Page 27: ornadas de introducción a la investigación estadística

Variables cuantitativas Tendencia central: media

Variable agrupada por frecuencia

27

Edad N° de alumnos

Edad*N° alumnos

15 5 75

16 40 640

17 12 204

18 4 72

19 2 38

Total 63 1029

Page 28: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de posición

Indican el valor de la distribución de la variable

ordenada que ocupa el lugar indicado. Por ejemplo:

Cuartiles: el primer cuartil es el valor de la variable que

deja al 25% de la distribución con valores menores. El

segundo cuartil (o mediana) es el valor de la variable que

ocupa el medio de la distribución ordenada. El tercer

cuartil deja el 75% de la distribución de la variable con

valores menores.

Quintiles: la distribución de la variable ordenada se separa

en 5 grupos de igual tamaño.

Deciles: idem con 10 grupos de igual tamaño.

Cuantiles o percentiles: lo mismo, con 100 grupos de igual

tamaño.

28

Page 29: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de posición

Ejemplo: se tienen las edades de 13

alumnos. Se ordenan de menor a mayor.

14, 14, 15, 15, 15, 15, 16, 16, 16, 16, 17, 17, 18

29

En este caso la mediana es 16 ya que hay 6

alumnos con edades menores y 6 alumnos

con edades mayores

Page 30: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión

El siguiente ejemplo muestra las notas obtenidas

por 10 alumnos de 3 grupos distintos en un escrito:

30

Grupo 1 Grupo 2 Grupo 3

6 5 1

6 5 2

6 5 3

6 6 4

6 6 5

6 6 7

6 6 8

6 7 9

6 7 10

6 7 11

En los tres

casos, la

media es 6

Page 31: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión

Las gráficas correspondientes son:

31

0

2

4

6

8

1 2 3 4 5 6 7 8 9 10

Grupo 1

0

2

4

6

8

1 2 3 4 5 6 7 8 9 10

Grupo 2

0

2

4

6

8

10

12

1 2 3 4 5 6 7 8 9 10

Grupo 3

Page 32: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión: Rango

Se define el rango como la diferencia entre el mayor valor que toma la variable en esa distribución y el menor valor de esa variable.

En los ejemplos de escritos vistos:

En el primer caso el rango es: 6 – 6 = 0

En el segundo grupo es: 7 – 5 = 2

En el grupo 3, el rango es: 11 – 1 = 10

Puede observarse que el tercer grupo es el “más desparejo” de los tres (los valores de la variable tienen mayor dispersión)

32

Page 33: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión: varianza

La varianza puede definirse como un

promedio de la diferencia al cuadrado

entre los valores que toma la variable y

la media de la distribución. Esta

diferencia debe considerarse al

cuadrado porque, por la propia

definición de la media, sería siempre 0.

33

Page 34: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión: varianza

34

Nota Nota - media (Nota - media)^2

1 -5 25

2 -4 16

3 -3 9

4 -2 4

5 -1 1

7 1 1

8 2 4

9 3 9

10 4 16

11 5 25

Suma 0 110

Page 35: ornadas de introducción a la investigación estadística

Variables cuantitativas Medidas de dispersión: desvío estándar

Para el cálculo de la varianza, se eleva la diferencia con la media al cuadrado, por lo que la unidad de medida que se está usando también queda elevada al cuadrado.

Si se quiere considerar la unidad de medida original, se calcula la raíz cuadrada de la varianza. A este valor se le llama desvío estándar, desviación estándar o desvío típico.

En el caso visto anteriormente, el desvío estándar es 3,49.

Esto significa que, en promedio, las notas obtenidas en los escritos de desvían 3,49 unidades de la media.

35

Page 36: ornadas de introducción a la investigación estadística

Diagrama de caja y bigotes

36

• El cuerpo de la caja muestra el recorrido

intercuartílico (RIC) (entre el primer y el tercer

cuartil)

• La línea en la caja muestra la mediana.

• Los “bigotes” se encuentran a 1,5 RIC de los

bordes de la caja.

• Los valores que quedan fuera de este rango se

denominan atípicos (outliers)

• Es un diagrama muy útil para comparar

distribuciones, ya que muestra también la

dispersión de las mismas.

Page 37: ornadas de introducción a la investigación estadística

Diagrama de caja

37

Diagrama de caja

que representa la

nota obtenida por

los alumnos de 5°B1

y 5°B2 (2012) en la

Prueba Diagnóstica

de puntaje máximo

30.

El número 18

corresponde al orden

del alumno que tuvo

el máximo puntaje (la

nota se observa en los

valores del eje)

Page 38: ornadas de introducción a la investigación estadística

Otras medidas de resumen: tasas

Las tasas o ratios son cocientes entre

cantidades específicas de una variable o de

dos variables. Se calcula en general como el

total de veces que se presenta el fenómeno

estudiado sobre el total poblacional.

Como ejemplo se verán las tasas de

escolarización bruta y la tasa de

escolarización neta.

Las definiciones y cuadros siguientes fueron extraídos del

Observatorio de la Educación de ANEP.

38

Page 39: ornadas de introducción a la investigación estadística

Tasas de escolarización. La tasa bruta de escolarización (TBE) se calcula como el

número total de alumnos de cualquier edad matriculados

en un determinado nivel de enseñanza, expresado en

porcentaje de la población del grupo en edad oficial de

cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial,

6 a 11 años para educación primaria, 12 a 17 años para

educación media general, 12 a 14 años para ciclo básico

de educación media, 15 a 17 años para segundo ciclo de

educación media y 18 a 24 años para educación

terciaria).

Los alumnos matriculados surgen de los registros

estadísticos de cada uno de los subsistemas. La población

en edad oficial (o teórica) surge de las proyecciones al 30

de junio de cada año realizadas por el Instituto Nacional de Estadística.

39

Page 40: ornadas de introducción a la investigación estadística

Tasa bruta de escolarización

AÑO

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

TOTAL EDUCACIÓN

MEDIA 94,5 97,8 103,2 107,0 105,7 102,6 102,4 100,1 101,7 103,4 102,4

Pública 83,4 86,7 92,2 96,3 94,7 91,3 91,0 88,6 89,3 90,6 89,6

Secundaria 64,9 68,4 73,2 76,0 74,3 71,9 70,6 68,1 69,1 70,1 70,0

CETP 18,4 18,3 19,0 20,3 20,4 19,4 20,5 20,5 20,2 20,5 19,6

Privada 11,1 11,0 11,0 10,7 11,0 11,3 11,4 11,5 12,4 12,8 12,8

Total ciclo básico 93,9 97,0 100,5 101,8 100,4 98,0 98,7 98,3 104,4 107,4 108,0

Pública 80,3 83,5 87,4 89,4 87,7 85,5 85,7 85,1 89,7 92,0 92,5

Secundaria 71,3 74,7 78,4 79,9 78,1 75,8 75,9 75,2 79,0 80,1 80,2

CETP 9,0 8,8 9,0 9,5 9,6 9,7 9,8 9,9 10,8 11,9 12,3

Privada 13,6 13,5 13,1 12,4 12,7 12,6 13,1 13,2 14,7 15,4 15,4

Total segundo ciclo 82,3 86,0 93,3 98,7 98,0 95,9 94,1 90,5 88,6 90,8 90,7

Pública 73,6 77,4 84,5 89,7 88,8 85,8 84,4 80,6 78,6 80,6 80,6

Secundaria 58,5 62,0 68,0 72,0 70,5 67,9 65,1 60,8 59,0 59,8 59,7

CETP 15,2 15,4 16,5 17,7 18,3 17,9 19,3 19,8 19,6 20,8 20,9

Privada 8,6 8,5 8,8 8,9 9,2 10,1 9,7 9,9 10,0 10,1 10,1

40

Fuente: Observatorio de la Educación - ANEP

Page 41: ornadas de introducción a la investigación estadística

Tasa neta de escolarización

41

La tasa neta de escolarización (TNE) se calcula

como el número total de alumnos de edad

oficial para el nivel, matriculados en un

determinado nivel de enseñanza, expresado en

porcentaje de la población del grupo en edad

oficial de cursar ese nivel (3 a 5 o 4 a 5 años para

educación inicial, 6 a 11 años para educación

primaria, 12 a 17 años para educación media

general, 12 a 14 años para ciclo básico de

educación media, 15 a 17 años para segundo

ciclo de educación media y 18 a 24 años para educación terciaria).

Page 42: ornadas de introducción a la investigación estadística

DISTRIBUCIONES MULTIVARIADAS

En la mayoría de los estudios estadísticos no alcanza con estudiar la distribución de una variables, sino que es necesario su vinculación con otras, por ejemplo, involucrando variables demográficas (edad y sexo principalmente), variables económicas o variables temporales.

Estas vinculaciones dan mayor riqueza al análisis y a la comprensión del fenómeno que se está estudiando.

Como ejemplo, se verán cuadros y gráficas que involucren más de una variable.

No es conveniente usar más de tres variables en un cuadro y siempre que, al menos una de ellas, tenga pocas categorías. De lo contrario, se tendrán cuadros inmanejables por su tamaño.

42

Page 43: ornadas de introducción a la investigación estadística

Cuadros con dos variables:

valores absolutos

Distribución de alumnos de 1° Bachillerato por

sexo según grupo (año 2011 Liceo Miranda)

43

Grupo Sexo

Total Femenino Masculino

Total 312 180 132

1 32 20 12

2 35 20 15

3 35 23 12

4 36 17 19

5 34 19 15

6 35 23 12

7 35 19 16

8 36 19 17

9 34 20 14

Page 44: ornadas de introducción a la investigación estadística

Cuadros con dos variables:

valores relativos

En estos casos se pueden presentar tres tipos de tablas, dependiendo de cuál es la referencia considerada: Porcentajes de columnas (en el caso anterior, el total es

la cantidad de casos femeninos y se consideran porcentajes de cada grupo, lo mismo para el total masculino y el general).

Porcentajes de filas (el total es el número de alumnos de cada grupo y se calculan los porcentajes de casos femeninos y masculinos)

Porcentajes de tabla (el total es el número total de alumnos y se calculan los porcentajes de cada una de las casillas, o sea, qué porcentaje del total de alumnos son chicas de 4°1, etc.)

44

Page 45: ornadas de introducción a la investigación estadística

Cuadro con tres variables:

valores absolutos

45

Total Aprobado Por examen Pendiente Repite o recursa

Total 54 37 7 7 3

Femenino 37 26 5 4 2

Masculino 17 11 2 3 1

Total 6 6 0 0 0

Femenino 6 6 0 0 0

Masculino 0 0 0 0 0

Total 37 27 7 3 0

Femenino 22 16 5 1 0

Masculino 15 11 2 2 0

Total 6 2 0 2 2

Femenino 5 2 0 2 1

Masculino 1 0 0 0 1

Total 5 2 0 2 1

Femenino 4 2 0 1 1

Masculino 1 0 0 1 0

Total

15

16

17

18 y más

Resultado de Matemática (2011)Edad Sexo

Page 46: ornadas de introducción a la investigación estadística

Gráficas con dos variables

46

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Total 1 2 3 4 5 6 7 8 9

Sexo Femenino Sexo Masculino

Distribución de alumnos por sexo según grupo (Primer año

bachillerato, Liceo Miranda, año 2011)

Page 47: ornadas de introducción a la investigación estadística

Gráficas con dos variables

47

0

20

40

60

80

100

120

140

160

180

200

Total Promovido Fallo en suspenso Repite

Fallo reunión final de profesores

Femenino

Masculino

Distribución de alumnos por sexo, según fallo reunión final

de profesores (Primer año bachillerato, Liceo Miranda, año

2011)

Page 48: ornadas de introducción a la investigación estadística

Gráficas con dos variables:

usos de escala En el siguiente ejemplo se observará como el

cambio de escala en los ejes de la gráfica

influye en la interpretación de la observación.

Valor nominal mensual de la hora docente (efectivos e interinos

titulados, tiempo extendido, segundo ciclo) según grado.

48

Grado Salario Nominal

Diferencia porcentual

1 704 -

2 739 4,97

3 773 4,60

4 815 5,43

5 868 6,50

6 925 6,57

7 987 6,70

Page 49: ornadas de introducción a la investigación estadística

Gráficas con dos variables:

usos de escala

49

0

100

200

300

400

500

600

700

800

900

1000

1 2 3 4 5 6 7

Salario nominal por hora, según grado

Page 50: ornadas de introducción a la investigación estadística

Gráficas con dos variables:

usos de escala

50

650

700

750

800

850

900

950

1000

1 2 3 4 5 6 7

Salario nominal por hora, según grado

Page 51: ornadas de introducción a la investigación estadística

Propuestas finales

Se propone que el conjunto de los

docentes decidan un tema a investigar

durante el año lectivo, de manera que sus

conclusiones sean de utilidad a la

comunidad educativa.

Este tema puede involucrar solo uno de los

niveles, ser general para el liceo o incluso,

involucrar los liceos de donde provienen la

mayoría de nuestros alumnos.

51

Page 52: ornadas de introducción a la investigación estadística

52

MUCHAS GRACIAS POR SU

ATENCIÓN.

ESPERO QUE ESTAS JORNADAS

HAYAS SIDO DE INTERÉS PARA

TODOS Y PUEDAN SER DE

UTILIDAD PARA MEJORAR LOS

PROCESOS EDUCATIVOS.