04 Validación y Confiabilidad de Instrumentos de Evaluación

56
Unidad II: La evaluación del Unidad II: La evaluación del aprendizaje aprendizaje Comunidad Educativa Tomás Moro Dos Impartido por: Luis Medina Gual Asesor Pedagógico Docente CCH Asesor Pedagógico Docente CCH

description

Presentación sobre la validez y confiabilidad de exámenes.

Transcript of 04 Validación y Confiabilidad de Instrumentos de Evaluación

Page 1: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Unidad II: La evaluación del Unidad II: La evaluación del aprendizajeaprendizajeComunidad Educativa Tomás Moro DosImpartido por: Luis Medina GualAsesor Pedagógico Docente CCHAsesor Pedagógico Docente CCH

Page 2: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Temario (tentativo)Temario (tentativo)� Generalidades sobre educación.◦ Concepto de educación y pedagogía.◦ Historia y teoría pedagógica.◦ La didáctica general y diferencial.◦ El diseño instruccional.

Teórico

El diseño instruccional.� La evaluación.◦ La evaluación: constructo y tipología.◦ La medida.◦ Instrumentos de evaluación.◦ Validación de instrumentos.◦ Implicaciones de la evaluación.

Práctico

Page 3: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?� Dificultad.� Evaluación basada en la norma vs basada en criterio.en criterio.

Page 4: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?� Dificultad.� Evaluación basada en la norma vs basada en criterio.en criterio.

Page 5: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?:◦ Confiabilidad.◦ Validez.

Page 6: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?:◦ Confiabilidad: es consistente.◦ Validez: mide lo que debe medir.

Page 7: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Validez: mide lo que debe medir.◦ Validación por jueces.◦ Validación por análisis factorial.◦ Relaciones entre pruebas.◦ Relaciones entre pruebas.

Page 8: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Validez: mide lo que debe medir.◦ ¿Quién mejor que el maestro para decir que el examen mide lo que pretende medir?

Page 9: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad: si yo aplico el mismo examen bajo las mismas condiciones… ¿los alumnos obtendrán las mismas calificaciones?calificaciones?◦ Consistencia de puntajes a través del tiempo.

Page 10: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad:◦ Teoría clásica.◦ Teoría de Respuesta al Ítem (TRI).

Page 11: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad:◦ Teoría clásica: cómo se relacionan todos los ítems entre sí.◦ Teoría de Respuesta al Ítem (TRI).

Page 12: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad:◦ Teoría clásica: cómo se relacionan todos los ítems entre sí.� Split Half.� Correlación test-retest.� Alfa de Cronbach.

Page 13: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad:◦ Teoría clásica.◦ Teoría de Respuesta al Ítem (TRI): valora el comportamiento de cada ítem por separado.� Discriminación: un reactivo logre discernir entre quienes aprendieron y quienes no.

Resultado Competente No competente

Aprueba ☺ L (falsos positivos)

No aprueba L (falsos negativos) ☺

Page 14: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad: TRI sencillísimo…

Page 15: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Confiabilidad:◦ % de alumnos de GS que aciertan - % de alumnos en GI que aciertan.

27% % de sujetos que 27%

27%

Calificación

% de sujetos que aciertan, GS

% de sujetos que aciertan, GI

Discriminación

Page 16: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?� Dificultad.� Evaluación basada en la norma vs basada en criterio.en criterio.

Page 17: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Dificultad:◦ Se define como: (número de correctas / número máximo).◦ Es una “probabilidad de ejecución”.◦ Capacidad del estudiante: (número de correctas / número máximo).

Page 18: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Responder a reactivo es un proceso “estocástico”:◦ Estudiante 0.80 vs reactivo 0.60.◦ Estudiante 0.65 vs reactivo 0.20.◦ Estudiante 0.65 vs reactivo 0.20.

Page 19: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Cómo distribuir dificultades de reactivos?◦ Método Ebel.

Rel-Dif Fácil Medio Difícil

Esencial

Importante

Aceptable

Cuestionable

Page 20: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Cómo distribuir dificultades de reactivos?◦ Método distributivo.� 27% reactivos difíciles (0.39 ó menos).� 27% reactivos fáciles (0.61 ó más).� 46% reactivos medios (0.40-0.60).

Page 21: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Cómo distribuir dificultades de reactivos?◦ Método 20-80.

0.9

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Dificultad Instrumento

Recta 20-80

Page 22: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Cómo distribuir dificultades de reactivos?◦ Método 20-80.

0.9

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Dificultad Instrumento

Recta 20-80

Recta 25-85

Page 23: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� Actividad:◦ Analizar reactivos de mi examen: obtener dificultades y discriminaciones.◦ Graficar recta 20-80.◦ ¿Qué reactivos tengo más?: difíciles, fáciles, medios, etc…◦ ¿Cuáles reactivos discriminan y cuáles no? ¿Qué características tienen en común los que sí y los que no discriminan?

Page 24: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Validación de instrumentosValidación de instrumentos

� ¿Mi examen es “bueno”?� Dificultad.� Evaluación basada en la norma vs basada en criterio.en criterio.

Page 25: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación basada en criterio: distribución de los puntajes con base en un criteriopreestablecido.

� Evaluación basada en la norma: � Evaluación basada en la norma: distribución de la capacidad de ejecución de los estudiantes.

Page 26: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Fija un “criterio”, una “condición” para que el alumno obtenga un “nivel de logro”.◦ Ejemplo típico:� Respuesta al 60% de reactivos: “aprobado”.� Respuesta al 60% de reactivos: “aprobado”.� Respuesta a menos del 60%: “reprobado”.

◦ Aprobado o reprobado son “niveles de logro” fijados por el criterio 60% de respuestas.◦ El 60% es un “punto de corte”.◦ Modelo Vienés (no calificación, sólo acreditación).

Page 27: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ ¿Qué significa aprobado?� El alumno es capaz de… objetivos formulados.

◦ ¿Qué significa reprobado?¿Qué significa reprobado?� El alumno requiere mejorar su capacidad de… objetivos formulados.

Page 28: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ ¿Para qué establecer criterios?

Page 29: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ ¿Para qué establecer criterios?� Cuestión de control o acreditatoria.� Comparación entre distintos sujetos evaluados.� Establecimiento claro de la capacidad de ejecución del estudiante.

Page 30: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 31: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 32: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Definir cuántos niveles de logro se establecerán:� ¿Qué tanta información requiero?� A mayor cantidad o detalle de logro del estudiante requiero mayor número de niveles de logro.

� Reprobado vs aprobado (dos categorías).� Insuficiente vs elemental vs avanzado (tres categorías).

Page 33: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 34: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Elaborar la descripción guía:◦ Proporcionar marcos de referencia que permita identificar con mayor facilidad los conocimientos y habilidades de cada nivel.◦ Deben evitarse palabras ambiguas o con tecnicismos ◦ Deben evitarse palabras ambiguas o con tecnicismos o “negativos” para la población.

Etiquetas Origen

Básico, competente, avanzado National Assessment of EducationalProgress

Limitado, básico, competente, acelerado, avanzado

Pruebas de rendimiento del Estadode Ohio

Por debajo del básico, básico, medio y avanzado

Exámenes de Calidad y Logro Educativo (EXCALE)

Nivel 1, 2, 3 Proyecto PISA (2000), Lectura

Page 35: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 36: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Elaborar las descripciones guía:� Refleja de manera global el desempeño de los estudiantes.

� Deben marcar diferencias claras de nivel a nivel.� Deben marcar diferencias claras de nivel a nivel.

Etiqueta Descripción guía del nivel de logro

Elemental El sustentante es capaz de identificar procedimientos, hechos y conceptos y puede establecer relaciones básicas entre esos elementos.

Satisfactorio El sustentante es capaz de organizar su conocimiento (…) a partir de lo cual puede extraer inferencias o conclusiones.

Sobresaliente El sustentante es capaz de generalizar y aplicar los procedimientos y conceptos en distintos contextos.

Page 37: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 38: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Desarrollar la descripción de cada nivel de logro:� Deben ser sucesivamente más complejas.� Deben ser cualitativamente diferentes (no debe de ser sólo cambio en cantidad de capacidad de ejecución).

� Las descripciones deben ser positivas.� Deben referirse a comportamientos y habilidades no al conocimiento de un tema (a lo que pueden hacer con ellos).

Page 39: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Pasos para el establecimiento de criterios:a. Definir cuántos niveles de logro se

establecerán.b. Seleccionar los nombres o etiquetas de cada b. Seleccionar los nombres o etiquetas de cada

nivel.c. Elaborar la descripción guía.d. Desarrollar la descripción de cada nivel de

logro.e. Evaluación del proceso de establecimiento de

los niveles de logro.

Page 40: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Evaluación del proceso de establecimiento de niveles de logro:� ¿Los niveles de logro son representativos del contenido y permiten interpretar las puntuaciones contenido y permiten interpretar las puntuaciones de un modo adecuado por el examen?

� ¿El número de categorías fue el apropiado?� ¿Apoyan el proceso de toma de decisiones para la mejora del quehacer educativo?

� ¿Facilitan la comunicación efectiva de los resultados a las instituciones educativas, los alumnos y la sociedad en general?

Page 41: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Puntos de corte: versión numérica de las descripciones cualitativas de los niveles de logro.◦ Reflejan un estándar de desempeño.◦ Reflejan un estándar de desempeño.◦ Debe aplicarse de forma idéntica para toda la población.

Page 42: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Puntos de corte: método Medina (sencillo para exámenes en instituciones educativas; adecuación del método Angoff).� Establece 3 puntos de corte.Establece 3 puntos de corte.a. Enlistar reactivos y poner valor.b. Asignar probabilidad de respuesta.c. Docente asigna probabilidad de respuesta correcta.d. Ordenar de más a menos probabilidad.e. Obtención de media de probabilidades.f. Obtención de desviación estándar.g. -1 desv. Estándar, media, desv. Estándar.

Page 43: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Puntos de corte:

Page 44: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación criterial:◦ Puntos de corte:

Page 45: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación normativa:◦ A partir de la capacidad de los estudiantes yo los evalúo.◦ Evaluación por “campana”.◦ Evaluación por normalización de puntajes.

Page 46: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación normativa:◦ Evaluación por “campana”:� El de mayor puntaje= 10.� Veo cuál es el total de respuestas correctas y a ese máximo lo convierto a 100%.máximo lo convierto a 100%.

� Examen de 45 reactivos; Juan es el más alto y contestó 39. En lugar de 45=100%, 39=100%.

Page 47: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación normativa:◦ Evaluación por normalización de puntajes:� “Depende de la distribución”.� Obtengo promedio.� Obtengo desviación estándar.� Obtengo desviación estándar.� Fijo cuánto representa mi promedio (generalmente 8).� Fijo cuánta distancia representa mi desviación estándar (generalmente 1 punto).

� Obtener puntuaciones Z de los estudiantes: Z=(x-media)/s.

� Asigno puntuaciones cambiando media y desviación por las establecidas y convirtiendo por: x=(Zs+media).

Page 48: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Evaluación basada en la norma vs Evaluación basada en la norma vs basada en criterio.basada en criterio.� Evaluación normativa:◦ Evaluación por normalización de puntajes:

Page 49: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Temario (tentativo)Temario (tentativo)� Generalidades sobre educación.◦ Concepto de educación y pedagogía.◦ Historia y teoría pedagógica.◦ La didáctica general y diferencial.◦ El diseño instruccional.

Teórico

El diseño instruccional.� La evaluación.◦ La evaluación: constructo y tipología.◦ La medida.◦ Instrumentos de evaluación.◦ Validación de instrumentos.◦ Implicaciones de la evaluación.

Práctico

Page 50: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� ¿Para qué tanto evaluar?� ¿Para qué desgastarnos?� ¿A quién le sirve la evaluación?

Page 51: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Alumno:◦ Retroalimenta sobre desempeño.◦ ¿Qué estrategias de estudio usó para cada materia?◦ Valora interés y capacidad del estudiante.◦ ¿Qué tipo de contenidos se le dificultan?◦ ¿Para qué sirve aprender?: para seguir aprendiendo. Implicaciones como “meta-aprendizaje”.

Page 52: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Docente:◦ Retroalimenta sobre su función docente.◦ ¿Cuál es el fin del maestro? Volverse inútil para su alumnos.◦ ¿En qué temas aprendieron? ¿En qué temas parecen no haber aprendido? ¿Qué estrategias empleé? ¿Qué tiempo le di?◦ ¿Qué tema fue el más fácil/difícil para los estudiantes?◦ ¿Hubo algún nivel taxonómico muy difícil/fácil?

Page 53: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Docente:◦ Relación dificultad y profundidad.

Dificultad

Profundidad

Page 54: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Docente:◦ Relación dificultad y nivel taxonómico.

Dificultad

Nivel taxonómico

Page 55: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Docente:◦ Ejemplo:� Historia de México.

Unidad Objetivo Nivel Dificultad Profundidad Modificación Modificación Unidad Objetivo Nivel taxonómico

Dificultad Profundidad (% del bimestre)

Modificación taxonomía

Modificación profundidad

Unidad 1 Identificar elementos deorigen de la independencia mexicana

1 memoria (cognitivo)

0.7 (la mayoría contestó bien)

20% 4 análisis 25%

Unidad 2 Analizar los hechos que permitieron la consumación de la independencia

4 análisis (cognitivo)

0.3 (la minoría contestó)

10% 2 comprensión

15%

Page 56: 04 Validación y Confiabilidad de Instrumentos de Evaluación

Implicaciones de la evaluaciónImplicaciones de la evaluación

� Sociedad:◦ Acreditación y reconocimiento de los estudiantes: medida de control.◦ Evaluación estandarizada: contraste entre métodos educativos, currícula, alineación a métodos educativos, currícula, alineación a fines del sistema.