psicometra-100509194052-phpapp01-140328152815-phpapp01

88
PSICOMETRÍA PSICOMETRÍA Diseñado por: Diseñado por: Germán Andrés Torres Germán Andrés Torres Escobar Escobar

Transcript of psicometra-100509194052-phpapp01-140328152815-phpapp01

  • PSICOMETRADiseado por: Germn Andrs Torres Escobar

  • Hitos en la historia de la psicometra

    AOHITO O ACONTECIMIENTO1115 a.C.En China se utilizan tests para acceder a puestos en el gobierno.1869 d C.Francis Galton publica el libro Genio Hereditario (1869) donde plantea a travs de estudios estadsticos que la inteligencia se hereda. 1904 1910 d. C.Charles Spearman funda la Teora Clsica de los tests o del modelo lineal y publica su teora de los factores de la inteligencia y las formulas de atenuacin. 1905 d.C.Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios, con el fin de establecer su edad mental y predecir su rendimiento acadmico. 1918 d.C.Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados durante la Primera Guerra Mundial y Robert Woodworth elabor el primer Personal Data Sheet para detectar los soldados que pudieran tener crisis nerviosas. 1931 d.C.Thurstone publica su libro The reliability and validity of tests.1939 d.C.Wechsler propone su escala de medida para la inteligencia. 1940 d.C.Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality Inventory (MMPI).1960 d.C.Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de varianza para interpretar las fuentes de error en los puntajes. 1980 d.C.Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite conocer la informacin de cada tem para disear pruebas individualizadas.

  • La psicometraEs la rama de la psicologa que desarrolla y estudia las propiedades de las pruebas psicolgicas o tests para medir las variables psicolgicas con la mayor precisin posible.

  • Diferencia entre psicometra y evaluacin psicolgicaPsicometraEvaluacin psicolgicanfasis en la medicin nfasis en el diagnsticoInstrumentos y tests La persona

  • Historia de la psicometra

    Antecedentes histricos.

    Modelos de medicin.

  • Antecedentes histricos Hacia el ao 1115 a.C. se utilizan comienzan a utilizar en China los primeros tests que buscan medir las capacidades de aspirantes para acceder a puestos del gobierno (primera medicin de capacidades).

    En 1869 Francis Galton publica el libro Genio Hereditario donde plantea a travs de estudios estadsticos que la inteligencia se hereda y que es posible medirla (estudios estadsticos en psicologa).

  • Entre 1904 y 1910 Charles Spearman funda la Teora Clsica de los tests o del modelo lineal y publica su teora de los factores de la inteligencia y las formulas de atenuacin (Estrategias de medicin y TCT).

    En 1905 Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para nios, con el fin de establecer su edad mental y predecir su rendimiento acadmico (uno de los primeros tests psicolgicos).

  • En 1960 Lee Cronbach propone su Teora de la Generalizacin en la cual utiliza el anlisis de varianza para interpretar las fuentes de error en los puntajes. Igualmente l desarroll estrategias para la medicin de la confiabilidad de un test.

    En 1980 Rasch plantea la Teora de la Respuesta al tem o del rasgo latente que permite conocer la informacin de cada tem para disear pruebas individualizadas.

  • Modelos de medicin Teora Clsica de los Tests (TCT)Teora de la Respuesta al tem (TRI)Anlisis de la prueba completa Anlisis de tems individualesEn una muestra pequea de sujetos (N < 500) En grandes muestras de sujetos (N 500)

  • Teora clsica de los TestsEl modelo de puntuacin verdadera se concreta en un primer supuesto: X = V + E que indica que la puntuacin emprica directa de una persona en un test (X) est compuesta por la puntuacin verdadera de la persona (V) y un error de medida (E) que se comete al medir el rasgo con el test.

    El error de medida se establece como la diferencia entre la puntuacin emprica y la verdadera: E = X - V

  • La puntuacin verdadera se obtiene con el promedio de las puntuaciones empricas que obtiene la persona en un nmero elevado de aplicaciones del test: V = E[X]

    Si en una poblacin se conocen las puntuaciones V y E de los individuos, la correlacin entre ambas variables sera nula, porque se asume que puntuaciones verdaderas elevadas no tienen porqu tener asociados errores elevados: r VE = 0

  • Si en una poblacin conociramos los errores de medida de cada individuo quien ha realizado dos tests diferentes (j y k), la correlacin entre ambas variables tambin sera nula:E jEk = 0

    Si en una poblacin conociramos las puntuaciones E en un test j y las puntuaciones V en un test k, ambas variables correlacionaran cero: E jVk = 0

  • Limitaciones de la Teora Clsica Las caractersticas de los tems (dificultad y discriminacin) dependen del grupo de personas en el que se han aplicado.

    La puntuacin que una persona obtenga ser diferente si se le aplican dos tests que midan la misma caracterstica pero cuyo nivel de dificultad sea diferente.

    La TCT supone que el error de medida es una propiedad del test y, por lo tanto, igual para todos los sujetos, independientemente de cual sea su puntuacin.

  • Teora de la Respuesta al tem Unidimensionalidad: todos los tems que forman el test han de medir un mismo y nico rasgo. El supuesto de unidimensionalidad exige que todos y cada uno de los tems del test midan una nica dimensin.

    No hay como tal puntuaciones verdaderas sino una probabilidad de acierto determinada por unos parmetros.

    Independencia local: entre los tems de un test si la respuesta que una persona da a uno de ellos no depende de las respuestas que da a los otros, ni por el orden de presentacin de los tems, las respuestas que ya se hayan dado, etc.

  • Un prueba psicolgica o testEs un instrumento en formato impreso o digital que consta de una serie de preguntas o reactivos que miden unas variables psicolgicas especificas a travs de un sistema de puntuacin.

    Puede aplicarse en diferentes campos de la psicologa, para fines diversos como diagnstico clnico (psicologa clnica) , seleccin de personal (psicologa organizacional) o anlisis de aptitudes vocacionales (psicologa educativa).

  • Estructura general de un test impresoCuadernillo de instrucciones.

    Cuadernillo de preguntas.

    Hoja(s) de respuestas.

    Plantilla de correccin.

    Tabla de puntuaciones y baremos.

  • El cuadernillo de instruccionesEs un documento donde se menciona:El nombre de la prueba, sus autores y el ao de publicacin.La(s) variable(s) que mide y sus objetivos. Los antecedentes (marco conceptual y terico) de la prueba. Las instrucciones generales de aplicacin (para los psiclogos).

  • El cuadernillo de preguntas Es un documento que consta de:Las instrucciones de respuesta (para quien la va a responder). Los tems o preguntas.

    No puede rayarse ni se puede escribir sobre este ya que se usa en diferentes aplicaciones.

  • La hoja de respuestas y plantilla de correccinEs la hoja donde la persona anota las respuestas a de los tems planteados en el cuadernillo de preguntas.

    Una vez que la persona entrega la hoja de respuestas al psiclogo, l o ella la califican poniendo encima de la hoja de respuestas, la plantilla de correccin para ver en cuales acert el sujeto y en cuales no.

  • El sistema de puntuacin

  • La tabla de puntuaciones y baremosUna vez que se han obtenido los aciertos y errores de la persona con ayuda de la plantilla, se obtiene una puntuacin cruda o bruta, que es especifica para ese sujeto.

    Esa puntuacin bruta se analiza en la tabla de puntuaciones estndar, para obtener una puntuacin estndar o tpica del sujeto dentro de la poblacin o muestra de sujetos que present la prueba (baremo).

  • Los baremos Son tablas de puntuaciones estndar que se clasifican por grupos poblacionales o muestrales segn la edad, profesin o gnero.

    Por ejemplo, para una misma prueba existen baremos para hombres, mujeres, hombres profesionales, mujeres profesionales, estudiantes de secundaria, etc.

  • Tipos de pruebas o tests

  • Clasificacin de las pruebas por aplicacin Pruebas de autoaplicacin: son tests que no requieren la aplicacin por parte de un psiclogo sino que puede hacerlas la persona con ayuda de un computador.

    Pruebas de aplicacin individual: son aquellas que el psiclogo administra a una sola persona. Por ejemplo, en un caso clnico.

    Pruebas de aplicacin grupal: son aquellas que el psiclogo pueden aplicar a varias personas al mismo tiempo, pero controlando que no conversen entre ellas. Por ejemplo, una prueba de aptitudes e intereses vocacionales.

  • Clasificacin de las pruebas segn la forma de medir la(s) variable(s) Pruebas de desempeo: miden el rendimiento mximo (individual) o el rendimiento normal o tpico (de un grupo).

    Pruebas de poder: miden el nivel de destreza mental de un sujeto o su nivel de conocimiento.

    Pruebas de velocidad: miden cuantos tems responde el sujeto en un tiempo especifico.

    Pruebas con referencia a la norma o al criterio: mide la variables psicolgica segn objetivos especficos.

  • Clasificacin de las pruebas segn las variables que midenPruebas de capacidad mental (inteligencia).

    Pruebas de aprovechamiento o conocimiento.

    Pruebas de personalidad.

    Pruebas de actitudes, aptitudes, intereses, motivacin, opinin y valores.

    Pruebas neuropsicolgicas.

  • Estructura general de un temEnunciado: menciona las instrucciones para contestar el tem y plantea un contexto o situacin a partir del cual se hace la pregunta. Pregunta(s): son cuestionamientos que evalan directamente la variable psicolgica de forma implcita. Pueden ser abiertas (libre respuesta) o cerradas (opciones especificas).

    Opciones de respuesta: incluyen una(s) respuestas(s) correcta(s) y un(os) distractor(es) o respuesta(s) falsa(s).

  • Clasificacin del formato de respuestas

  • Clasificacin de las respuestas en tests de rendimiento ptimoEleccin binaria: de dos alternativas, se elige la que se considera correcta (S o No) o (verdadero-falso).

    Eleccin mltiple: entre ms de dos alternativas se elige la que se considera correcta.

    Emparejamiento: consiste en encontrar las parejas entre dos conjuntos de conceptos.

  • Clasificacin de las respuestas en tests de rendimiento tpicoOpcin binaria: la persona debe manifestar si est de acuerdo o en desacuerdo con una afirmacin.

    Categoras ordenadas: el formato establece un continuo ordinal de ms de dos categoras, que permite a la persona matizar mejor su respuesta.

    Adjetivos bipolares: este formato es tpico de lo que se denomina "diferencial semntico".

  • ConfiabilidadEs el grado en el cual las mediciones repetidas de un fenmeno relativamente estable son aproximadas entre s o consistentes.

    Permite predecir el desempeo de un grupo o de un sujeto e igualmente sirve para describirlo en ambos casos.

  • Formas de medir la confiabilidadTest-retest: consiste en aplicar un test dos veces a un mismo grupo en un intervalo de das o meses (no superior).

    Formas paralelas: consiste en aplicar un test homologo o equivalente a un mismo grupo pero en tiempos diferentes.

    Divisin por mitades: consiste en comparar los resultados de los tems pares e impares en la aplicacin grupal de un test.

  • Coeficientes de confiabilidadTest-retest: coeficiente de estabilidad (r).

    Formas paralelas: coeficiente de equivalencia (r).

    Divisin por mitades: coeficiente de consistencia interna (r).

  • Coeficientes ms usados en divisin por mitades

  • Formas de mejorar la confiabilidad de un testPara calcular el nmero de tems K para lograr una confiabilidad RXY deseada (superior a 0.7) se usa la formula: K = RXY * (1 rXY) / rXY) * (1 RXY) donde rX es la confiabilidad inicial. Una vez obtenido el nmero K se multiplica por el nmero de items inicial y luego se le resta a ese resultado el nmero de tems inicial.

  • Para calcular la confiabilidad al quitar un nmero de tems X con un total de tems Y y con una confiabilidad conocida C se usa la siguiente formula: Y X / Y El resultado obtenido con esta formula debe operarse con la formula 2: [resultado 1 * C] [1 + (resultado 1 1) * C]

  • VALIDEZEs el grado en el cual una prueba mide lo que pretende medir.

    Conjunto de pruebas y datos que han de recogerse para garantizar la pertinencia predictiva de las inferencias que hacen a partir de un test.

  • Tipos de validezValidez del contenido.

    Validez con relacin a criterio.

    Validez del constructo.

  • VALIDEZ DEL CONTENIDOEs la muestra adecuada y representativa de los contenidos que se pretende evaluar con un test.

    Los tems o preguntas se seleccionan segn su:Coherencia: con las caractersticas y variables.Relevancia: de acuerdo con el indicador.Buena redaccin: la gramtica del tem. Validez aparente: para el evaluado.

  • VALIDEZ CON RELACIN AL CRITERIOEs la comparacin del desempeo de un grupo de sujetos en un test respecto patrones de medida ya establecidos.

    Se clasifica en:Validez concurrente.Validez predictiva.

  • Validez concurrenteEs el anlisis de variabilidad que efecta al comparar el desempeo de dos grupos de distintos de sujetos en un mismo test.

    Tambin se le denomina validez cruzada o entre distintas muestras.

  • Validez predictivaEs el grado de precisin con que las calificaciones de la prueba predicen las calificaciones del criterio.

    Se obtiene mediante la correlacin entre una variable de indicador y una variable criterio a partir de r (Pearson), cuyo valor es igual o menor a 0,60.

  • Factores que afectan la validez con relacin a los criteriosLas diferencias de grupo: sexo, edad y rasgos de personalidad.

    La contaminacin de los criterios: evidencias falsas que les restan validez.

    El ndice de base (debe ser mayor de 50): nmero de personas que poseen la variable medida.

    El incremento de la validez: costo razonable del instrumento.

  • VALIDEZ DEL CONSTRUCTOEs el grado de exactitud con el que se mide un constructo o concepto psicolgico particular.

    Depende de unas condiciones que son externas al evaluador y la persona que disea la prueba.

  • Condiciones de la validez del constructoValoracin por parte de jueces expertos de la correspondencia contenido-concepto.

    Anlisis de la consistencia interna de la prueba.

    Estudio de las variables intervinientes en la calificacin.

  • Anlisis factorial y correlacin con otras pruebas.

    Anlisis de las respuestas.

    Correlaciones altas con otras medidas o mtodos para medir el mismo constructo (Validez convergente).

    Correlaciones bajas con las medidas de constructos diferentes (Validez discriminante).

  • CONSTRUCCIN DE LOS TEMS

  • La Taxonoma de BloomEl dominio cognoscitivo comprende 6 categoras:RecuerdoComprensinAplicacinAnlisisSntesisEvaluacin

  • La Taxonoma de BloomRecuerdo:Incluye situaciones de examen que acentan la importancia del recuerdo de datos, ideas, materiales o fenmenos, ya sea como reconocimiento o evocacin. Supone, el recuerdo o reconocimiento de: Datos especficos como terminologas o hechos; modos y medios para el tratamiento de datos especficos como convenciones, clasificaciones, metodologas, tcnicas o procedimientos y, universales y abstracciones en un campo determinado como principios, generalizaciones, teoras y estructuras (Herrera, 2003).

  • La Taxonoma de BloomEjemplo 1: Pregunta que evala Recuerdo

    A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) o cinco (5) opciones de respuesta. Usted debe marcar en su hoja de respuesta, aquella opcin que considere correcta.

    El modelo de control social propuesto por Max Weber para las organizaciones, se denomina modelo:A.- de los sistemasB.- burocrticoC.- estructuralistaD.- de las organizaciones

  • La Taxonoma de BloomComprensin:Implica la inteleccin y fraccionamiento de un mensaje. Operacionalmente se define como cualquier conducta que vaya desde la presentacin de una proposicin con palabras distintas de las del enunciado original, hasta la aplicacin de un principio en una situacin nueva para el examinado, pasando por la ejemplificacin. Se define en trminos de tres operaciones: a) Traduccin o capacidad para expresar un concepto o mensaje conocido en palabras diferentes o pasarlo de un sistema simblico a otro, b) Interpretacin o reordenamiento de ideas de una comunicacin en una nueva configuracin. Incluye la habilidad para captar el contenido de una comunicacin como un todo y distinguir entre conclusiones legtimas y contradictorias y c) Extrapolacin o hacer explcitas algunas conclusiones, colorarios, consecuencias o efectos de una comunicacin dada (Herrera, 2003).

  • La Taxonoma de BloomEjemplo 2: Pregunta que evala ComprensinSi un psiclogo afirma que una prueba que ha preparado para seleccin de personal tiene un coeficiente de validez predictiva mas alto que el de fiabilidad, concluira que

    A.est bien, por cuanto lo mas importante para la seleccin es la validez de prediccinB.debera tener mas alta fiabilidad que validez ya que lo principal es la confianza en el instrumentoC.debe tener un error ya que la validez predictiva NO puede ser mayor al coeficiente de fiabilidadD.debe tener un error ya que los dos coeficientes, el de validez y el de fiabilidad deben tener igual valorE.no debera utilizar la prueba ya que debe tener mas alta fiabilidad que validez para el objeto propuesto

  • La Taxonoma de BloomAplicacin:Se refiere a la capacidad para aplicar teoras, principios, mtodos o ideas en la solucin de un problema prctico. Es la habilidad para aplicar principios y generalizaciones a nuevos problemas y situaciones. Comprende entonces tareas como a) identificar los principios o generalizaciones apropiados para resolver un problema o reformularlo para lograr tal identificacin, b) especificar los lmites dentro de los cuales un principio o generalizacin es verdadero o relevante y reconocer las excepciones a los mismos y las razones para ello, c) explicar nuevos fenmenos a partir de principios o generalizaciones conocidas, predecir lo que suceder en una situacin nueva mediante el uso de principios y generalizaciones apropiadas, y d) determinar o justificar una decisin o accin en una situacin usando principios o generalizaciones e indicar el razonamiento que apoya la utilizacin de los mismos ante un determinado problema (Herrera 2003).

  • La Taxonoma de BloomEjemplo 3: Pregunta que evala Aplicacin

    Escoja la caracterstica del pensamiento infantil que mejor se ajusta a la conducta descrita por Piaget:- Cmo se hace para tener madera? Se cortan los troncos de los rboles. - Qu se hace para tener rboles? Se siembran los granos. - Y los granos? Se compran. - Dnde? En los almacenes. - Y el dueo del almacn? Pinsalo un poco. Los hace. - Con qu? Con otros granos. - Cuando vinieron los primeros hombres, haba ya rboles? No. - Cmo han comenzado? Por los granos. - De dnde venan estos granos? Del almacn.

    A.RealismoB.Animismo C.ArtificialismoD.SincretismoE.Funcionalismo

  • La Taxonoma de BloomAnlisis:Hace referencia a la habilidad para fraccionar una comunicacin en sus elementos, de manera que aparezcan explcitas la jerarqua de las ideas y las relaciones existentes entre ellas. Esta es un proceso complejo que implica las tres categoras anteriores; recuerdo, comprensin y aplicacin, pero va mas all de ellas. Aqu se incluyen tres subcategoras: a) anlisis de elementos o habilidad para fraccionar una informacin en sus elementos, como supuestos no explcitos, hechos e hiptesis; b) anlisis de relaciones o identificar la relaciones que existen entre los elementos de una comunicacin; inferir los criterios, relaciones, cualidades, suposiciones o condiciones implcitas en una comunicacin; o bien, determinar las relaciones entre las hiptesis y las pruebas que la apoyan, entre las conclusiones y las hiptesis, o entre las conclusiones y las evidencias; y c) anlisis de principios de organizacin que es la habilidad para explicitar los principios organizadores que ha seguido un autor, reducir su propsito, su punto de vista, su actitud o su interpretacin (Herrera 2003).

  • La Taxonoma de BloomEjemplo 4: Pregunta que evala AnlisisConsidere los resultados del siguiente estudio:En una investigacin sobre heredabilidad de rasgos psicosociales, en este caso la criminalidad, se conformaron tres grupos de sujetos as: el grupo A por parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y el grupo C por parejas de hermanos naturales. En ningn caso los hermanos fueron separados. Una vez aplicados los instrumentos de medida (cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de acuerdo en relacin con la presencia de conductas criminales:GRUPOS A BC% DE ACUERDO77358Escoja la interpretacin que mejor se ajuste a los datos de la investigacin A.A mayor concordancia gentica corresponde un mayor porcentaje de acuerdoB.La criminalidad depende del medio ambiente en un 23%.C.El bajo porcentaje registrado por el grupo C se debe a que es el grupo con el menor nivel de homogeneidad genticaD.No se puede concluir en favor de la heredabilidad de las conductas criminales.

  • La Taxonoma de BloomSntesis:Es la capacidad para reunir diferentes elementos o partes para formar un todo. Esto es, la habilidad para combinar elementos con el fin de constituir una estructura o esquema que no estaba presente con claridad. La capacidad de sntesis incluye: a) produccin de una comunicacin nica, b) produccin de un plan o conjunto de operaciones con un fin determinado y c) derivacin de un conjunto de relaciones abstractas, explicaciones o hiptesis para dar cuenta de un fenmeno dado. Es difcil construir preguntas estructuradas que evalen esta categora, son mucho ms frecuentes las preguntas abiertas de tipo ensayo (Herrera 2003).

  • La Taxonoma de BloomEvaluacin:Es la capacidad para emitir juicios sobre ideas, obras, mtodos, materiales o soluciones, con algn propsito determinado. Esta categora incluye formulacin de juicios: a) con base en pautas internas como exactitud, precisin y cuidado con que ha sido elaborada una comunicacin dada; consistencia de los razonamientos, relaciones entre supuestos, evidencias y conclusiones y reconocimiento de los valores y puntos de vista utilizados en un juicio particular sobre una obra b) en trminos de criterios externos como comparacin de un trabajo u obra con otros, utilizando criterios o normas explcitas. Al igual que en la categora anterior, es difcil construir preguntas estructuradas que evalen esta categora, son ms apropiadas las preguntas abiertas de tipo ensayo (Herrera 2003).

  • Tipos de Preguntas

    NOMBREELEMENTOSCARACTERISTICASEleccin mltiple con nica respuestaUn enunciado y cuatro o cinco opciones de respuestaSlo una de las opciones completa correctamente el enunciado. Puede utilizarse para evaluar cualquier objetivo educativo especialmente recuerdo, comprensin y aplicacin.Eleccin mltiple con mltiple respuestaUn enunciado y cuatro (4) opciones de respuestaUna, dos, tres o todas las opciones de respuesta pueden completar correctamente el enunciado, el examinado debe elegir una combinacin de ellas. Adecuado para evaluar cualquier objetivo educativo.Informacin suficienteUn problema y dos informaciones relacionadas con el mismoUna o las dos informaciones pueden ser necesarias y suficientes para resolver el problema o pueden ser necesarias pero no suficientes. El evaluado no debe resolver el problema, slo evaluar la informacin disponible. Excelente para evaluar aplicacin.Anlisis de postuladosUna afirmacin y dos postuladosTanto la afirmacin como los postulados son VERDADEROS. El examinado evala la relacin lgica entre ellos. Excelente para evaluar anlisis.Anlisis de relacionesDos afirmaciones separadas por la palabra PORQUETanto la afirmacin como la razn pueden ser VERDADERAS o FALSAS. El examinado evala tanto su valor de verdad como la relacin lgica entre ellas. Excelente para evaluar anlisis.

  • Eleccin Mltiple con nica RespuestaEs el tipo de pregunta ms conocido y usado en las pruebas objetivas. Estn conformadas por un enunciado y cuatro (4) o cinco (5) opciones de respuesta. El enunciado puede contener una frase incompleta, una interrogacin, un texto o una grfica; las opciones de respuesta aparecen identificadas con las letras A, B, C, D y E. Una sola de las opciones completa o responde correctamente el enunciado. Este tipo de pregunta es til para evaluar cualquiera de las cuatro primeras categoras de la taxonoma de Bloom. Los ejemplos 1 a 4 son preguntas de eleccin mltiple con nica respuesta.

  • Eleccin Mltiple con nica RespuestaAdems de las consideraciones generales sobre construccin de preguntas, en este tipo de tems es altamente recomendable evitar expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES. Si ms de una opcin es correcta probablemente la pregunta quede mejor formulada con el formato de eleccin mltiple con mltiple respuesta.

  • Eleccin Mltiple con Mltiple RespuestaEste tipo de pregunta consta de un enunciado y cuatro (4) opciones de respuesta identificadas con los nmeros 1, 2, 3 y 4. Una o varias opciones de estas pueden completar correctamente el enunciado. Este tipo de pregunta es til para evaluar cualquiera de las categoras de objetivos educativos. Sin embargo, se usa frecuentemente para evaluar comprensin y aplicacin utilizando: a) una situacin en la que es necesario considerar varias consecuencias posibles, b) una situacin en la que es necesario especificar una o ms condiciones para definirla adecuadamente, c) dos situaciones semejantes o dismiles con respecto a uno o ms puntos de comparacin, d) un principio que puede aplicarse a ms de una situacin o e) varias consideraciones que pueden conducir al mismo resultado.

  • Eleccin Mltiple con Mltiple RespuestaLas instrucciones que se dan al examinado son, generalmente de la siguiente forma:

    "A continuacin encontrar preguntas que constan de un enunciado y cuatro (4) opciones de respuesta. Una o varias opciones pueden completar correctamente el enunciado. Usted debe marcar su hoja de respuestas segn el cuadro siguiente:

    Marque Asi las opciones 1, 2 y 3 son correctasMarque Bsi las opciones 1 y 3 son correctasMarque Csi las opciones 2 y 4 son correctasMarque Dsi slo la opcin 4 es correctaMarque Esi todas las opciones son correctas

  • Eleccin Mltiple con Mltiple RespuestaEste tipo de pregunta no debe incluir distractores mutuamente excluyentes por cuanto estaran anulando una o varias opciones de respuesta; tampoco debe incluir en las opciones de respuesta expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES.

  • Eleccin Mltiple con Mltiple RespuestaEjemplo:La investigacin emprica ha encontrado que:

    1.Las personas toman menos tiempo en el aprendizaje de un concepto cuando hay muchos atributos irrelevantes2.En el aprendizaje de un concepto son mejores los ejemplos negativos que los positivos3.En el aprendizaje de un concepto la velocidad de aprendizaje es una funcin directa del nmero de atributos4.Las personas toman ms tiempo en el aprendizaje de un concepto cuando hay muchos atributos relevantes

  • Informacin SuficienteEstas preguntas constan de un problema y dos informaciones identificadas con los nmeros I y II. No se requiere que el examinado resuelva el problema, sino que decida si las informaciones proporcionadas son necesarias y suficientes para resolverlo. Este tipo de pregunta es muy til para evaluar aplicacin.

  • Informacin SuficienteLas instrucciones son, generalmente, las siguientes: "Las preguntas que encontrar a continuacin constan de un problema y dos informaciones identificadas con los nmeros I y II. Usted debe decidir si las informaciones son necesarias y suficientes para solucionar el problema y marcar su hoja de respuestas segn el cuadro siguiente: ...

    Marque A s necesita y basta con las informaciones I y IIMarque B si necesita y basta con la informacin IMarque C si necesita y basta con la informacin IIMarque D si cualquiera de las dos informaciones sirveMarque E si no es suficiente con las dos informaciones

  • Informacin SuficienteAdems de las normas generales, para la construccin de este tipo de preguntas es necesario tener en cuenta: a) las informaciones NO deben ser contradictorias entre s o mutuamente excluyentes, b) en las preguntas de clave A, el problema debe poder solucionarse con las dos informaciones sin requerir de otra, c) en las preguntas de clave B, C o D, el problema planteado debe poder solucionarse con una sola informacin y d) en las preguntas de clave E las informaciones deben ser necesarias pero NO suficientes para resolver el problema.

  • Informacin SuficienteEjemplo 6: Pregunta de Informacin Suficiente

    Se quiere comparar el tiempo de reaccin ante un estmulo en dos poblaciones. Se toman muestran aleatorias de las poblaciones, se recogen los datos y se elige un estadstico de prueba. Para decidir si se acepta o rechaza una hiptesis de igualdad de medias con un nivel de significancia , se requiere conocer:I.la distribucin del estadstico de pruebaII.la probabilidad de obtener un valor mayor que el observado en el estadstico de prueba

  • Anlisis de PostuladosEste tipo de pregunta consta de una afirmacin y dos postulados identificados con los nmeros I y II. Entre la afirmacin y los postulados se encuentra la palabra POR CONSIGUIENTE. Para responder este tipo de pregunta el examinado no necesita evaluar el valor de verdad de las afirmaciones, todo se supone verdadero; solo debe analizar la relacin lgica existente entre afirmacin y postulados. Es un tipo de pregunta de difcil elaboracin y requiere de cuidadoso anlisis previo para que la respuesta sea inequvoca. Es muy adecuado para evaluar anlisis.

  • Anlisis de PostuladosLas instrucciones para responder este tipo de pregunta son, generalmente, como se muestra a continuacin

    "Las preguntas que encontrar a continuacin constan de una afirmacin VERDADERA y dos postulados tambin VERDADEROS identificados con los nmeros I y II. Usted debe decidir si los postulados se deducen lgicamente de la afirmacin y contestar segn el cuadro siguiente: ...

    Marque A s de la tesis se deducen los postulados I y IIMarque B si de la tesis solo se deduce el postulado IMarque C si de la tesis solo se deduce el postulado IIMarque D si ninguno de los postulados se deduce de la tesis

  • Anlisis de PostuladosEjemplo 7: Pregunta de Anlisis de PostuladosEs inimputable quien comete el delito bajo influencia determinante de un trastorno mentalPOR CONSIGUIENTEI.Un psictico puede ser inimputableII.Un inimputable comete un hecho tpico y antijurdico pero no culpable ni punible

  • Anlisis de PostuladosAdems de las normas generales, para la construccin de este tipo de preguntas es necesario tener en cuenta: a) aun cuando la instruccin le indica al examinado que debe suponer todo verdadero, es recomendable que las afirmaciones lo sean en efecto o, por lo menos que no sean absurdos u obviamente falsos, b) todas las afirmaciones deben ser gramaticalmente completas e independientes unas de otras, c) la construccin de la pregunta debe ser tal que la deduccin lgica sea indiscutible, de manera que la respuesta correcta sea inequvoca y d) este tipo de pregunta es til para poblaciones de alto nivel educativo.

  • Anlisis de RelacionesLas preguntas de este tipo presentan dos afirmaciones unidas por la palabra PORQUE y la segunda afirmacin se considera una RAZON verdadera o supuesta de la primera. El examinado debe evaluar tanto el valor de verdad de las afirmaciones como la relacin entre ellas. A diferencia de las preguntas de anlisis de postulados, en stas las afirmaciones pueden ser verdaderas o falsas. Este tipo de preguntas es particularmente til para evaluar anlisis y presenta menos dificultades prcticas que la pregunta de anlisis de postulados.

  • Anlisis de RelacionesLas preguntas que encontrar a continuacin constan de una afirmacin y una razn unidas por la palabra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relacin existente entre las mismas, y contestar en su hoja de respuestas segn el cuadro siguiente:

    Marque Asi ambas afirmaciones son verdadera y la segunda es una razn o explicacin correcta de la primeraMarque Bsi ambas afirmaciones son verdaderas pero la segunda NO es una razn o explicacin correcta de la primeraMarque Csi la primera afirmacin es verdadera pero la segunda es falsaMarque Dsi la primera afirmacin es falsa pero la segunda es verdaderaMarque Esi ambas afirmaciones son falsas

  • Anlisis de RelacionesLas preguntas que encontrar a continuacin constan de una afirmacin y una razn unidas por la palabra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relacin existente entre las mismas, y contestar en su hoja de respuestas segn el cuadro siguiente:

    Marque Asi ambas afirmaciones son verdadera y la segunda es una razn o explicacin correcta de la primeraMarque Bsi ambas afirmaciones son verdaderas pero la segunda NO es una razn o explicacin correcta de la primeraMarque Csi la primera afirmacin es verdadera pero la segunda es falsaMarque Dsi la primera afirmacin es falsa pero la segunda es verdaderaMarque Esi ambas afirmaciones son falsas

  • Anlisis de RelacionesPara la construccin de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre s o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.

  • Anlisis de RelacionesPara la construccin de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre s o mutuamente excluyentes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.

  • Anlisis de RelacionesEjemplo 8: Pregunta de Anlisis de Relaciones

    El hemisferio cerebral izquierdo regula las contracciones musculares del lado derecho del cuerpoPORQUElas fibras motoras y sensitivas se cruzan en el bulbo

  • ANLISIS DE LOS TEMS

  • xito en la estimacin en contextos variados Propiedades del sujeto Propiedades de los tems Estimacin de la Dificultad del temsFrecuencia de cada opcinDificultadCorrelacin con la pruebaDiscriminacinAzarCovarianza con la prueba(Homogeneidad)HaloJuicios SubjetivosCalificacinAdministracinRapport

  • INDICE DE DIFICULTADIndica la proporcin de aciertos en la muestra de alumnos que estamos utilizando. Es la media de ste 50% de sujetos analizados.

    El trmino de dificultad se presta a equvocos: in ndice mayor indica un pregunta mas fcil.

    Este ndice de dificultad sirve para evaluar cuatro variables:La complejidad de la habilidad medida.Las caractersticas del logro del grupo. La comparacin de distintos reactivos que miden la misma habilidad.La comparacin de reactivos que miden la misma habilidad pero con una relacin jerrquica.

  • INDICE DE DIFICULTAD Se fija un mnimo valor aceptable de p = 0.5 para considerar el reactivo bueno, cualquier medida inferior a 0.5, aunque no quiere decir que el reactivo no sirve, es mejor no usarlo porque podra ser que lo que est mal son las instrucciones.

    Criterios para calificar la dificultad de los reactivos de acuerdo al valor del ndice de dificultad de los reactivos p.

    Muy difcil Optima Ligeramente fcil Muy fcil 0% - 49% 50% - 69% 70% - 89% 90% - 100%

  • INDICES DE DISCRIMINACIONLos ndices de discriminacin expresan en que medida cada pregunta o tem diferencia a los que mas saben de los que menos saben.

    Es el ndice probablemente ms utilizado. Expresa hasta que punto la pregunta discrimina, establece diferencias, contribuye a situar a un sujeto en el grupo superior e inferior.

    A mayor diferencia, en numero de acertantes entre los grupos superior e inferior, el tem es mas discriminante, contribuye mas a situar a un sujeto entre los primeros o entre los ltimos.

  • Las preguntas muy fciles y muy difciles no discriminan, no establecen diferencias; nos dicen que todos saben o no saben una pregunta, pero no quien sabe mas y quien menos. Estas preguntas no contribuyen a la fiabilidad del test, pero eso no quiere decir necesariamente que sean malas preguntas.

    Si todos y solos los del grupo superior responden correctamente, tendremos que: ID=1.

    Si todos y solos los del grupo inferior responden correctamente, tendremos que: ID= -1.

  • Si el ID es menor de 0.30 el tem debe eliminarse porque no discrimina, an cuando su nivel de dificultad sea ptimo.

    Si el tem tiene un ID igual o superior a 0.30 y su nivel de dificultad no es ptimo debe entonces corregirse y mejorarse ya que discrimina y puede considerarse como un tem adecuado para la prueba. A mayor valor, mayor poder discriminativo.

  • Forma de calcular D y PProcedimiento:Hallar los puntajes totales por sujeto.

    Ordenarlos de mayor a menor o al revs. Nos interesan los puntajes extremos (27% de bajos) y (27% de altos) y los puntajes promedio no sirven para el anlisis, se ocultan. Por ejemplo, si hay 100 datos el 27% serian 27 datos y si fueran 70 datos el 27% seria equivalente a 18 datos.

  • Calcular el nmero de sujetos del grupo de los altos que responde correctamente bien cada tem y calcular el nmero de sujetos del grupo de los bajos que responde bien cada tem.Identificar el ndice de dificultad por la formula: P = nG(altos)A + nG(bajos)B G(total)A + G(total)B y el ndice de dificultad con la formula: D = GA + GB G(total).

    ****************************************************************************************