Post on 11-Jul-2015
VALIDEZ Y CONFIABILIDAD
Integrantes:
Alibardi Glorimar
Hoyer Gabriel
Temas
• Medición: ¿en qué consiste?
• Validez
– De contenido
– De criterio
– De constructo
• Confiabilidad
– Test-retest
– Formas paralelas
– Split-halves
– Coeficiente Alfa de Cronbach
– Coeficiente KR-20
Medición: ¿en qué consiste?
La medición se define como la asignación de números a objetos o
eventos, es decir, a las unidades de análisis, de acuerdo a ciertas reglas. A esta
caracterización se ha incorporado la importancia de que dicha asignación
corresponda a diferentes niveles de calidad, en la representación del concepto a
medir.
La medición es un aspecto relevante en la investigación científica, es
necesario precisar este concepto para poder alcanzar los objetivos de la
investigación. Los académicos reconocen que la aplicación de un enfoque
inadecuado de la medición en su estudio puede generar datos inapropiados. De
esta manera, es importante que el investigador desarrolle instrumentos de
medición adecuados, tales como:
• La entrevista
• El cuestionario
• La observación
• La encuesta
Validez
La validez es una de las propiedades básicas de las medidas empíricas,
mediante las cuales se trata de responder a la pregunta relacionada con el grado o
la manera de determinar cómo un indicador empírico o un conjunto de ellos
representa a un concepto teórico.
La validez se infiere de la manera en que una escala se elabora o
construye, de su habilidad para predecir eventos específicos, o de su relación a
mediciones de otros constructos. Lo anterior representa los tres tipos de validez:
1. Validez de contenido
2. Validez relacionada con el criterio
3. Validez de constructo.
El aspecto a enfatizar con respecto a la validez, consiste en saber sí el
instrumento validado, realmente lo es, con respecto al propósito con el que fue
planteado. De esta manera, se trata de establecer, sí la validez permite interpretar
los datos, con el fin con el que se planearon.
Validez de contenido
La validación de contenido se define como una serie de actividades que
se desarrollan después que se ha creado una forma inicial del cuestionario o
instrumento y que busca determinar si los ítems incluidos en el cuestionario son
adecuados.
Un estudio de validez de contenido busca determinar si los ítems de un
cuestionario representan adecuadamente el dominio o constructo que se quiere
medir.
Esta búsqueda de evidencias es prioritaria sobre todo al inicio del
proceso de construcción del cuestionario. Se puede observar en tres momentos
del proceso:
En la determinación de los diversos aspectos que se van a incluir en el
cuestionario de forma que éstos representen el universo de contenido.
En la asignación de importancia a estos diferentes aspectos del universo de
contenido.
En la selección de los ítems que concuerden con estos aspectos.
Validez de criterio
Se refiere al grado de eficacia con que se puede predecir o pronosticar
una variable de interés (criterio) a partir de las puntuaciones en un test. Un criterio
es una variable distinta del test que se toma como referencia, que se sabe que es
un indicador de aquello que el test pretende medir o que se sabe que debe
presentar una relación determinada con lo que el test pretende medir.
La elección del criterio es el aspecto crítico en este procedimiento de
determinación de la validez, ya que es muy difícil obtener buenos criterios. Un
mismo test puede tener más de un tipo de validez, es decir puede estar validado
con respecto a varios criterios y los diferentes coeficientes de validez que resultan
pueden tener valores diferentes.
Validez de criterio
Así pues, la operacionalización del concepto se realiza a partir del
denominado coeficiente de validez, que es la correlación entre el test y el criterio.
A mayor correlación, mayor capacidad predictiva del test. Existen distintos diseños
experimentales que permiten determinar esta correlación. La elección de
un diseño u otro dependerá de las necesidades y circunstancias específicas de
cada caso:
Validez concurrente o simultánea: El test y el criterio se miden al mismo tiempo
(concurrentemente). Puede utilizarse para validar un nuevo test por
comparación con otro ya validado previamente.
Validez de pronóstico: El criterio se mide pasado un periodo de tiempo tras la
aplicación del test. Es el tipo más habitual en los procesos de selección de
personal, en los que se pretende predecir el rendimiento futuro de los sujetos.
Validez retrospectiva: El test se aplica un tiempo después del criterio que se
pretende evaluar. Útil cuando se pretende dilucidar mediante una prueba algún
aspecto del pasado que actualmente no es accesible.
Validez de constructo
La validez de constructo, hace referencia a la recogida de evidencias
empíricas que garanticen la existencia de un constructo psicológico en las
condiciones exigibles a cualquier otro modelo o teoría científica. Por todo ello, la
validez de constructo se presenta como una condición indispensable a la hora de
valorar la eficacia de un instrumento de evaluación sobre una variable psicológica
determinada.
Para Messick (1980; p.1015) «la validez de constructo es el concepto
unificador que integra las consideraciones de validez de contenido y de criterio en
un marco común para probar hipótesis acerca de relaciones teóricamente
relevantes». Asimismo, Cronbach (1984; p.126) refiere que «la meta final de la
validación es la explicación y comprensión, y por tanto, esto nos lleva a considerar
que toda validación es validación de constructo».
Los procedimientos metodológicos más utilizados en la validez de
constructos psicológicos han sido el análisis factorial y la matriz multirrasgo-
multimétodo. Ambos sistemas son indicadores respectivos de las denominadas
"validez factorial" y "validez convergente-discriminante"
Confiabilidad
Hernández (2003:243), indican que la confiabilidad de un instrumento de
medición se refiere al grado en que su aplicación repetida al mismo sujeto u
objeto, produce iguales resultados.
Un instrumento de medición tiene un grado alto de confiabilidad si es
afectado mínimamente por elementos que representan el error de medición
aleatorio. En este sentido, la confiabilidad tiene un matiz plenamente empírico, sin
embargo, dicho instrumento para una aceptación científica completa, requiere de
la validez, la cual tiene una relación muy fuerte con la teoría, ya que con la validez
surge la pregunta siguiente: ¿con qué propósito se busca la validez? Por lo tanto,
un indicador o un instrumento con validez deben reflejar lo que se supone el
concepto teórico plantea explicar. Con la validez, lo que se busca evitar, es reflejar
un fenómeno diferente, o evitar un error de medición no aleatorio.
Test-retest
Con este método el coeficiente de fiabilidad se calcula pasando el mismo
test dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando
un intervalo de tiempo entre el test y el retest. Después se calcula la correlación de
Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido
será el coeficiente de fiabilidad. Se considera un caso específico de formas
paralelas, dado que evidentemente un test es paralelo a sí mismo.
Al resultado obtenido se le denomina coeficiente de estabilidad, al
servir de indicador de hasta qué punto son estables las mediciones realizadas
durante la primera aplicación del test. Las diferencias en los resultados se
atribuyen al grado de consistencia interna o muestreo de los ítems de la prueba en
el caso de pasar el retest de forma inmediata, y se le suman las fluctuaciones en el
tiempo en el caso del intervalo temporal.
Formas Paralelas
Este procedimiento es el que se deriva naturalmente del modelo.
Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan
lo mismo de forma diferente (por ejemplo, dos tests que con diferentes preguntas
midan un determinado rasgo). Después se comparan los dos tests, calculando
el coeficiente de correlación de Pearson. Esta correlación será, como hemos visto
en el apartado anterior, el coeficiente de fiabilidad.
Si la correlación es alta, se considera que hay una buena fiabilidad. Al
valor obtenido también se le conoce como coeficiente de equivalencia, en la
medida en que supone un indicador del grado de equivalencia entre las dos
formas paralelas de un test.
La dificultad de este procedimiento radica en conseguir que dos
instrumentos sean realmente "paralelos", dada la dificultad que supone realizar
dos pruebas que midan exactamente lo mismo, pero con diferentes ítems. No
obstante, en condiciones ideales en las que se pueda garantizar el paralelismo de
ambas formas, este es el método más recomendable.
Split-halves
Este método trata las dos mitades de una medida como formas alternas.
Proporciona una solución simple para el problema que enfrenta el método
paralelo-formas . A diferencia de los anteriores, este método sólo requiere una
aplicación del test. Tras obtener las puntuaciones obtenidas por los sujetos en
cada una de las dos mitades en que se habrá dividido, se procede a calcular
la correlación entre las dos puntuaciones.
El resultado obtenido será un indicador de la covariación entre ambas
mitades, es decir, de la consistencia interna del test. La principal dificultad de este
sistema es asegurarse de que ambas mitades sean efectivamente paralelas. Un
sistema habitual es dividir el test entre los ítems pares y los impares; no es
recomendable dividirlo sin más por la mitad, dado que muchos tests muestran un
incremento gradual de la dificultad de sus ítems.
Coeficiente Alfa de Cronbach
El Alfa de Cronbach es un coeficiente que sirve para medir
la fiabilidad de una escala de medida, y cuya denominación Alfa fue realizada
por Cronbach en 1951, aunque sus orígenes se encuentran en los trabajos de
Hoyt (1941) y de Guttman (1945).
El alfa de Cronbach no deja de ser una media ponderada de las
correlaciones entre las variables (o ítems) que forman parte de la escala. Puede
calcularse de dos formas: a partir de las varianzas (alpha de Cronbach) o de las
correlaciones de los ítems (Alpha de Cronbach estandarizado). Hay que advertir
que ambas fórmulas son versiones de la misma y que pueden deducirse la una de
la otra. El alpha de Cronbach y el alpha de Cronbach estandarizados, coinciden
cuando se estandarizan las variables originales (items)
Coeficiente KR-20
Para el año 1937 Kuder y Richardson, desarrollaron el conocido KR20, se
denominó de esta forma porque fue la fórmula número 20 presentada por el
famoso artículo de los autores.
También existen varios modelos para estimar la confiabilidad de
consistencia interna de una prueba, entre ellos los más conocidos son los
siguientes: Alpha de Croncbach, Dos mitades, Sperman-Brown, Método de Hoyt.
El Método KR20 representa un coeficiente de consistencia interna del instrumento,
que proporciona la media de todos los coeficientes de división por mitades para
todas las posibles divisiones del instrumento en dos partes (Magnusson, 1995).
La fórmula KR-20 tan solo es una variante de alfa especialmente
orientada a items dicotómicamente valorados (específicamente, valorados con los
valores 0 y 1). (Bolívar, 1997) Características:
Permite calcular la confiabilidad con una sola aplicación del instrumento.
No requiere el diseño de pruebas paralelas.
Es aplicable sólo en instrumentos con ítems dicotómicos, en los cuales sólo
existen respuestas correctas e incorrectas.