Validez y confiabilidad en la investigación

VALIDEZ Y CONFIABILIDAD

Integrantes:

Alibardi Glorimar

Hoyer Gabriel

• Medición: ¿en qué consiste?

• Validez

– De contenido

– De criterio

– De constructo

• Confiabilidad

– Test-retest

– Formas paralelas

– Split-halves

– Coeficiente Alfa de Cronbach

– Coeficiente KR-20

Medición: ¿en qué consiste?

La medición se define como la asignación de números a objetos o

eventos, es decir, a las unidades de análisis, de acuerdo a ciertas reglas. A esta

caracterización se ha incorporado la importancia de que dicha asignación

corresponda a diferentes niveles de calidad, en la representación del concepto a

medir.

La medición es un aspecto relevante en la investigación científica, es

necesario precisar este concepto para poder alcanzar los objetivos de la

investigación. Los académicos reconocen que la aplicación de un enfoque

inadecuado de la medición en su estudio puede generar datos inapropiados. De

esta manera, es importante que el investigador desarrolle instrumentos de

medición adecuados, tales como:

• La entrevista

• El cuestionario

• La observación

• La encuesta

Validez

La validez es una de las propiedades básicas de las medidas empíricas,

mediante las cuales se trata de responder a la pregunta relacionada con el grado o

la manera de determinar cómo un indicador empírico o un conjunto de ellos

representa a un concepto teórico.

La validez se infiere de la manera en que una escala se elabora o

construye, de su habilidad para predecir eventos específicos, o de su relación a

mediciones de otros constructos. Lo anterior representa los tres tipos de validez:

1. Validez de contenido

2. Validez relacionada con el criterio

3. Validez de constructo.

El aspecto a enfatizar con respecto a la validez, consiste en saber sí el

instrumento validado, realmente lo es, con respecto al propósito con el que fue

planteado. De esta manera, se trata de establecer, sí la validez permite interpretar

los datos, con el fin con el que se planearon.

Validez de contenido

La validación de contenido se define como una serie de actividades que

se desarrollan después que se ha creado una forma inicial del cuestionario o

instrumento y que busca determinar si los ítems incluidos en el cuestionario son

adecuados.

Un estudio de validez de contenido busca determinar si los ítems de un

cuestionario representan adecuadamente el dominio o constructo que se quiere

medir.

Esta búsqueda de evidencias es prioritaria sobre todo al inicio del

proceso de construcción del cuestionario. Se puede observar en tres momentos

del proceso:

En la determinación de los diversos aspectos que se van a incluir en el

cuestionario de forma que éstos representen el universo de contenido.

En la asignación de importancia a estos diferentes aspectos del universo de

contenido.

En la selección de los ítems que concuerden con estos aspectos.

Validez de criterio

Se refiere al grado de eficacia con que se puede predecir o pronosticar

una variable de interés (criterio) a partir de las puntuaciones en un test. Un criterio

es una variable distinta del test que se toma como referencia, que se sabe que es

un indicador de aquello que el test pretende medir o que se sabe que debe

presentar una relación determinada con lo que el test pretende medir.

La elección del criterio es el aspecto crítico en este procedimiento de

determinación de la validez, ya que es muy difícil obtener buenos criterios. Un

mismo test puede tener más de un tipo de validez, es decir puede estar validado

con respecto a varios criterios y los diferentes coeficientes de validez que resultan

pueden tener valores diferentes.

Validez de criterio

Así pues, la operacionalización del concepto se realiza a partir del

denominado coeficiente de validez, que es la correlación entre el test y el criterio.

A mayor correlación, mayor capacidad predictiva del test. Existen distintos diseños

experimentales que permiten determinar esta correlación. La elección de

un diseño u otro dependerá de las necesidades y circunstancias específicas de

cada caso:

Validez concurrente o simultánea: El test y el criterio se miden al mismo tiempo

(concurrentemente). Puede utilizarse para validar un nuevo test por

comparación con otro ya validado previamente.

Validez de pronóstico: El criterio se mide pasado un periodo de tiempo tras la

aplicación del test. Es el tipo más habitual en los procesos de selección de

personal, en los que se pretende predecir el rendimiento futuro de los sujetos.

Validez retrospectiva: El test se aplica un tiempo después del criterio que se

pretende evaluar. Útil cuando se pretende dilucidar mediante una prueba algún

aspecto del pasado que actualmente no es accesible.

Validez de constructo

La validez de constructo, hace referencia a la recogida de evidencias

empíricas que garanticen la existencia de un constructo psicológico en las

condiciones exigibles a cualquier otro modelo o teoría científica. Por todo ello, la

validez de constructo se presenta como una condición indispensable a la hora de

valorar la eficacia de un instrumento de evaluación sobre una variable psicológica

determinada.

Para Messick (1980; p.1015) «la validez de constructo es el concepto

unificador que integra las consideraciones de validez de contenido y de criterio en

un marco común para probar hipótesis acerca de relaciones teóricamente

relevantes». Asimismo, Cronbach (1984; p.126) refiere que «la meta final de la

validación es la explicación y comprensión, y por tanto, esto nos lleva a considerar

que toda validación es validación de constructo».

Los procedimientos metodológicos más utilizados en la validez de

constructos psicológicos han sido el análisis factorial y la matriz multirrasgo-

multimétodo. Ambos sistemas son indicadores respectivos de las denominadas

"validez factorial" y "validez convergente-discriminante"

Confiabilidad

Hernández (2003:243), indican que la confiabilidad de un instrumento de

medición se refiere al grado en que su aplicación repetida al mismo sujeto u

objeto, produce iguales resultados.

Un instrumento de medición tiene un grado alto de confiabilidad si es

afectado mínimamente por elementos que representan el error de medición

aleatorio. En este sentido, la confiabilidad tiene un matiz plenamente empírico, sin

embargo, dicho instrumento para una aceptación científica completa, requiere de

la validez, la cual tiene una relación muy fuerte con la teoría, ya que con la validez

surge la pregunta siguiente: ¿con qué propósito se busca la validez? Por lo tanto,

un indicador o un instrumento con validez deben reflejar lo que se supone el

concepto teórico plantea explicar. Con la validez, lo que se busca evitar, es reflejar

un fenómeno diferente, o evitar un error de medición no aleatorio.

Test-retest

Con este método el coeficiente de fiabilidad se calcula pasando el mismo

test dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando

un intervalo de tiempo entre el test y el retest. Después se calcula la correlación de

Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido

será el coeficiente de fiabilidad. Se considera un caso específico de formas

paralelas, dado que evidentemente un test es paralelo a sí mismo.

Al resultado obtenido se le denomina coeficiente de estabilidad, al

servir de indicador de hasta qué punto son estables las mediciones realizadas

durante la primera aplicación del test. Las diferencias en los resultados se

atribuyen al grado de consistencia interna o muestreo de los ítems de la prueba en

el caso de pasar el retest de forma inmediata, y se le suman las fluctuaciones en el

tiempo en el caso del intervalo temporal.

Formas Paralelas

Este procedimiento es el que se deriva naturalmente del modelo.

Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan

lo mismo de forma diferente (por ejemplo, dos tests que con diferentes preguntas

midan un determinado rasgo). Después se comparan los dos tests, calculando

el coeficiente de correlación de Pearson. Esta correlación será, como hemos visto

en el apartado anterior, el coeficiente de fiabilidad.

Si la correlación es alta, se considera que hay una buena fiabilidad. Al

valor obtenido también se le conoce como coeficiente de equivalencia, en la

medida en que supone un indicador del grado de equivalencia entre las dos

formas paralelas de un test.

La dificultad de este procedimiento radica en conseguir que dos

instrumentos sean realmente "paralelos", dada la dificultad que supone realizar

dos pruebas que midan exactamente lo mismo, pero con diferentes ítems. No

obstante, en condiciones ideales en las que se pueda garantizar el paralelismo de

ambas formas, este es el método más recomendable.

Split-halves

Este método trata las dos mitades de una medida como formas alternas.

Proporciona una solución simple para el problema que enfrenta el método

paralelo-formas . A diferencia de los anteriores, este método sólo requiere una

aplicación del test. Tras obtener las puntuaciones obtenidas por los sujetos en

cada una de las dos mitades en que se habrá dividido, se procede a calcular

la correlación entre las dos puntuaciones.

El resultado obtenido será un indicador de la covariación entre ambas

mitades, es decir, de la consistencia interna del test. La principal dificultad de este

sistema es asegurarse de que ambas mitades sean efectivamente paralelas. Un

sistema habitual es dividir el test entre los ítems pares y los impares; no es

recomendable dividirlo sin más por la mitad, dado que muchos tests muestran un

incremento gradual de la dificultad de sus ítems.

Coeficiente Alfa de Cronbach

El Alfa de Cronbach es un coeficiente que sirve para medir

la fiabilidad de una escala de medida, y cuya denominación Alfa fue realizada

por Cronbach en 1951, aunque sus orígenes se encuentran en los trabajos de

Hoyt (1941) y de Guttman (1945).

El alfa de Cronbach no deja de ser una media ponderada de las

correlaciones entre las variables (o ítems) que forman parte de la escala. Puede

calcularse de dos formas: a partir de las varianzas (alpha de Cronbach) o de las

correlaciones de los ítems (Alpha de Cronbach estandarizado). Hay que advertir

que ambas fórmulas son versiones de la misma y que pueden deducirse la una de

la otra. El alpha de Cronbach y el alpha de Cronbach estandarizados, coinciden

cuando se estandarizan las variables originales (items)

Coeficiente KR-20

Para el año 1937 Kuder y Richardson, desarrollaron el conocido KR20, se

denominó de esta forma porque fue la fórmula número 20 presentada por el

famoso artículo de los autores.

También existen varios modelos para estimar la confiabilidad de

consistencia interna de una prueba, entre ellos los más conocidos son los

siguientes: Alpha de Croncbach, Dos mitades, Sperman-Brown, Método de Hoyt.

El Método KR20 representa un coeficiente de consistencia interna del instrumento,

que proporciona la media de todos los coeficientes de división por mitades para

todas las posibles divisiones del instrumento en dos partes (Magnusson, 1995).

La fórmula KR-20 tan solo es una variante de alfa especialmente

orientada a items dicotómicamente valorados (específicamente, valorados con los

valores 0 y 1). (Bolívar, 1997) Características:

Permite calcular la confiabilidad con una sola aplicación del instrumento.

No requiere el diseño de pruebas paralelas.

Es aplicable sólo en instrumentos con ítems dicotómicos, en los cuales sólo

existen respuestas correctas e incorrectas.

Validez y confiabilidad en la investigación

Education

Transcript of Validez y confiabilidad en la investigación

ELABORACIÓN, VALIDEZ Y CONFIABILIDAD DE UN INSTRUMENTO DE INVESTIGACIÓN

Metodología de la Investigación: Validez y Confiabilidad

Validez y confiabilidad de instrumentos de medición en investigación cuantitativa

Confiabilidad y Validez en el Contexto de la Investigación y ...

Validez confiabilidad díaz_ramírez

Validez y confiabilidad

Confiabilidad y Validez

VALIDEZ CONFIABILIDAD

Validez y Confiabilidad de instrumentos de investigación

Validez y Confiabilidad de instrumentos en la investigación cuantitativa