1. El grupo objetivo de esta presentación es el selecto grupo de profesionales de las áreas de la...

Post on 02-Feb-2016

217 views 0 download

Transcript of 1. El grupo objetivo de esta presentación es el selecto grupo de profesionales de las áreas de la...

Presentación de

Programas Computacionales

Autor : Gabriel Davidovics M.

1

TESTS NO-PARAMÉTRICOS

Introducción

El grupo objetivo de esta presentación es el selecto grupo de profesionales de las áreas de la Sociología, Psicología, Cientistas Políticos, Economistas, Ingenieros Industriales, Periodistas, Estadísticos, y otros, a quienes les interesa obtener el máximo de información relevante de los resultados de Encuestas de Opinión Pública , Estudios de Mercado y estudios muestrales similares.

2

Volver

Introducción(continuación)

Esta información debe ir más allá de simples especulaciones elucubradas a partir de aparentes verdades obtenidas de estudios muestrales. Muchos analistas no se molestan en averiguar cuánto de lo que están afirmando está refrendado por análisis estadístico serio, y en sus conclusiones pueden llegar a efectuar afirmaciones muy alejadas de la realidad. 3

Volver

Introducción(continuación)

Para todos aquellos estudiosos y profesionales que desean llegar a conclusiones sanas como producto de sus análisis, la información que se entrega a continuación puede ser de gran utilidad. Esperamos que saquen el máximo provecho de la lectura de las siguientes diapositivas.

4

Volver

INDICECELDA TEST DIAPOSITIVA IR====== ============ ========= ==== 1 Binomial 14 1 Chi-Cuadrado,

Bondad de ajuste 22 2 Test del cambio

de Mc Nemar 32 3 Test exacto de Fisher

para tablas de 2 x 2 41 3 Test del Chi-cuadrado

para tablas de r x 2 50

5

Volver

INDICECELDA TEST DIAPOSITIVA IR====== ============ ========== === 4 Test Q de Cochran 66

5 Test del Chi-Cuadrado

para tablas de “r” x “k” 71

6 Coeficiente C de Cramer 83

6 El Coeficiente Phipara tablas de 2 x 2 89

6 El Coeficiente de acuerdo “K” de Kappa 93 6

Volver

INDICECELDA TEST DIAPOSITIVA IR====== ============ ========== === 6 El coeficiente de asociación

asimétrica Lambda 97

7 Test de Kolmogorov-_Smirnov 105

7 Test del punto de cambio de tendencia 110

7 Test de rachas 122

8 Test del Signo 1347

Volver

INDICE

CELDA TEST DIAPOSITIVA IR====== ============ ========== === 8 Test de rankings con signo

de Wilcoxon 144

9 Test de la Mediana 157

9 Test de Wilcoxon-Mann-Whitney 175

9 Test robusto de orden de rankings 182

9 Test de Kolmogorov-Smirnov 1878

Volver

INDICE

CELDA TEST DIAPOSITIVA IR====== ============ ========== === 9 Test de Siegel-Tukey

para diferencias de escala 192

10 Test de FriedmanAnálisis de Varianza por rangos 199

10 Test de Page para alternativas ordenadas 205

11 Test Extendido de la Mediana 217

11 Análisis de Varianza de Kruskal-Wallis 229

9

Volver

INDICE

CELDA TEST DIAPOSITIVA IR====== ============ ========== === 11 Test de Jonckheere

para alternativas ordenadas 237

12 Coeficiente de Correlaciónde rankings, de Spearman 249

12 Coeficiente de correlación de rankings T, de Kendall 261

12 Coeficiente de correlación parcial

de rankings de Kendall 266

12 Coeficiente de Concordancia de Kendall 276

10

Volver

INDICE

CELDA TEST DIAPOSITIVA IR====== ============ ========== === 12 Coeficiente de acuerdo de

Kendall para comparaciones pareadas o rankings 288

12 Coeficiente de Correlaciónentre “n” jueces y un criterioprefijado 296

12 Estadístico G de Gamma 302

12 Indice Somer de asociaciónasimétrica 309

13 Test de Permutaciones para replicaciones pareadas 317

11

Volver

INDICE

CELDA TEST DIAPOSITIVA IR====== ============ ========== === 14 Test de Permutaciones

para 2 muestras independientes 323

14 Test del rango, de Moses, paradiferencias de escala 332

12

13

CELDA N° 1

MUESTRAS : UNA MUESTRAVARIABLE : NOMINAL

Tests :

1.- Binomial 2.- Bondad de ajuste del Chi-Cuadrado

Volver

CELDA NUMERO 1

TEST : BINOMIAL SITUACIONES DE USO

14

Este test suele aplicarse cuando se desea testear si la proporción de unidades muestrales (por ej. personas que poseen la característica), es compatible con cierta proporción hipotética.Así es como, si interesa la intención de voto por cierto candidato, y éste recibe, en una encuesta muestral probabilística de tamaño real n = 1000, un 53% de las intenciones de voto, por ejemplo, puede ser de interés el preguntarse si en la población representada por la muestra, la real proporción pudiera ser de sólo 50% o aún menor, a un nivel de significancia ( probabilidad de cometer un error al rechazar la hipótesis Nula equivocadamente), del 0,01 , vale decir, del 1% Este test suele aplicarse en el caso de variables dicotómicas, o multicotómicas dicotomizadas, de modo que las respuestas puedan consistir sólo de unos (“1”) cuando la unidad muestral ( por ejemplo persona u objeto), opina de cierto modo o posee la característica de interés. Cuando no la posee, se codifica un cero (“0”).En el ejemplo precedente poseer la característica significa tener intenciones de votar por este candidato (código 1). El código 0, para los efectos de este test, se aplicaría a todas las personas que no tienen intenciones de votar por este candidato, vale decir votarían por otro candidato, o votarían en blanco, etc. (variable multicotómica dicotomizada) . El output computacional podría verse del siguiente modo:

Volver

15

Volver

16volver

En el ejemplo precedente, la muestra consta de 1000 entrevistas, y hemos supuesto que, en este caso, el “efecto del diseño es 1”, vale decir, el tamaño real de la muestra puede ser considerado como equivalente a una muestra aleatoria simple de tamaño 1000.

En este punto cabe señalar que el programa ha sido diseñado de tal modo que cuando el tamaño muestral real es de 400 casos o menor, el programa computacional calcula las probabilidades exactas en base a la fórmula Binomial. Cuando el tamaño muestral real supera los 400 casos, el programa utiliza una aproximación a la Curva Normal. Este último es el caso presentado en la página precedente.

A continuación presentamos el output computacional para un caso similar al anterior, pero con los resultados basados en una muestra de 40 casos en lugar de 1000, para demostrar como se presentan los resultados al usuario cuando la fórmula utilizada es la Binomial.

17

Volver

18volver

19volver

20

volver

21volver

CELDA NUMERO 1

TEST : BONDAD DE AJUSTE - CHI-CUADRADO

SITUACIONES DE USO

Este test suele aplicarse cuando se desea testear si la distribución empírica de los resultados se ajusta a una presunta distribución teórica. Así es como, si interesa la intención de voto por varios candidatos , digamos 8, y éstos reciben, en una encuesta muestral probabilística de tamaño real n=144, las cantidades absolutas y relativas que se presentan en el output computacional, por ejemplo, puede ser de interés el preguntarse si en la población representada por la muestra, las reales proporciones por cada candidato pudieran ser iguales unas a otras, y que las diferencias encontradas en la muestra se deben solamente a variabilidades aleatorias esperadas cuando la Hipótesis Nula de igualdad es ciertaEn el ejemplo precedente poseer la característica significa tener intenciones de votar por estos candidatos. 22

Volver

TEST : BONDAD DE AJUSTE - CHI-CUADRADOSITUACIONES DE USO

(continuación)

Cada candidato posee un código que lo caracteriza, y en el procesamiento, si la muestra es autoponderada, sólo se deben contar cuantas menciones recibió cada código.Cabe señalar que el programa computacional acepta 4 alternativas de distribuciones teóricas, a saber:

1.- Distribución rectangular o uniforme 2.- Distribución Normal ( de Gauss)3.- Distribución de Poisson4.- Distribución ingresada por el usuario a su discreción

En el ejemplo a continuación se optó por la distribución uniforme como la distribución teórica

23

Volver

24Volver

25volver

volver 26

En un segundo ejemplo, supongamos que una muestra de 103 alumnos universitarios se enfrentan a un test psicotécnico, con puntajes que varían entre 0 y 120, pudiendo estos puntajes ser números enteros o reales( valores continuos con decimales).

A continuación presentamos los resultados del test de hipótesis del Chi-Cuadrado, cuando la hipótesis Nula consiste en que la distribución de los resultados sigue una distribución Poisson.

No se presenta la tabla original con los puntajes, por razones de espacio, pero el programa permite presentar la tabla cuando así se desea

27

Volver

28volver

29volver

30volver

31

CELDA N° 2

MUESTRAS : DOS MUESTRAS RELACIONADAS

VARIABLE : NOMINAL

Tests :

1.- Test del cambio de Mc Nemar

Volver

CELDA NUMERO 2

TEST DEL CAMBIO DE MC NEMAR

SITUACIONES DE USO

Este test es sumamente útil cuando se desea detectar si hubo algún cambio entre una situación previa a algún acontecimiento y otra situación posterior al acontecimiento.En este test ambas mediciones deben efectuarse sobre los mismos entrevistados, es decir, cada entrevistado proporciona 2 respuestas.Así, el test puede ser usado para medir la efectividad de un tratamiento particular (tratamiento médico, campaña publicitaria, reunión personal, discurso político, atentado terrorista, editorial en un periódico, campaña televisiva, etc.)Los resultados se entregan en una tabla de 2 x 2, como se ve en el siguiente ejemplo:

32

Volver

CELDA NUMERO 2

TEST DEL CAMBIO DE MC NEMAR

SITUACIONES DE USO DEL TEST(continuación)

En 1980, se llevó a cabo un debate televisivo entre los candidatos Carter y Reagan previo a las elecciones presidenciales de dicho año. El investigador seleccionó aleatoriamente a 70 personas entre los centenares de personas presentes en el auditorio donde se llevaría a cabo el debate entre ambos candidatos, y preguntó a cada uno de ellos por sus preferencias. Al finalizar el debate, preguntó a las mismas 70 personas las mismas preguntas. Podría ser más de una pregunta, pero el test se aplica individualmente para cada pregunta separadamente. El investigador no pretendía que su muestra de 70 casos reflejara la opinión pública de votantes de la nación, tal como los centenares de espectadores presentes durante el debate no constituían tampoco una muestra representativa de la población en general. Pero sí quería detectar si el debate producía efectos entre la gente, y cómo se reflejaba eso en sus preferencias. Podría preguntarse también, por ejemplo, la impresión de las personas pertenecientes a la muestra sobre la credibilidad que tienen los candidatos, antes y después del debate público, etc.

33

Volver

34volver

35 volver

Como se observa, la conclusión que se desprende es que el debate no fue beneficioso para ninguno de los dos candidatos. Sin embargo, si aún quedan dudas, podría recurrirse al test Binomial aplicado sobre el total de 20 personas que cambiaron de “bando”, de los cuales 13 (un 65%) se pasaron de Carter a Reagan y sólo 7 (un 35%) de Reagan a Carter, y tratar de averiguar si estos porcentajes se alejan significativamente ( desde el punto de vista estadístico) de la hipótesis nula de p = 50%.

A continuación presentamos el Test Binomial aplicado a este ejemplo, y veremos que arroja el mismo resultado que el Test de Mc Nemar.

volver

36

37 volver

38 volver

39

Nótese que en ambos tests, la probabilidad de obtener los valores empíricos, bajo la hipótesis nula de igualdad, es de un 26,3% en el caso del test Binomial y de un 26,4% en el caso del test de Mc Nemar.

Obsérvese que el resultado del test de Mc Nemar es una aproximación, mientras que el test Binomial proporciona probabilidades exactas, y como se ve ambos resultados se asemejan mucho entre sí

En ambos casos la hipótesis alternativa es bilateral, es decir, no se presupone el triunfo para ninguno de los dos bandos en disputa

volver

40

CELDA N° 3

MUESTRAS :DOS MUESTRAS INDEPENDIENTESVARIABLE : NOMINAL

Tests :

1.- Test exacto de Fisher para tablas de 2 x 2 2.- Test del Chi-Cuadrado para tablas de r x 2

Volver

CELDA NUMERO 3

TEST EXACTO DE FISHER PARA TABLAS DE 2 x 2SITUACIONES DE USO DEL TEST

Este test es sumamente útil para analizar datos discretos (nominales u ordinales). Originalmente fue utilizado cuando las dos muestras independientes eran pequeñas. Sin embargo, gracias al advenimiento de la era computacional, este test actualmente se puede adaptar al caso de muestras grandes. A continuación se presentan 3 ejemplos, el primero para n = 15, el segundo para n = 440, y el tercero para el caso de n = 2360.Este test se debiera utilizar cuando los resultados de las 2 muestras independientes caen en una de dos categorías excluyentes posibles y estos resultados se reflejan en una tabla de contingencia de 2 x 2.

41Volver

CELDA NUMERO 3

TEST EXACTO DE FISHER PARA TABLAS DE 2 x 2SITUACIONES DE USO DEL TEST

(continuación)

Estas 2 muestras independientes pueden ser dos muestras cualesquiera, por ejemplo una muestra experimental y la otra de control, o bien una muestra de ‘Hombres’ y la otra de ‘Mujeres’, una muestra de los que apoyan a los partidos del Gobierno y la otra de los que apoyan a los partidos de la Oposición, etc.

Las dos categorías de respuesta pueden ser, por ejemplo ‘de acuerdo’ y ‘en desacuerdo’, o bien una categoría podría ser ‘Importante + Muy importante’ y la otra ‘Muy poco importante + No importante’, etc.,

El test averigua si la discrepancia en las proporciones entre ambos grupos es o no estadísticamente significativa, al nivel de significancia α (alfa) solicitado por el usuario del programa.

42

Volver

43

Ejemplo N° 1:

Volver

(continuación)

44volver

(continuación)

volver45

46

Ejemplo N° 2 :

Volver

(continuación)

47volver

48

Ejemplo 3:

Volver

(continuación)

49volver

CELDA NUMERO 3

TEST DEL CHI-CUADRADO PARA TABLAS DE r x 2

SITUACIONES DE USO DEL TEST

50

Este test es sumamente útil para analizar datos discretos (nominales u ordinales) entre dos muestras independientes para comparar si la distribución de las frecuencias relativas a través de las categorías de respuesta es igual para ambas poblaciones de las cuales fueron extraídas las muestras.

Como en el test anterior, ambas muestras deben ser aleatorias simples, o, si se trata de muestras probabilísticas complejas, se debe divisar un método de simplificación, calculando el “efecto del diseño” y simplificando los datos de tal modo de lograr una tabulación virtual equivalente a una muestra aleatoria simple cuyo tamaño muestral sea equivalente en cuanto a error Standard, al del diseño complejo. Generalmente esto implica analizar los resultados con una muestra de tamaño muestral menor a la originalmente obtenida.

Tal como en el caso del test exacto de Fisher estas 2 muestras independientes pueden ser dos muestras cualesquiera, por ejemplo una muestra experimental y la otra de control, o bien una muestra de ‘Hombres’ y la otra de ‘Mujeres’, una muestra de los que apoyan a los partidos del Gobierno y la otra de los que apoyan a los partidos de la Oposición, etc.

En cuanto al número de categorías de respuesta, éstas ya no están limitadas a 2.

A continuación presentaremos dos ejemplos:

Volver

Fuente : Shiffman. S. ( 1982) Relapse following smoking cessation : A situational analysis. Journal of Counseling and Clinical

Psychology, 50, 71-86.

51

Como primer ejemplo mostraremos un caso en que Shiffman recolectó información sobre crisis de recaídas entre ex fumadores sujetos a ciertas terapias. Se deseaba conocer la eficiencia de las diversas terapias , la que se midió en base al porcentaje de recaídas en el hábito de fumar después de aceptar ser sujetos a diversas terapias.

Para esos efectos se trabajó con una muestra aleatoria de 159 personas, todas ex-fumadores, las cuales se subdividieron en 3 grupos con tratamientos alternativos, los que llamó de “comportamiento” (behavioral), “cognitivo” (cognitive) y una combinación de ambos .

39 ex-fumadores siguieron el tratamiento del “comportamiento”

36 ex- fumadores siguieron el tratamiento “cognitivo”

56 ex-fumadores siguieron ambos tratamientos

28 ex-fumadores no siguieron ningún tratamiento

La Hipótesis alternativa postula que diferentes tratamientos deben producir diferentes resultados en cuanto al porcentaje de recaídas en el hábito.

A continuación se presenta la tabla y los resultados del análisis

Volver

52

Volver

(continuación)

53volver

(continuación)

Puesto que la probabilidad de equivocarnos al aceptar la Hipótesis Alternativa que postula que sí hay una relación entre tipo de tratamiento y resultado en cuanto al porcentaje de recaídas es sólo de un 0.00003, es decir, de 3 en cien mil, sería interesante establecer cuál(es) es/son el ( los) tratamientos que produce el mejor resultado en cuanto a minimizar la tasa de recaídas durante momentos de crisis.Para estos efectos se procede a particionar la tabla de contingencia como se demuestra a continuación

54

volver

(continuación)

55volver

(continuación)

CONCLUSIONESDe la Tabla 1 precedente, se deduce que ninguna de las 2 terapias individuales : “comportamiento” y cognitiva” se muestra como superior a la otra en cuanto a disminuir la recaída en el hábito de fumar durante una crisis. De la Tabla 2 se deduce que, al comparar las 2 terapias individuales ( terapia del comportamiento o la terapia cognitiva, combinando las frecuencias absolutas de ambas terapias en la tabla de contingencia), con un tratamiento que incluye ambas terapias simultáneamente (la terapia del comportamiento y la terapia cognitiva), tampoco se detecta una diferencia estadísticamente significativa entre ellas.Sin embargo, de la Tabla 3 se deduce que, al comparar las 3 terapias “comportamiento”, “cognitiva” y el tratamiento combinado de ambas terapias “comportamiento - cognitiva”, versus “Ningún tratamiento”, se observa una diferencia estadísticamente significativa, lo que implica que no importa cuál sea la terapia, es mejor que no aplicar ninguna.Este test, en este caso, se realizó eligiendo un nivel de significancia estadística del 1 %, vale decir, permitiendo cometer un Error del Tipo 1 con una probabilidad de sólo un 1%. Este Error del Tipo 1 implica equivocarse al declarar que hay una diferencia entre las categorías, cuando realmente dicha diferencia no existe ( en otras palabras, cuando la Hipótesis Nula es la correcta)

56

volver

(continuación)

57volver

58

Como segundo ejemplo mostraremos un caso en que un grupo de psicólogos desearon testear si la altura de las personas influye en su carácter de “líder” o de “seguidor” .

Para esos efectos se extrajo una muestra aleatoria de 43 personas de baja estatura y 52 personas de estatura elevada, y mediante un determinado instrumento de medición, se determinó si se clasificaban como “líderes” o como “seguidores”. Sin embargo, el instrumento de medición no logró evaluar dicha cualidad en todas las personas de la muestra, y por lo tanto, en esos casos, se determinó codificar a dichas personas como “inclasificables”.

A continuación se presenta la tabla con los resultados

Volver

59

Volver

(continuación)

60volver

CONCLUSIONES

61

Obsérvese que alrededor de un 60% de las personas altas fueron clasificadas como “líderes” ( 32 de 52), siendo ese porcentaje solamente del 28% entre las personas bajas ( 12 de 43). Si bien se podía sospechar viendo los resultados de la tabla, que existía una relación entre estatura y status , el test comprobó que dicho supuesto era correcto, y hasta proporcionó una probabilidad de equivocarse al afirmar que existe dicha relación. Dicha probabilidad es sólo del 5 o/ oo (cinco por mil), es decir, en sólo 5 casos de cada mil, en una muestra aleatoria como la precedente, se daría un resultado como el anterior cuando la Hipótesis Nula de independencia fuera la correcta. La hipótesis de independencia nos debería mostrar proporciones similares en cada categoría de respuesta para ambos grupos de personas. En esos 5 casos de mil, por lo tanto, nos equivocaríamos al señalar que no hay independencia, y que, al contrario, existe una relación entre estatura y status de “líder – seguidor”.

Sin embargo, existe la posibilidad de averiguar más a fondo en el experimento, para lo cual se divide la tabla original de 3 x 2, en 2 tablas de 2 x 2 cada una. Esto se denomina “particionar los grados de libertad de una tabla de r x 2”.

A continuación se presentará la partición de la tabla precedente en 2 sub-tablas de 2 x 2

Volver

(continuación)

62volver

CONCLUSIONES

De la Tabla 1 se desprende que los personajes, ya sean altos o bajos, no tienen ninguna relación en cuanto a distinguirse entre aquellos que se clasificaron como “seguidores” y aquellos que no pudieron ser clasificados,.

Sin embargo, cuando comparamos ambas categorías combinadas : “seguidores” y “no clasificables”, con la categoría de “líderes”, se detecta que sí hay una relación con la estatura, puesto que la proporción de personajes señalados como líderes es mucha mayor entre aquellos que son altos ( 60%), que la proporción de personajes señalados como “seguidores” o “no clasificables”, entre los personajes altos ( 38.5%).

La probabilidad de equivocarnos al afirmar que sí hay una relación entre estatura y la condición de ser señalado como líder, es sólo de un 1 o/oo ( un uno por mil) 63

volver

(continuación)

64volver

65

CELDA N° 4

“k” MUESTRAS DEPENDIENTES

VARIABLE : NOMINAL

Tests :

1.- Test del Q de Cochran

Volver

CELDA NUMERO 4

TEST DEL Q DE COCHRAN PARATABLAS DE “k” MUESTRAS

DEPENDIENTESSITUACIONES DE USO

Este test es particularmente útil para establecer si “k” muestras dependientes (por ejemplo la misma muestra medida en 3 o más oportunidades diferentes), difieren entre sí respecto a una variable nominal, o a una variable ordinal o de intervalo, todas ellas dicotómicas (1,0) o multicotómicas pero dicotomizadas.Un caso típico es el de un panel de potenciales votantes (por ej. personas inscritas en los Registros Electorales), a los cuales se mide sus intenciones de voto en “k” oportunidades previas a la votación misma. Se desea saber si las diferencias que se observan entre las “k” oportunidades son diferencias significativas o sólo diferencias aleatorias previstas en una muestra de dicho tamaño, considerando sí que se trata de un panel y no de “k” muestras independientes.Obviamente el test se puede empezar a aplicar desde la toma de la tercera muestra y en cada una de las siguientes sin necesidad de esperar que se cumplan las “k” muestras previstas para efectuar el análisis.

Obsérvese que los datos a ingresar deben venir en formato de base de datos tipo Excel, con la información de cada persona entrevistada digitada en forma codificada como 0 (si no presenta la característica), o un 1 si la presenta.

Esta característica puede ser cualquier atributo, incluyendo una opinión. 66

Volver

CELDA NUMERO 4

TEST DEL Q DE COCHRAN PARATABLAS DE “k” MUESTRAS DEPENDIENTES

SITUACIONES DE USO

(continuación)

67

Se debe destacar que el 0 se atribuye a toda respuesta que implique no poseer la característica, incluyendo entre éstas las “no respuestas”. A continuación se presenta un ejemplo hipotético con una muestra muy pequeña, y sólo con el propósito de clarificar los detalles.Suponiendo que se trate de una encuesta sobre intenciones de voto por los diferentes candidatos, en este ejemplo vamos a decir que nos interesa el candidato A, y más específicamente, lo que interesa es saber si la intención de voto por dicho candidato se mantiene o cambia a través del tiempo. En la tabla que se presenta a continuación se puede apreciar que el entrevistado 1 no tiene intenciones de votar por este candidato en ninguna de las 3 ocasiones en que fue entrevistado. El resto de la tabla se subentiende aplicando igual lógica.Esta pequeña muestra sirve además como ejemplo de la forma de ingresar los datos, y representa sólo una pequeña parte de la matriz de datos. Otras columnas representarán las intenciones de voto por los otros candidatos a cada uno de los cuales se puede aplicar este mismo test.El programa “importa” la planilla, la analiza y luego la despliega, quedando esta última opción al arbitrio del investigador.Obviamente si se trata de una muestra grande, de varios centenares de entrevistas por ejemplo, el investigador puede optar, porque el programa así lo permite, el no desplegar la tabla de datos originales, la que en el presente ejemplo se presenta gracias al pequeño tamaño muestral.

Volver

68Volver

69Volver

70

CELDA N° 5

“k” MUESTRAS INDEPENDIENTES

VARIABLE : NOMINAL

Tests :

1.- Test del Chi-Cuadrado para tablas de “r” x “k”

Volver

CELDA NUMERO 5

TEST DEL CHI-CUADRADO PARATABLAS DE “r” x “k”

SITUACIONES DE USO DEL TEST

71

Este test es sumamente útil para analizar datos discretos (nominales u ordinales) entre k = 3 o más muestras independientes para comparar si la distribución de las frecuencias relativas a través de las categorías de respuesta es igual para las “k” poblaciones de las cuales fueron extraídas las muestras.

Como en el test anterior del Chi-cuadrado para tablas de r x 2 de la celda 3, las “k” muestras deben ser aleatorias simples, o, si se trata de muestras probabilísticas complejas, se debe divisar un método de simplificación, calculando el “efecto del diseño” y simplificando los datos de tal modo de lograr una tabulación virtual equivalente a una muestra aleatoria simple cuyo tamaño muestral sea equivalente en cuanto a error Standard, al del diseño complejo. Generalmente esto implica utilizar en las fórmulas un tamaño muestral menor al número de personas efectivamente entrevistadas.

Volver

CELDA NUMERO 5

TEST DEL CHI-CUADRADO PARATABLAS DE “r” x “k”

SITUACIONES DE USO DEL TEST(continuación)

72

Tal como en el caso del test precedente del Chi-Cuadrado para 2 muestras independientes, en este caso pueden ser “k” muestras cualesquiera, por ejemplo 4 grupos etarios, o tres grupos socio-económicos, o “k” partidos o agrupaciones políticas con las cuales los entrevistados se identifican, etc.

Respecto a las limitaciones del programa en cuanto al tamaño de las tablas de contingencia que puede importar, estas van desde un mínimo de 3 x 3 hasta un máximo de 6 x 6. Esto no implica en lo absoluto que las tablas a analizar deben ser matrices cuadradas. Muy por el contrario, existen 16 combinaciones posibles de tamaños de tablas de contingencia, rectangulares o cuadradas( 3 x 3, 3 x 4, 3 x 5, 3 x 6, 4 x 3, 4 x 4, 4 x 5, etc.).

A continuación presentaremos un ejemplo del área de Opinión Pública, en el que se pretende obtener información sobre el nivel de aprobación de la población respecto al Gobierno de turno. La tabla de contingencia que se presenta a continuación corresponde a un ejemplo hipotético, en el cual se pide a los entrevistados identificarse con alguna de 4 posiciones políticas. En cuanto a las categorías de respuesta, éstas son 3: Aprueban, Son Indiferentes, o Desaprueban la gestión del Gobierno

Volver

73

El análisis consiste inicialmente en calcular un test del Chi-Cuadrado para el total de la tabla.

Si el resultado de este test arroja un resultado de X2 ubicado en la Región Crítica, es decir, rechazando la Hipótesis Nula al nivel de significancia elegido, se procede a un análisis residual en el que la tabla de contingencia original (en este ejemplo de 3 x 4), se subdivide en (r-1)*(k-1) subtablas de 2 x 2 cada una. Puesto que en este ejemplo r = 3 y k = 4, el número de subtablas será de 2 x 3 = 6. Cada una de estas tablas de 2 x 2 se calcula combinando valores contiguos (es decir categorías de respuesta contiguas de la variable dependiente) como igualmente combinando las categorías contiguas de la variable independiente.

El valor agregado de este tipo de análisis del Chi-Cuadrado es el de que no solamente nos dice que la tabla completa, como un solo todo, muestra que existe un tipo de interacción entre la variable independiente y la variable dependiente, sino que nos agrega la posibilidad de ubicar DONDE está ubicada exactamente la interacción.

Para estos efectos el programa efectúa un test del Chi-Cuadrado para cada una de estas tablas de 2 x 2, obteniendo un valor de X2 para cada subtabla. Cada uno de estos valores se compara con el χ2 crítico al nivel alfa de significancia elegido para 1 grado de libertad. Luego el programa entrega sus conclusiones.

Volver

74

Volver

75

Volver

76

Volver

77

Volver

78

Volver

79

Volver

80Volver

CONCLUSIONES

81

Como se desprende del análisis anterior, la única subtabla que muestra una relación diferencial (interacción) entre las variables independientes de la subtabla y la combinación de categorías de respuesta correspondiente, es la subtabla 6, la que muestra por un lado, como variable independiente, la combinación de todas las personas identificadas con algún partido político sea éste de Centro, Derecha o Izquierda, y por otro lado, el grupo de los Independientes.

En cuanto a las 2 categorías de aprobación diferenciadas por el test, son: “Aprueban + Indiferentes” vs. “Desaprueban”.

Esto podría estar sugiriendo que son los Independientes los que difieren con el universo de personas identificadas políticamente ( no importando con cuál partido simpaticen ), en cuanto a su opinión respecto a la conducción económica del Gobierno. En otras palabras, las personas que se identifican con alguna corriente política, son más homogéneas entre sí que con los independientes, respecto a la variable dependiente “nivel de aprobación” .

También se destaca que la categoría conflictiva es la de “desaprobación” al compararla con la combinación de {“aprueban” + “indiferentes”}.

Se puede observar en la subtabla 6, que la relación de “aprueban + indiferentes” respecto a los que “desaprueban”, es igual a 1 entre los independientes ( 21 : 21 ), mientras que esta relación es casi de 3 : 1 a favor de la “aprobación e indiferencia” a la gestión económica, en comparación con los que la “desaprueban”, en el grupo de las personas identificadas con algún partido político ( 101 : 35 )

volver

82

CELDA N°6

ESTADIGRAFOS DE ASOCIACION

VARIABLE : NOMINAL

Tests :

1.- El coeficiente C de Cramer

2.- El coeficiente rΦ Phi

3.- El coeficiente de acuerdo kappa K

4.- El coeficiente de asociación asimétrica LB de Lambda

Volver

CELDA NUMERO 6

EL COEFICIENTE C DE CRAMER

SITUACIONES DE USO

83

Este test es sumamente útil para analizar tablas de contingencia en que ambas variables pertenecientes a una misma muestra, se presentan como datos discretos (nominales u ordinales) y se desea analizar el grado de relación existente entre ambas utilizando para ello las frecuencias absolutas de las celdas de la tabla.

Como en el test anterior la muestra (única en este caso) debe ser aleatoria simple, o, si se trata de una muestra probabilística compleja, se debe divisar un método de simplificación, calculando el “efecto del diseño” y simplificando los datos de tal modo de lograr una tabulación virtual equivalente a una muestra aleatoria simple cuyo tamaño muestral sea equivalente en cuanto a error Standard, al del diseño complejo. Generalmente esto implica reducir el tamaño muestral basado en el número de entrevistas efectivas, a un tamaño muestral efectivo (equivalente al que se necesitaría en muestreo aleatorio simple para lograr igual error standard).

Respecto a las limitaciones del programa en cuanto al tamaño de las tablas de contingencia que puede importar, estas no tienen límites.

Volver

CELDA NUMERO 6

EL COEFICIENTE C DE CRAMER

SITUACIONES DE USO(continuación)

84

A continuación presentaremos un ejemplo de una tabla de contingencia de 3 por 6, vale decir una de las variables, nominal, la que podríamos llamar dependiente, posee 3 alternativas de respuesta, cruzada con una variable, también nominal, pero con 6 alternativas de respuesta, las que en la tabla a continuación titulamos como categorías.

El estadígrafo C de Cramer puede ir de un mínimo de 0 a un máximo de 1. Esto a diferencia del coeficiente de correlación de Pearson, el cual va de -1 a +1.

Es lógico que en este caso, el de correlación de variables nominales, no se hable de coeficiente de asociación con signo, puesto que al no ser numéricas las variables cuya asociación se está estudiando, no podemos hablar de relación negativa o positiva. Simplemente podemos hablar de la existencia o inexistencia de relación entre ellas.

Volver

CELDA NUMERO 6

EL COEFICIENTE C DE CRAMER

SITUACIONES DE USO(continuación

85

Puesto que el estadígrafo C se distribuye asintóticamente como un Chi-Cuadrado, se utiliza esta distribución para el cálculo de la probabilidad de obtener valores empíricos del coeficiente C. Igualmente obtenemos el valor crítico del χ2 para el nivel de significancia escogido. Si el valor empírico obtenido es superior al crítico, se acepta la Hipótesis de relación entre las variables, utilizando el valor del coeficiente C como una aproximación al nivel de relación entre ellas. En cambio, si el χ2 empírico obtenido es inferior al valor crítico, aceptamos la Hipótesis Nula de independencia entre las variables.

Debemos recordar que cuando aceptamos la Hipótesis alternativa que postula que hay relación entre las variables, estamos sujetos a una probabilidad menor a alfa de cometer un error al desechar la Hipótesis Nula de independencia entre las variables.

En el primer ejemplo que aquí presentamos, el coeficiente C de Cramer que se obtuvo es de 0.51 valor que sugiere un moderado grado de relación entre las variables. Sin embargo, antes de aceptar esta relación, conviene efectuar el test de hipótesis respectivo. Como se observa, la probabilidad de obtener un valor del X2 de 75.25 como el registrado, bajo el supuesto de que la hipótesis de la independencia fuera cierta es , para todos los efectos prácticos, nula, y muy por debajo del nivel de significancia escogido, el cual de por sí ya era muy bajo (0.001), por lo cual no hay temor en aceptar la dependencia entre las variables

Volver

86Volver

87Volver

88

Volver

CELDA NUMERO 6

EL COEFICIENTE Phi PARA TABLAS DE 2 x 2

SITUACIONES DE USO

89

Este test es sumamente útil para analizar tablas de contingencia en que ambas variables pertenecientes a una misma muestra, se presentan como datos discretos (nominales u ordinales) DICOTÓMICOS y se desea analizar el grado de relación existente entre ambas utilizando para ello las frecuencias absolutas de las celdas de la tabla.

Como en el test anterior la muestra (única en este caso) debe ser aleatoria simple, o, si se trata de una muestra probabilística compleja, se debe divisar un método de simplificación, calculando el “efecto del diseño” y simplificando los datos de tal modo de lograr una tabulación virtual equivalente a una muestra aleatoria simple cuyo tamaño muestral sea equivalente en cuanto a error Standard, al del diseño complejo. Generalmente esto implica que la fórmula utiliza un tamaño muestral menor al número de personas efectivamente entrevistadas.

Respecto a las limitaciones del programa en cuanto al tamaño de las tablas de contingencia que puede importar, estas deben ser de 2 x 2.

Volver

90

A continuación presentaremos un ejemplo de una tabla de contingencia de 2 x 2, vale decir cada variable, nominal, es dicotómica.

El estadígrafo rΦ puede ir de un mínimo de 0 a un máximo de 1. Esto a diferencia

del coeficiente de correlación de Pearson, el cual va de -1 a +1.Es lógico que en este caso, el de correlación de variables nominales, no se hable de coeficiente de asociación con signo, puesto que al no ser numéricas las variables cuya asociación se está estudiando, no podemos hablar de relación negativa o positiva. Simplemente podemos hablar de la existencia o inexistencia de relación entre ellas.

Volver

91Volver

92Volver

CELDA NUMERO 6

EL COEFICIENTE DE ACUERDO “K” DE KAPPA

SITUACIONES DE USO

93

Este test es sumamente útil para analizar situaciones en los que “k” objetos deben ser ubicados por “n” jueces en alguna de “m” ubicaciones alternativas categóricas (no ordinales).En este caso, cada uno de los jueces tiene que analizar separadamente, cada uno de los “k” objetos, los que debe clasificar en cualquiera de las “m” ubicaciones presentadas.Cuando decimos “separadamente”, nos referimos que cada juez, idealmente, debe hacer la clasificación de cada uno de los “k” objetos sin ser influido por la presencia de los otros “n-1” jueces (es decir sin saber cómo clasifica cada uno de ellos a cada objeto. Al mismo tiempo, cada juez debe clasificar cada objeto sin ser influido por la forma en que clasifica cada uno de los restantes objetos.Esta forma de proceder permite total libertad de clasificación, pudiéndose, al menos en teoría, clasificar varios objetos en una misma categoría, o incluso todos los objetos en la misma categoría, o distribuirlos entre las distintas categorías.En otras palabras, los “k” objetos son analizados por cada uno de los “n” jueces (o personas entrevistadas).Un ejemplo de esto podría ser un conjunto de “k” psicólogos que deben clasificar a cada uno de “k” pacientes y ubicar a cada uno de ellos en alguna de las “m” categorías de clasificación, y esta decisión de cada psicólogo debe ser llevada a cabo sin la presencia de los restantes psicólogos ni de los restantes pacientes.A continuación presentamos un ejemplo, con 29 objetos a ser clasificados por 4 jueces, pudiéndose otorgar a cada objeto una puntuación (categoría de clasificación) entre 1 y 5

Volver

94

Volver

95

Volver

96

Volver

CELDA NUMERO 6

EL COEFICIENTE DE ASOCIACION ASIMETRICA LB DE LAMBDA

SITUACIONES DE USO

97

Este coeficiente es sumamente útil para analizar situaciones en las que se desea averiguar si existe una relación unívoca entre 2 variables nominales, de tal modo que, al conocer los valores que asume la variable A, se pueda disminuir el error de predicción de los valores que asumirá la variable B, o viceversa. Este coeficiente tiene la ventaja de que nos proporciona exactamente la proporción en la que disminuye este error de predicción en una tabla de contingencia de r x k. En este sentido este coeficiente es superior al C de Cramer, cuando existe la presunción de que una de las variables puede considerarse como “antecedente” y la otra variable puede considerarse como la “consecuente”.

Propiedades de LB:

1.- Varía entre 0 y 1. Si el parámetro λB estimado por LB tiene el valor de 0 significa que el conocer la variable A no tiene valor alguno al momento de querer predecir el valor de la variable B, en tanto que un valor de λB = 1 implica una predictibilidad perfecta puesto que para un determinado valor de la variable A sólo existe un posible valor de la variable B. 2.- En la tabla de contingencia ésto ( es decir que λB = 1) se traduce que en cualquiera de las columnas de la tabla, sólo hay una celda diferente a cero, vale decir, todas las frecuencias en dicha columna se concentran en una sola celda que corresponde a una de las categorías de la variable nominal B siendo las restantes celdas de la columna iguales a cero.3.- El valor de LB no se ve afectado por ningún cambio en la permutación de columnas o filas, puesto que el ordenamiento de las variables en la tabla , al ser nominales, no inciden en el valor del coeficiente

Volver

CELDA NUMERO 6

EL COEFICIENTE DE ASOCIACION ASIMETRICA LB DE LAMBDA

SITUACIONES DE USO(continuación)

98

Debe entenderse que el uso de este coeficiente sólo es recomendable en el caso que una de las variables (la que llamaremos A) puede ser considerada como “antecedente” de la otra (la que llamaremos B), y lo que se desea es obtener información cuantitativa sobre la reducción en el error de predictabilidad de la variable B, al conocerse a priori los valores que asume esta variable “antecedente” A. Por supuesto, el programa también provee la posibilidad de desear cambiar los papeles de las variables, es decir, definir a la variable B como “antecedente” para predecir el valor de la variable A con menor error de predictibilidad.Aclararemos con un ejemplo numérico estos conceptos.

Volver

99

Volver

100

Volver

101

Volver

CONCLUSIONES Y COMENTARIOS

102

Obsérvese que si no conocemos los valores que asume la variable A, diríamos que la probabilidad de obtener un valor B3 de la variable B, si extraemos una persona aleatoriamente del total de 60 personas, sería de 17/ 60 = 0.283. La probabilidad de que la persona extraída aleatoriamente tenga otro valor, distinto a B3, sería, por lo tanto, de 0.717, y si predecimos, antes de la extracción de la persona por supuesto, que esa persona tendrá un valor B3 tendremos una probabilidad de error del 71.7%

Sin embargo, conociendo, por ejemplo, que la persona extraída aleatoriamente tiene un valor A2 en lo que dice respecto a la variable A, diríamos que la probabilidad de que esa persona tenga un valor B3 sería ahora de 12 / 19 = 0.632, con una probabilidad de errar del 36.8% solamente.

Similarmente, si la persona extraída aleatoriamente tuviera un valor A1 en la variable A, y después de conocer ese valor predijéramos su valor en cuanto a la variable B3, diríamos, de acuerdo a los datos de la tabla de contingencia obtenida de un estudio probabilístico, que sólo un séptimo de las personas

( 14.3%) con código A1 tendrán un valor de B3 en la variable B, en lugar del 28.3% que diríamos antes de conocer los resultados del estudio en base a tablas con los cruces de las variables (17 / 60).

Volver

CONCLUSIONES Y COMENTARIOS(CONTINUACIÓN)

Si la variable A no fuera predictora de la variable B, y fueran más bien independientes, no podríamos afinar así nuestras predicciones, por lo cual resulta interesante conocer en cuánto se reduce el error al conocer el valor de la variable A.Si la tasa de reducción de error es mínima o nula, no aporta al análisis de nuestro estudio, el cruzar ambas variables en el procesamiento computacional de la encuesta.

En el ejemplo que vimos, un Lambda de 0.3 significa que al conocer el valor de la variable A, reducimos en un 30% la probabilidad de cometer un error al predecir el valor de la variable B

103

Volver

104

CELDA N° 7

UNA MUESTRA

VARIABLE : ORDINAL

Tests :

1.- Test de Kolmogorov-Smirnov

2.- Test del punto de cambio de tendencia

3.- Test de rachas

Volver

CELDA NUMERO 7

TEST DE KOLMOGOROV – SMIRNOV

SITUACIONES DE USO

105

Este test es sumamente útil para estimar en qué medida distribuciones empíricas obtenidas de una muestra aleatoria se aproximan a distribuciones teóricas. En base al resultado obtenido de este test se puede presumir que la distribución subyacente de la variable estudiada se distribuye de acuerdo a una distribución teórica.El test de Kolmogorov-Smirnov asume que la variable en estudio está medida al menos en una escala ordinal y que la variable subyacente a ella se distribuye en una escala contínua.

Volver

Ejemplo

Se acumuló información sobre la duración, en días, de 840 huelgas en el Reino Unido a contar de 1965.

A partir de ciertos modelos matemáticos, se elaboró una distribución estadística teórica y se quiso comprobar si la distribución empírica podía considerarse como ajustada a dicho modelo

106

Volver

107Volver

108

Volver

109Volver

CELDA NUMERO 7

TEST DEL PUNTO DE CAMBIO DE TENDENCIA

SITUACIONES DE USO

110

Este test es útil para estimar si existe algún punto de inflexión en una secuencia de eventos dicotómicos. En el caso de una secuencia de eventos medidos a través de una variable cuantitativa (ordinal, de intervalo o de razón), el test no sólo mide si existe un punto de inflexión, sino que además lo localiza.Debe ser recordado que cuando la serie se basa en una muestra aleatoria, este punto de cambio o inflexión puede quedar oculto por las fluctuaciones temporales aleatorias propias de una muestra probabilística.Durante el experimento, el investigador puede introducir ‘ruido’ al sistema, como por ejemplo un incentivo, o un desincentivo, etc.

Volver

111

Se subentiende que los datos pueden ser considerados como una secuencia temporal, y que la variable medida es binaria (dicotómica) o contínua, y mientras la hipótesis nula establece que no ha ocurrido ningún cambio a lo largo de toda la secuencia, la hipótesis alternativa establece que sí hubo un cambio en algún lugar de la serie -- lugar que el programa computacional detecta, como se ha dicho, cuando la variable es cuantitativa -- y que este cambio se considera como tal sólo cuando resulta ser significativo estadísticamente.Para ilustrar la aplicación de este test, se presentarán a continuación 2 ejemplos, uno de ellos utilizando una variable dicotómica y el otro utilizando una variable contínua.

Volver

EJEMPLO 1

112

Dos encuestadores fueron seleccionados para un experimento que consistía en verificar si efectivamente una falta de motivación, en este caso económica, podía afectar su rendimiento medido a través de la tasa de entrevistas logradas.

A cada uno de ellos se le entregó una lista consistente en una muestra aleatoria de 240 personas.

Al encuestador “A” se le ofreció pagar $ K por entrevista lograda a lo largo de las 240 intentos.

Al encuestador “B” se le dijo que se le iba a pagar también $ K por entrevista lograda, pero luego de 120 personas contactadas, se le iba a reducir el pago en un 20%.

Volver

ENCUESTADOR “A”

113

Volver

114

Volver

ENCUESTADOR “B”

115

Volver

116

Volver

CONCLUSION

117

Volver

Al comparar los tests para ambos encuestadores, se observa que en el caso del encuestador “A”, el resultado fue que se aceptaba la hipótesis nula de NO cambio en la tasa de logros durante el transcurso de la secuencia de 240 entrevistas. De esto se puede deducir que al no cambiar los honorarios por entrevista lograda durante el transcurso de los 240 intentos de entrevista, la motivación del encuestador se mantuvo constante. El no cambiar los honorarios lleva implícito el hecho de no introducir “ruido” al sistema.

En cambio, en el caso del encuestador “B”, el resultado del test arrojó que se aceptaba la hipótesis alternativa de un cambio en la secuencia en cuanto a la tasa de logros, de lo que se puede desprender que la baja de honorarios apartir de la entrevista N° 121 afectó su motivación, lo que a su vez, motivó la baja en la tasa de entrevistas logradas. En este caso, se introdujo “ruido” al sistema, el que consistió en el desincentivo de bajar los honorarios durante el transcurso de la secuencia

EJEMPLO 2

En un experimento se le pidió a un trabajador elaborar 25 items de un mismo producto mediante un nuevo sistema, anotándose para cada uno de estos items el tiempo que le tomaba completar cada unidad.El investigador partió del supuesto que no debiera haber cambios en el tiempo de elaboración de cada item durante el transcurso del experimento, salvo cambios aleatorios previsibles.

La hipótesis alternativa era que sí iba a haber un cambio en algún momento de la secuencia de elaboración, debido probablemente a una corta curva de aprendizaje.

Se desea saber cuál de las 2 hipótesis era la correcta, y si fuera la hipótesis alternativa la correcta, entonces se desea saber en qué momento se produjo el cambio.

118

Volver

119

Volver

120

Volver

121

Volver

CELDA NUMERO 7

TEST DE RACHAS

SITUACIONES DE USO

122

Este test se utiliza para detectar si los resultados de una encuesta pueden considerarse como provenientes de una muestra aleatoria simple.

Los valores ingresados deben corresponder a los de una variable nominal, pero acepta variables medidas en escala ordinal o intervalar, las que el programa luego dicotomiza.

En el caso de variables ordinales, por ejemplo, el programa calcula la Mediana de los valores y luego observa para cada unidad muestral si el valor de la variable para dicha unidad está por sobre la Mediana (codifica un “+”) o bajo la Mediana (codifica un “ - ”).Con este método, dicotomiza la variable ordinal.En este tipo de tests, es importante el orden en que se van detectando los resultados, vale decir el orden en que van apareciendo los signos “+” y los “-” .El programa determina si los resultados pueden o no considerarse como independientes unos de otros, lo que confirmaría la calidad aleatoria de la muestra, o llegaría a la conclusión que hay demasiadas (o muy pocas) agrupaciones o sucesiones homogéneas.

Volver

CELDA NUMERO 7 TEST DE RACHAS

SITUACIONES DE USO (CONTINUACIÓN)

123

Luego se contabiliza cuántas sucesiones hubo, (considerando todas las sucesiones, tanto de “+” como de “-”).

Por ejemplo, en el lanzamiento de 20 monedas, un lanzamiento tras otro, se anotan los resultados y se obtiene :

CCCCCCCCCCSSSSSSSSSS

Es decir , son 2 sucesiones, una de 10 “caras” seguidas y luego otra de 10 “sellos” seguidos. Este resultado por supuesto arroja muchas dudas sobre la característica de aleatoriedad de la muestra de lanzamientos (o del lanzador).

Volver

En una muestra de 24 entrevistas a alumnos de un internado, con sólo 2 entrevistas diarias, se desea

detectar si con este método de entrevistas, vale decir, sólo 2 entrevistas diarias, y puesto que se trata de un internado, existe “contaminación” entre los alumnos

ya entrevistados y aquellos por entrevistar.

Si la contaminación existe, se supone que se puede detectar con este test, por una alteración en la

aleatoriedad en el orden de las respuestas a lo largo de los 12 días que tomaría la encuesta a los 24

alumnos. Cada entrevistado obtiene un puntaje en relación a determinada pregunta, y ese puntaje se transforma en un código que significa un “+” o un “-”, de acuerdo a si dicho puntaje está por sobre o

por debajo de la mediana, respectivamente.124

Volver

Si se detecta una alteración a lo considerado como una secuencia aleatoria de signos “+” y “-”, se llegaría a la conclusión que los puntajes obtenidos por los alumnos están contaminados por lo que escuchan de los alumnos que ya han sido entrevistados anteriormente, y por lo tanto la encuesta se puede (o mejor dicho, se debe) considerar sesgada y no fiable.

125

Volver

En este tipo de tests, si la muestra es de 40 casos o menos, el nivel de significancia con el que se entregan los resultados es del 5% ; para muestras mayores, el investigador puede elegir el nivel de significancia que desea, puesto que el test usado es la aproximación Normal, y se desecha el uso de la tabla ad-hoc utilizada para el caso de muestras menores a 40, la que sí presenta sus resultados a niveles de significancia del 5% exclusivamente.

126

Volver

127

Volver

128

Volver

Ejemplo 2:

En una fila de 50 personas esperando para comprar su ticket para entrar al cine, un investigador desea averiguar si el orden de las personas en la fila puede considerarse aleatorio en cuanto al sexo de ellas.

Para estos efectos anota tal cual, y en el orden en que están formados, el sexo de las 50 personas, y obtiene el siguiente resultado

129

Volver

130Volver

131Volver

132

Volver

CELDA N° 8

MUESTRAS : PANEL VARIABLE : ORDINAL

Tests :

1.- Test del Signo

2.- Test de rankings con signo, de Wilcoxon

133

Volver

CELDA NUMERO 8

TEST DEL SIGNO

USO EN UN PANEL DE PERSONASSITUACIONES DE USO

134

Este test es útil para estimar si existe un cambio en la opinión de la gente entre dos mediciones. Se entiende que la variable sobre la que se mide la opinión tiene un nivel superior al de una variable nominal, es decir, es al menos una variable ordinal, la que a su vez puede estar medida sobre una variable subyacente que puede ser intervalar o de razón.A continuación se presentan 2 ejemplos.El primero está basado en una muestra de 17 entrevistas, número inferior a 35 casos, el cual es el límite entre 2 algoritmos distintos usados para el mismo fin.El segundo ejemplo consta de 100 entrevistas iniciales, de las cuales 15 no cambiaron su opinión de una ocasión a la otra. En este segundo ejemplo, el algoritmo se basa en la Distribución Normal

Volver

EJEMPLO 1

135Volver

EJEMPLO 1(continuación)

136Volver

EJEMPLO 1(continuación)

137Volver

EJEMPLO 2(Debido a razones de espacio, sólo se presentarán los 20 primeros casos de la tabla de 100)

138

Volver

EJEMPLO 2(continuación)

139

Volver

EJEMPLO 2(continuación)

140

Volver

(Debido a razones de espacio, sólo se presentarán los 20 primeros casos de la tabla de 100)

EJEMPLO 2(continuación)

141

Volver

EJEMPLO 2(continuación)

142

Volver

CONCLUSIONESEn ambos ejemplos se llegó a la conclusión que hubo cambios entre ambas mediciones del panel respecto a la variable ordinal investigada.En el segundo ejemplo se presentó la tabla original truncada por razones de espacio. Sin embargo, la opción está dada para presentar tablas de cualquier tamaño, cuando se desee.Nótese que en el primer ejemplo el test se condujo con la fórmula exacta binomial. En el segundo ejemplo, se utilizó la aproximación Normal la que produce valores muy similares a la fórmula binomial exacta. La ventaja de la aproximación Normal es que permite trabajar sin forzar el kernel del programa, con tamaños muestrales de hasta varios miles de casos.

143

Volver

CELDA NUMERO 8

TEST DE RANKINGS CON SIGNO DE WILCOXON

SITUACIONES DE USO EN UN PANEL DE PERSONAS

144

Este test es similar al anterior ( test del signo) , pero es más útil que él, pues además de estimar la DIRECCION del cambio, toma en consideración la MAGNITUD de los cambios de una medición a la siguiente para cada persona o unidad. En otras palabras, otorga una ponderación mayor a aquellos cambios que muestren una mayor diferencia numérica entre ambas mediciones. Se entiende que la variable sobre la que se mide la opinión tiene un nivel superior al de una variable nominal, es decir, es al menos una variable ordinal la que a su vez puede estar medida sobre una variable subyacente que puede ser intervalar o de razón.

Volver

145

Volver

Cabe hacer notar que no hay restricciones en materia de tamaño muestral, pudiendo el test ser usado desde muestras de tamaño 3, hasta muestras de cientos o hasta miles de unidades muestrales finales (generalmente personas).Puesto que se trata de un panel, ambas mediciones pueden ser realizadas en un mismo momento, pero sobre dos variables distintas,o sobre una misma variable en dos momentos separados por el tiempo, para detectar eventuales cambios ocurridos entre ambas ocasiones.En el primer caso, medición de dos variables en un mismo momento, podríamos tratar de medir si la población objetivo detecta diferencias entre dos sabores de un producto, por ejemplo, o si dos tratamientos rinden resultados similares, o comparar notas otorgadas a dos políticos.En el caso de medir una misma variable en dos momentos en la escala temporal, el objetivo del análisis consistiría en averiguar, por ejemplo, cambios eventuales en la percepción de un político, o de un programa, etc.

A continuación se presentarán 2 ejemplos.

El primero está basado en una muestra de 12 entrevistas, número inferior a 15 casos, el cual es el límite entre 2 algoritmos distintos usados para el mismo fin. La finalidad hipotética es la de medir si la población representada por la muestra distingue entre dos sabores de un producto.

El segundo ejemplo, es un estudio de Opinión Pública en el que , hipotéticamente, se evalúa la aprobación del Gobierno por la población en dos mediciones consecutivas - en la práctica no necesitan ser consecutivas - y consta de 30 entrevistas.En este segundo ejemplo las variables están medidas en notas de 1 a 10, pero debe entenderse que no hay limitaciones de ninguna especie en cuanto a la escala en la que están medidas las variables, tal como se aprecia en el primer ejemplo. Obviamente, puede también utilizarse la escala común de notas de 1 a 7, o una variable medida en una escala intervalar. El programa se encarga luego de transformarla en una variable ordinal y luego ordenar los valores en un ranking de menor a mayor.Debido a su amplia aplicación, este test es muy útil tanto en Estudios de Mercado como en Estudios de Opinión Pública

146

Volver

Primer Ejemplo : Estudio de MercadoNivel de aprobación de dos sabores alternativos de una bebida gaseosa

147

Volver

Primer Ejemplo :(continuación)

148

Volver

Primer Ejemplo :(continuación)

149

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos)

150

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos)(continuación)

151

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos)(continuación)

152

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos)(continuación)

153

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos): (continuación)

154

Volver

Segundo Ejemplo :Estudio de Opinión Pública : Evaluación del Gobierno –(Notas de 1 a 10)Muestra Panel con mediciones en Mayo y Julio del año 2009 -- (valores hipotéticos):

(CONCLUSIONES)

Del test precedente se deduce que hubo un cambio positivo y estadísticamente significativo en la evaluación del Gobierno entre Mayo y Julio del 2009, existiendo sólo una probabilidad del 0.00014 de equivocarnos al afirmar que la evaluación mejoró entre ambos meses

155

Volver

CELDA N° 9

MUESTRAS : 2 MUESTRAS INDEPENDIENTESVARIABLE : ORDINAL

Tests :

1.- Test de la Mediana2.- Test de Wilcoxon-Mann-Whitney3.- Test robusto de orden de rankings4.- Test de dos muestras de Kolmogorov-Smirnov5.- Test de Siegel-Tukey para diferencias de escala

156

Volver

157

Volver

CELDA N° 9

MUESTRAS : 2 MUESTRAS INDEPENDIENTESVARIABLE : ORDINAL

Tests :

1.- Test de la Mediana2.- Test de Wilcoxon-Mann-Whitney3.- Test robusto de orden de rankings4.- Test de dos muestras de Kolmogorov-Smirnov5.- Test de Siegel-Tukey para diferencias de escala

CELDA NUMERO 9

TEST DE LA MEDIANA

SITUACIONES DE USO

USO : EN DOS MUESTRAS INDEPENDIENTES

Este test consiste en un procedimiento para evaluar si dos grupos difieren en sus Medianas. Las dos muestras no necesitan ser del mismo tamaño. Si las dos muestras combinadas suman menos de 60 casos, el programa usa automáticamente el algoritmo del test exacto de Fisher; de otro modo, el programa utiliza la distribución del Chi-Cuadrado puesto que la distribución del estadígrafo resultante del test se aproxima asintóticamente a la distribución del Chi-Cuadrado. La Hipótesis Nula postula que ambas muestras provienen de una misma población estadística, o de dos poblaciones distintas pero con iguales medianas.La Hipótesis Alternativa puede ser cualquiera de las tres siguientes:1.- La mediana de la población A es mayor a la de la población B2.- La mediana de la población B es mayor a la de la población A3.- Ambas medianas son diferentes

Los puntajes utilizados para medir las variables deben ser a lo menos ordinales 158

Volver

Debe señalarse que este test es a menudo el único que se debe utilizar, especialmente cuando los puntajes en las muestras contienen valores que se sospechan “outliers” o por otras causas que podrían quitarle validez a tests basados en la “media” en lugar de la “mediana”

159

Volver

A continuación se presentarán dos ejemplos con tamaños muestrales reducidos, mostrando el output para cada uno de ellos con el algoritmo apropiado a su tamaño muestral total (combinación de ambas muestras).En el primer ejemplo, el tamaño muestral será de 39 casos, utilizándose el algoritmo del test exacto de Fisher.En el segundo caso, el tamaño muestral será de 78 casos, utilizándose el algoritmo basado en la Distribución del Chi-Cuadrado

160

Volver

161

Volver

Ejemplo 1 :Se aplicarán, en dos Universidades distintas, dos metodologías alternativas para la enseñanza del Inglés. Después de 5 años, se realizará en ambas Universidades un examen para evaluar los resultados de ambas metodologías.El experimento se basa, entre otros supuestos, en que la capacidad, conocimientos previos del idioma inglés y capacidad de aprendizaje son iguales en ambas Universidades, de modo que los resultados del examen sólo evaluarán lo que realmente importa : la eficiencia comparativa de ambas metodologías de enseñanza. En este ejemplo, se seleccionaron 23 cursos de la Universidad “A” y 16 cursos de la Universidad “B”. Las notas que se mostrarán son las notas promedio de cada curso. Debido a las características de la evaluación, con notas bastante subjetivas, se prefiere respetar las características ordinales de las notas en desmedro de su puntaje original.

Ejemplo 2 :Tal como en el ejemplo anterior, se aplicarán, en dos Universidades distintas, dos metodologías alternativas para la enseñanza del Inglés. Después de 5 años, se realizará en ambas Universidades un examen para evaluar los resultados de ambas metodologías.El experimento se basa, entre otros supuestos, en que la capacidad, conocimientos previos del idioma inglés y capacidad de aprendizaje son iguales en ambas Universidades, de modo que los resultados del examen sólo evaluarán lo que realmente importa : la eficiencia comparativa de ambas metodologías de enseñanza.

En este ejemplo, se seleccionaron 46 cursos de la Universidad “A” y 32 cursos de la Universidad “B”. Las notas que se mostrarán son las notas promedio de cada curso. Debido a las características de la evaluación, con notas bastante subjetivas, se prefiere respetar las características ordinales de las notas en desmedro de su puntaje original.Nótese que, a diferencia del ejemplo anterior, las notas que se presentan no están ordenadas de mayor a menor, vale decir, se demuestra que el ingreso puede ser efectuado en el orden original de los resultados, sin necesidad de un “sort” inicial de ellos. Puesto que el tamaño muestral combinado es superior a los 60 casos, el algoritmo será diferente al utilizado en el ejemplo anterior

162

Volver

Ejemplo 1:

163

Volver

Ejemplo 1: (continuación)

164

Volver

Ejemplo 1: (continuación)

165

Volver

Ejemplo 1: (continuación)

166

Volver

Ejemplo 1: (continuación)

167

Volver

Ejemplo 1: (continuación)

168

Volver

CONCLUSIONES

Puesto que se aceptó la Hipótesis Alternativa, se deduce que la metodología de enseñanza aplicada en la Universidad “A” arrojó muchos mejores resultados que en la Universidad “B”, con una proporción de notas significativamente por sobre la Mediana común en la primera Universidad.

NOTA: La presentación de la pantalla con la totalidad de las subtablas intermedias es opcional.

169

Volver

Ejemplo 2:

170

Volver

Ejemplo 2: (continuación)

171

Volver

Ejemplo 2: (continuación)

172

Volver

Ejemplo 2: (continuación)

173

Volver

Ejemplo 2: (continuación)

174

Volver

CONCLUSIONES

Puesto que se aceptó la Hipótesis Alternativa, se deduce que la metodología de enseñanza aplicada en la Universidad “A” arrojó muchos mejores resultados que en la Universidad “B”, con una proporción de notas significativamente por sobre la Mediana común en la primera Universidad.

175

Volver

Este test consiste en un procedimiento para evaluar si dos grupos difieren entre sí. Las dos muestras no necesitan ser del mismo tamaño. Se parte del supuesto básico, bajo la Hipótesis Nula, que las distribuciones estocásticas de ambas poblaciones son idénticas.

La Hipótesis Nula postula que ambas muestras provienen de una misma población estadística, o de dos poblaciones distintas pero con iguales medianas y varianzas.

A diferencia del Test de la Mediana, este Test utiliza mayor información proveniente de los datos, puesto que no se conforma con determinar cuántas observaciones están sobre y debajo de la Mediana, sino que establece un ranking basado en el total de los casos, lo que no ocurre en el caso del Test de la Mediana, por lo cual éste es un test más poderoso y se recomienda su aplicación especialmente cuando se sospecha que las diferencias entre las medias de ambas poblaciones no se distribuyen de acuerdo a la Curva Normal ; de lo contrario y si las variables bajo investigación pertenecen a una escala intervalar y son confiables, se podría utilizar el Test del “t” de Student para dos muestras independientes.

176

Volver

Test de Wilcoxon-Mann-Whitney

CELDA NUMERO 9

TEST DE WILCOXON-MANN-WHITNEY USO : EN DOS MUESTRAS INDEPENDIENTES

SITUACIONES DE USO (continuación)

177

La Hipótesis Alternativa puede ser cualquiera de las tres siguientes:

1.- La mediana de la población A es mayor a la de la población B2.- La mediana de la población B es mayor a la de la población A3.- Ambas medianas son diferentes

Los puntajes utilizados para medir las variables deben ser a lo menos ordinales A continuación se presentará el mismo ejemplo que el utilizado con el Test de la Mediana como Ejemplo 1, es decir, se quiere detectar si un método de enseñanza es superior a otro, basándose en su aplicación en dos Universidades distintas, pero con alumnos que se puede afirmar tienen el mismo nivel intelectual. El total de cursos y los datos son exactamente los mismos que los utilizados en el Ejemplo 1 con el Test de la Mediana

Volver

Ejemplo 1

178

Volver

Ejemplo 1: (continuación)

179

Volver

Ejemplo 1: (continuación)

180

Volver

Ejemplo 1: (continuación)

181

Volver

CONCLUSIONESTal como se detectó con el Test de la Mediana, también con este Test se llegó a la conclusión de aceptar que el método de enseñanza aplicado en la Universidad “A” es superior al método aplicado en la Universidad “B”, al menos basándonos en los resultados de su aplicación en ambas universidades,Obsérvese sí, que con el Test de la Mediana , la probabilidad de obtener los resultados de dicho test, suponiendo igualdad entre ambos métodos de enseñanza (Hipótesis Nula), al nivel de significancia del 0.01, es decir, permitiéndonos una probabilidad de un 1% de equivocarnos al rechazar la Hipótesis Nula, fue de un 0.00088, vale decir, la probabilidad de errar al rechazar la Hipótesis de la igualdad, fue mucho menor a la probabilidad aceptada del 0.01.

Con el Test de Wilcoxon, el resultado fue aún más categórico, con una probabilidad de errar del 0.00060.Esto se debe, como se dijo, a que este método aprovecha mejor la información, al considerar el ranking de ambas muestras combinadas, y no solamente cuantos casos en cada muestra están por sobre o por debajo de la Mediana común.

182

Volver

CELDA NUMERO 9

TEST ROBUSTO DE ORDEN DE RANKINGS

USO : EN DOS MUESTRAS INDEPENDIENTES

SITUACIONES DE USO

Este test consiste en un procedimiento con objetivos similares al Test WMW ( Wilcoxon-Mann-Whitney) pero con la diferencia que en este test no se exige igualdad de varianzas de ambas poblaciones. Cuando se crea que esta es la situación, es preferible usar este test.

Las dos muestras no necesitan ser del mismo tamaño pero su tamaño total combinado debe ser mayor a 24.Se parte del supuesto básico, bajo la Hipótesis Nula, que las muestras son independientes y que las mediciones de las variables están al menos en la escala ordinal.

La Hipótesis Nula postula que ambas muestras provienen de una misma población estadística, o de dos poblaciones distintas pero con iguales medianas.

La Hipótesis Alternativa puede ser cualquiera de las tres siguientes:

1.- No hay diferencia entre ambas Poblaciones2.- La mediana de la población B es mayor a la de la población A o viceversa3.- Ambas medianas son diferentes

Los puntajes utilizados para medir las variables deben ser a lo menos ordinales

A continuación se presentará el mismo ejemplo de los métodos de enseñanza, ya analizados con el Test de la Mediana y el Test WMW

183

Volver

EJEMPLO 1:

184

Volver

EJEMPLO 1: (continuación)

185

Volver

EJEMPLO 1: (continuación)

186

Volver

CONCLUSIONESTal como se detectó con el Test de la Mediana y el Test de WMW, también con este Test se llegó a la conclusión de aceptar que el método de enseñanza aplicado en la Universidad “A” es superior al método aplicado en la Universidad “B”, al menos basándonos en los resultados de su aplicación en ambas universidades,Obsérvese sí, que con el Test de la Mediana , la probabilidad de obtener los resultados de dicho test, suponiendo igualdad entre ambos métodos de enseñanza (Hipótesis Nula), al nivel de significancia del 0.01, es decir, permitiéndonos una probabilidad de un 1% de equivocarnos al rechazar la Hipótesis Nula, fue de un 0.00088, vale decir, la probabilidad de errar al rechazar la Hipótesis de la igualdad, fue mucho menor a la probabilidad aceptada del 0.01.

Con el Test de WMW, el resultado fue aún más categórico, con una probabilidad de errar del 0.0006.Con el método del Test Robusto de Rankings, la probabilidad de errar al rechazar la Hipótesis Nula de la igualdad cuando ésta es verdadera, baja aún más, hasta 0.0000056.Esto se debe, a que este método es menos restrictivo aún que el WMW, al no exigir igualdad de varianzas.

187

Volver

CELDA NUMERO 9

TEST DE KOLMOGOROV-SMIRNOV

USO : EN DOS MUESTRAS INDEPENDIENTES

SITUACIONES DE USO

Este test consiste en un procedimiento con objetivos similares a los anteriores de esta misma celda 9: (Tests de la Mediana, WMW, Robusto de rankings) con algunas pequeñas diferencias .

La Hipótesis Nula consiste en presuponer que ambas poblaciones son estocásticamente iguales. Cuando la Hipótesis Alternativa es unilateral, el test señala si puede aceptarse que una de las dos poblaciones es estocásticamente superior a la otra. En otras palabras, si puede aceptarse que los puntajes de la variable en la población A son superiores en general, a los puntajes de la población B, vale decir Prob{ XA>XB }> 0.5

Cuando la Hipótesis Alternativa es bilateral, se desea testear solamente si las distribuciones de ambas poblaciones son estocásticamente diferentes, sin presuponer una dirección determinada, como en el caso del la Hipótesis unilateral. En este caso, el test es extremadamente sensible a cualquier tipo de diferencia, ya sea en estadígrafos de posición ( Media, Mediana), de dispersión(varianza), de asimetrías y de kurtosis, lo que lo hace ideal para medir diferencias entre dos distribuciones

Tal como en los tests precedentes, las dos muestras no necesitan ser del mismo tamaño, pero cada una de ellas debe tener al menos 25 casos.

Se parte del supuesto básico, bajo la Hipótesis Nula, que las muestras son independientes y que las mediciones de las variables están al menos en la escala ordinal.

188

Volver

Ejemplo :En este ejemplo, un investigador desea averiguar si personas con una dosis alta de “autoritarismo” tienen una tendencia mayor que los de bajo “autoritarismo” a poseer estereotipos de personas de variados orígenes nacionales y étnicos (test unilateral). Para este ejemplo, se seleccionaron aleatoriamente 98 mujeres estudiantes de cierta Universidad. A cada una de ellas se le presentó una batería de 20 fotografías con rostros de personas, todas ellas mexicanas. Se pidió a cada una de las 98 estudiantes, que tratara de identificar cada fotografía con una de las nacionalidades que aparecían en una lista que contenía nacionalidades y orígenes étnicos (ninguno de los cuales era “mexicano”).El número de fotografías que cada una de las estudiantes “identificaba” se consideró un indicador de dicha persona a estereotipar.El grado de autoritarismo de cada una de las 98 participantes se midió con la escala “F” de autoritarismo, y las estudiantes se dividieron luego en 2 grupos, aquellas de bajo puntaje (bajo la Mediana combinada de las 98 estudiantes) y aquellas de alto puntaje(con puntaje igual o superior a la Mediana combinada), en esta escala “F”.Así es como quedaron 44 estudiantes en la muestra de personas de “Bajo Autoritarismo” y 54 en la muestra de personas de “Alto Autoritarismo”.La Hipótesis Nula consistía en que no habría diferencia entre ambos grupos en el número de fotografías “identificadas”.La Hipótesis Alternativa consistía en que las estudiantes de alto autoritarismo de esta Universidad “identificarían” más fotografías que las de bajo autoritarismo

189

Volver

EJEMPLO 1: (continuación)

190

Volver

EJEMPLO 1: (continuación)

191

Volver

EJEMPLO 1: (continuación)

192

Volver

CELDA NUMERO 9

TEST DE SIEGEL-TUKEY PARA DIFERENCIAS DE ESCALA

USO : EN DOS MUESTRAS INDEPENDIENTES

SITUACIONES DE USO

Este test intenta responder a la pregunta sobre la diferencia en variabilidad entre dos muestras independientes, bajo el supuesto que tienen igual Mediana.

Puede darse en una situación, por ejemplo, de dos cursos con igual nota promedio, pero con distinta heterogeneidad interna, Por ejemplo un curso muy homogéneo en sus notas individuales, y el otro con una gran o mediana variabilidad.

La Hipótesis Nula consiste en presuponer que ambas poblaciones tienen idéntica varianza.La Hipótesis Alternativa postula que una de las poblaciones posee mayor variabilidad ( tiene mayor varianza ) que la otra ( test unilateral), o que ambas varianzas son distintas ( test bilateral).

Las variables originales cuya variabilidad se desea medir, deben estar medidas en la escala intervalar. El programa se encarga luego de transformarlas a escala ordinal.

Este es un test de bajo poder, alrededor de 0.61 para tamaños muestrales pequeños y distribuciones normales, Además las Medianas de ambas poblaciones ( de las cuales fueron extraídas ambas muestras ), deben ser iguales, lo que obviamente muy raramente es conocido.

Debido a su bajo poder, este programa se presenta solamente para muestras sobre 10 casos cada una y utilizando el mismo algoritmo que para el test WMW

193

Volver

EJEMPLO

A continuación se presentará un ejemplo que trata el caso hipotético de dos cursos, el A y el C, cuyas notas en cierta asignatura tienen igual Mediana, pero se desea evaluar si la heterogeneidad al interior de ellos es similar, o si, por el contrario, se puede aceptar la Hipótesis Alternativa que el curso A tiene mayor variabilidad en sus notas que el curso C.Para estos efectos se extrae una muestra aleatoria de cada curso. Las muestras no necesitan ser del mismo tamaño.

194

Volver

Ejemplo:

195

Volver

(Continuación)

196

Volver

(Continuación)

197

Volver

CONCLUSIONES

Obsérvese que , a simple vista, el curso C muestra una mayor homogeneidad en sus notas en comparación con el grupo A, pero no es posible saber si esta diferencia puede considerarse estadísticamente significativa.

Este test probó que la diferencia en variabilidad entre ambas poblaciones de notas sí es estadísticamente significativa , al nivel del 5%

198

Volver

CELDA N° 10

MUESTRAS : k MUESTRAS PANELESVARIABLE : ORDINAL

Tests :

1.- Análisis de varianza por rangos, de Friedman2.- Test de Page para alternativas ordenadas

199

Volver

CELDA NUMERO 10

TEST DE FRIEDMAN ANALISIS DE VARIANZA POR

RANGOS

USO : EN “k” MUESTRAS PANELES

SITUACIONES DE USO Este test intenta responder a la pregunta sobre la diferencia entre “k” muestras paneles.

Este test puede aplicarse a una situación en la que una muestra panel mide una misma variable en “k” oportunidades distintas (consecutivas o no), y se desea saber si hubo cambios en el tiempo respecto a dicha variable y entre cuales pares de muestras se registró el cambio.

También se puede aplicar este test en un momento en el tiempo, cuando se desea medir si hay diferencias entre las “k” medianas de un panel al que se le aplican “k” pruebas (por ejemplo testear 4 sabores distintos de un producto y darles nota según su agrado).

Si el test original detecta que sí hay al menos una muestra, (en este ejemplo al menos un sabor) cuya nota Mediana sea distinta a las de las demás, el programa detecta entre cuales pares de variables (sabores en este ejemplo) se encuentra la diferencia

La Hipótesis Nula consiste en presuponer que las “k” distribuciones son idénticas.La Hipótesis Alternativa postula que al menos una de las distribuciones es distinta.

Las variables originales, deben estar medidas al menos en escala ordinal, pudiendo tener una escala subyacente intervalar.

200

Volver

EJEMPLO:

201Volver

EJEMPLO:

202Volver

EJEMPLO:

203Volver

EJEMPLO:

204Volver

CONCLUSIONES

El test detectó en primer lugar, que existe por lo menos un sabor que se escapa de la Hipótesis Nula de la igualdad entre los cuatro sabores.El programa luego efectúa el mismo test por pares, para los 6 pares de comparaciones que se pueden formar de los cuatro sabores.El Test finalmente detecta que el único sabor superior en sabor, según los respondientes, es el D en comparación con el C. Nada se puede decir respecto a las demás comparaciones pareadas.Obviamente, con una muestra mayor que la utilizada en este ejemplo, podrían surgir varias otras diferencias significativas, que ayudarían al investigador a tomar decisiones de Marketing racionales

205

Volver

CELDA NUMERO 10

TEST DE PAGE PARA ALTERNATIVAS ORDENADAS USO : EN “k” MUESTRAS PANELES

Este test , siendo similar al test de Friedman, va un paso más allá, al intentar detectar no sólo diferencias entre las “k” oportunidades o variables, sino que además, intenta responder a la pregunta sobre el signo de las diferencias entre los “k” resultados.

Así, mientras en el Test de Friedman la Hipótesis Alternativa se puede escribir como

Θ1 ≠ Θ2 ≠ Θ3 ≠…… ≠ Θ k

en el test de Page, la Hipótesis Alternativa se puede plantear como

Θ1 ≤ Θ2 ≤ Θ3 ≤ …… ≤ Θ k

Para que se acepte la Hipótesis Alternativa basta con que al menos una de las desigualdades sea absoluta, vale decir, sea estrictamente < (menor) y no ≤ (menor o igual).La Hipótesis Nula, como anteriormente, consiste en presuponer que las “k” distribuciones son idénticas, medido ésto a través de la comparación de las Medianas.Las variables originales, deben estar medidas al menos en escala ordinal, pudiendo tener una escala subyacente intervalar. 206

Volver

(continuación)

Las “k” MEDICIONES SE DEBEN EFECTUAR A UNA MISMA MUESTRA, EN OTRAS PALABRAS, A UNA MUESTRA PANEL, SIN ROTACION PARCIAL.

Para los efectos del test, el ordenamiento de los “k” grupos

debe efectuarse a priori. Obsérvese la utilidad de este test cuando las “k” mediciones son mediciones en el tiempo. En este caso, es fácil decidir a priori sobre el ordenamiento de los grupos

Tal como en el Test de Friedman, si el test original finaliza aceptando la Hipótesis Alternativa, es decir rechazando la igualdad de todas las Medianas, este programa revisa todas las comparaciones pareadas posibles de efectuar {k*(k-1)/2} , en busca de diferencias estadísticamente significativas en cada par, al nivel “alfa” impuesto por el investigador.

207

Volver

EJEMPLO :

Se presentará una serie de encuestas trimestrales cuyo objetivo consiste en

averiguar la aprobación del Gobierno por parte de la población adulta del país.

Se analizará una serie de 6 mediciones realizadas en el período de un año y

medio previo al análisis.

Los valores presentados son hipotéticos.

RECORDAR QUE SE TRATA DE 6 MEDICIONES EFECTUADAS A UNA MISMA MUESTRA EN 6

OCASIONES DISTINTAS

208

Volver

EJEMPLO

209

Volver

(continuación)

210

Volver

(continuación)

211

Volver

(continuación)

212

Volver

(Continuación)

213

Volver

CONCLUSIONES

Al analizar las 6 mediciones consecutivas, y leer las conclusiones del test, se observa que en primer lugar se detectó que sí existían diferencias significativas entre las mediciones, y que éstas en algún lugar implicaban que mediciones posteriores mostraban medianas mayores que mediciones anteriores.

El test luego analizó los 15 pares que se podían formar con los resultados de las 6 mediciones y encontró que :

La primera medición fue la menor, estocásticamente, de las 6 mediciones

La segunda medición, siendo superior a la primera, se detectó que era inferior, estocásticamente, a la 4ª

, 5ª y 6ª pero no a la 3ª

La 3ª es inferior a la 5ª

y a la 6ª pero no así a la 4ª

No se detectaron diferencias entre las 3 últimas mediciones, vale decir, la 4ª, 5ª y 6ª

De modo que puede decirse que la serie de 6 mediciones muestra una mejoría en la aprobación del Gobierno a través del tiempo, pero no muy marcada, especialmente no marcada entre las 3 últimas mediciones.

214

Volver

CONCLUSIONES(continuación)

Conviene recordar que, puesto que se trata de un panel, el tamaño muestral con el que se debe realizar el análisis es con el menor de los tamaños detectados a través de las mediciones, puesto que ese es el mínimo común denominador que se repite en todas las mediciones. El resto, que va quedando en el camino sin investigar, ya sea por rechazo debido a cansancio u otras razones, se pierde.

Esa es la razón por la que se debe intentar siempre mantener lo más completo posible el panel a través del tiempo, tal vez con incentivos especiales, y tratando que éstos no introduzcan sesgos en las respuestas

215

Volver

CONCLUSIONES(continuación)

Cabe destacar que si bien la muestra, en este ejemplo, es de 100 casos, en el output computacional sólo se presentan los primeros 20 casos, considerando que para los efectos de este ejemplo de output, la presentación de los datos originales completos es irrelevante.

Aun más, para efectos prácticos, este programa puede manejar muestras de miles de casos, situación en la cual el investigador tiene la opción de no imprimir la matriz de datos originales

216

Volver

CELDA N° 11

MUESTRAS : k MUESTRAS INDEPENDIENTES

VARIABLE : ORDINAL

Tests :

1.- Test extendido de la Mediana2.- Análisis de varianza de Kruskal-Wallis (One-way)3.- Test de Jonckheere para alternativas ordenadas

217

Volver

CELDA NUMERO 11

TEST EXTENDIDO DE LA MEDIANA

USO : EN “k” MUESTRAS INDEPENDIENTES

SITUACIONES DE USO

Este test , es similar al test de Friedman, pero en lugar de ser aplicado en el caso de “k” muestras paneles, se aplica para “k” muestras independientes.

La Hipótesis Nula consiste en presuponer que las “k” distribuciones son idénticas.La Hipótesis Alternativa postula que al menos una de las distribuciones es distinta.

Las variables originales, deben estar medidas al menos en escala ordinal, pudiendo tener una escala subyacente intervalar.

Así, mientras en la Hipótesis Nula se postula que

Θ1 = Θ2 = Θ3 =…… = Θ k

en la Hipótesis Alternativa se plantea

Θ1 ≠ Θ2 ≠ Θ3 ≠ …… ≠ Θ k

Para que se acepte la Hipótesis Alternativa basta con que al menos una de las desigualdades se cumpla, vale decir, la diferencia entre dos medianas cualesquiera de la serie, sea estadísticamente significativa, al nivel de significancia deseado.La Hipótesis Nula, como anteriormente, consiste en presuponer que las “k” distribuciones son idénticas, medido ésto a través de la comparación de las Medianas.

218

Volver

(Continuación)

Este test se puede aplicar en un momento en el tiempo, por ejemplo para testear “k” productos o características( sabores por ejemplo) y se desea medir si hay diferencias entre los “k” sabores distintos de un producto pidiendo a los entrevistados darles notas a cada uno de los “k” sabores según su agrado.Si el test original detecta que sí hay al menos una muestra, (en este ejemplo al menos un sabor) cuya nota Mediana sea distinta a las de las demás, el programa detecta luego entre cuales de todos los pares posibles de conformar se encuentran diferencias estadísticamente significativas

219

Volver

EJEMPLO:

En este ejemplo se tomaron 6 muestras independientes de apoderados de niños que asisten a colegios.

El criterio con el que se presentan las muestras es según la colegiatura que alcanzaron los apoderados en sus vidas. La variable a estudiar es el número de asistencias a reuniones de apoderados durante el último año escolar.

220

Volver

(Continuación)

La Hipótesis Nula postula que no hay diferencias entre las 6

poblaciones representadas por las 6 muestras en cuanto a la

frecuencia de participación en las reuniones de apoderados.

La Hipótesis Alternativa postula que sí hay diferencias entre ellas, definiéndose como diferencia que al menos una de las Medianas es

distinta a las de las demás poblaciones representadas

221

Volver

Ejemplo:

222

Volver

Ejemplo:

223

Volver

Ejemplo:

224

Volver

Ejemplo:

225

Volver

Ejemplo:

226

Volver

Ejemplo:

227

Volver

Ejemplo:

228

Volver

CONCLUSIONESPuesto que el resultado del test no pudo rechazar la Hipótesis Nula al nivel de significancia del 5% elegido, se llega a la conclusión que no importa cuál sea el nivel educacional de los apoderados, el interés demostrado por ellos en la educación de sus pupilos, medido a través del número de asistencia a las reuniones de apoderados, es igual en los 6 niveles educacionales en los que se subdividieron los apoderados.

Obviamente, este test se puede aplicar a casos similares de comparación de ‘k’ muestras independientes de cualquier tamaño (y no necesariamente de igual tamaño entre ellas), y en cualquier ámbito de interés.

229

Volver

CELDA NUMERO 11

Análisis de varianza de Kruskal-Wallis (One-way)

USO : EN “k” MUESTRAS INDEPENDIENTES

Este test , es muy similar al test extendido de las Medianas, con la diferencia de que el presente test aprovecha mejor los datos individuales de las muestras, puesto que las convierte en rankings, es decir respeta las diferencias relativas entre los valores asumidos por la variable para los distintos casos de la muestra, mientras que en el test extendido de la Mediana, los valores se dividen en sólo 2 grupos, aquellos por bajo la Mediana y aquellos por sobre la Mediana.

La Hipótesis Nula consiste en presuponer que las “k” distribuciones son idénticas.La Hipótesis Alternativa postula que al menos una de las distribuciones es distinta.

Las variables originales, deben estar medidas al menos en escala ordinal, pudiendo tener una escala subyacente intervalar.

Así, mientras en la Hipótesis Nula se postula que

Θ1 = Θ2 = Θ3 =…… = Θ k

en la Hipótesis Alternativa se plantea

Θ1 ≠ Θ2 ≠ Θ3 ≠ …… ≠ Θ k

Para que se acepte la Hipótesis Alternativa basta con que al menos una de las desigualdades se cumpla, vale decir, la diferencia entre dos medianas cualesquiera de la serie, sea estadísticamente significativa, al nivel de significancia deseado.La Hipótesis Nula, como anteriormente, consiste en presuponer que las “k” distribuciones son idénticas, medido ésto a través de la comparación de las Medianas. 230

Volver

EJEMPLO:

Se presentará un ejemplo hipotético con 3 muestras independientes de sólo 6 casos cada una. En la práctica los tamaños muestrales no tienen límite inferior ( mínimo n = 2) ni superior, pudiendo llegar a varios miles si es necesario, ni tampoco existe la restricción de que todas las muestras sean de igual tamaño.En este ejemplo hipotético, se trata de averiguar si las 3 poblaciones representadas por las 3 pequeñas muestras pueden considerarse iguales en relación a la variable estudiada que tiene valores posibles en el rango {0-1}.Luego, si el test demuestra que no provienen de una misma población, se desea comparar una de ellas, considerada la muestra del Grupo Control ( en este caso la Muestra A), con cada una de las otras muestras ( la B y la C), y detectar con cual de ellas difiere significativamente.En otros casos prácticos,, en lugar de comparar una muestra Control con las restantes muestras, pueden compararse - si se desea - todos los pares posibles de conformar.

231

Volver

EJEMPLO

232

Volver

EJEMPLO

233

Volver

EJEMPLO

234

Volver

EJEMPLO

235

Volver

EJEMPLO

236

Volver

CONCLUSIONES

Como se observa, el test detectó que, al nivel de significancia del 5%, no se puede aceptar la Hipótesis Nula de la igualdad.Al comparar la muestra 1 ( Grupo 1), con las muestras 2 y 3, el test detectó que sólo con la muestra 3 la diferencia detectada es significativa al nivel del 5%. Este test permite también utilizar una de las muestras como “Muestra Control”, y testear si las diferencias de dicha muestra con las restantes es o no significativa

237

Volver

CELDA NUMERO 11

Test de Jonckheere para alternativas ordenadas

USO : EN “k” MUESTRAS INDEPENDIENTES

Este test , es muy similar al test de Kruskal-Wallis, pero va un paso más allá, al permitir testear la Hipótesis Alternativa que las Medianas están ordenadas monotónicamente ( y no solamente que las Medianas son diferentes).

La Hipótesis Nula consiste en presuponer que las “k” distribuciones son idénticas.La Hipótesis Alternativa postula que al menos una de las distribuciones es distinta.

Las variables originales, deben estar medidas al menos en escala ordinal, pudiendo tener una escala subyacente intervalar.

Así, mientras en el Test de Kruskal-Wallis la Hipótesis Alternativa se puede escribir como

Θ1 ≠ Θ2 ≠ Θ3 ≠…… ≠ Θ k

en el test de Jonckheere, la Hipótesis Alternativa se puede plantear como

Θ1 ≤ Θ2 ≤ Θ3 ≤ …… ≤ Θ k

238

Volver

continuación

Para que se acepte la Hipótesis Alternativa basta con que

al menos una de las desigualdades sea absoluta, vale decir,

sea estrictamente < (menor) y no ≤ (menor o igual).

La Hipótesis Nula, como anteriormente, consiste en presuponer que las “k” distribuciones son idénticas, medido ésto a través de la comparación de las Medianas.

239

Volver

continuación

Si el test encuentra que la Hipótesis Nula es

inaceptable al nivel de significancia elegido, el

programa procede a comparar todas las

combinaciones de 2 en 2, es decir todos las

pares distintos posibles de conformar, y testear

en cada uno de ellos si la diferencia encontrada

es estadísticamente significativa.

Este Test es unilateral, puesto que lo que se

desea saber es si una de las 2 poblaciones

representadas en cada par es estocásticamente

superior a la otra, o no.

240

Volver

EJEMPLO:

Se presentan los resultados de 4 muestras independientes, en los que la variable a medir estaba en la escala intervalar. El programa se preocupa luego de reducirlos a una escala ordinal ( ranking de menor a mayor), y aplicar luego el algoritmo.

Tal como en el caso del test de Kruskal-Wallis, no hay limitaciones en el tamaño muestral ni exigencia de muestras de igual tamaño.Los tamaños muestrales en este ejemplo son : 12, 9, 8 y 6

241

Volver

EJEMPLO:

242

Volver

EJEMPLO:

243

Volver

EJEMPLO:

244

Volver

CONCLUSIONES (continuación)

El programa, que detectó este resultado, continúa testeando ahora todos los pares

posibles de conformar y tratará de detectar entre cuales de las Poblaciones

representadas por las muestras, la diferencia encontrada puede ser señalada como

estadísticamente significativa, en el sentido de que la muestra con mayor Mediana dentro del par implica que la Población representada por esta muestra es estocásticamente mayor

que la otra

245

Volver

EJEMPLO:

246

Volver

EJEMPLO:

247

Volver

CONCLUSIONESEn primer lugar el test detectó que la Hipótesis Nula de igualdad entre las siguientes Medianas:M1=43.3M2=51.4M3=76.5M4=87.4no puede ser aceptada al nivel de significancia elegido del 5%.En consecuencia, lo que el resultado del test nos indica es que las Medianas poblacionales están ordenadas en orden monotónico ascendente, vale decir al menos una de las Medianas es superior a las precedentes, como presuponía la Hipótesis Alternativa.

248

Volver

CELDA N° 12

MEDIDAS DE ASOCIACION ESCALA DE MEDICION DE LA VARIABLE:

ORDINAL O INTERVALAR 1.- Coeficiente de correlación de rankings, de

Spearman 2.- Coeficiente de correlación de rankings T, de Kendall 3.- Coeficiente de correlación parcial Txy,z de

rankings, de Kendall 4.- Coeficiente “W” de Concordancia de Kendall 5.- Coeficiente “u” de acuerdo, de Kendall 6.- Coeficiente Tc de correlación entre “n” jueces y un

criterio prefijado 7.- Estadístico G de Gamma 8.- Indice Somer de asociación asimétrica dBA

249

Volver

CELDA NUMERO 12

Coeficiente de correlación de rankings, de Spearman

SITUACIONES DE USO

Este coeficiente está basado en el coeficiente de correlación “r” de Pearson, y nos permite obtener un coeficiente de correlación para variables medidas ya sea en una escala ordinal, como en una escala intervalar. En este último caso, reduce los valores originales a una escala ordinal y rankea los valores de menor a mayor, tal como lo hace con las variables que ya en su origen están medidas en una escala ordinal.Luego calcula el coeficiente de correlación entre 2 variables cualesquiera que correspondan a estas características de medición.Tal como en el caso del coeficiente de correlación de Pearson, el rango de valores que puede asumir este coeficiente fluctúa entre -1 y +1

250

Volver

(Ejemplos)

A continuación se presentan tres ejemplos.

El primero está basado en una muestra aleatoria simple de tamaño 12, para el que se desea detectar si existe correlación positiva, a un nivel de significancia del 5%.

El segundo ejemplo es similar, también de 12 casos, pero con otro set de datos, el que luego se utilizará también para efectos de comparación, con otros coeficientes de correlación y otros tests de significancia, que se presentarán a continuación

El tercer ejemplo se basa en una muestra aleatoria simple de 60 casos con el mismo set de datos anteriores, replicado 5 veces,. En este test, debido al tamaño muestral, el algoritmo de solución esDiferente, basándose en la distribución del ‘t’ de Student.

251

Volver

(Continuación)

Obsérvese que el programa ordena los puntajes , calcula el coeficiente de correlación y finalmente efectúa un test para evaluar si el coeficiente de correlación es significativamente superior a cero o si efectivamente no puede rechazarse la Hipótesis Nula de que el coeficiente de correlación poblacional es igual a cero.Para tamaños muestrales inferiores a 51, el programa utiliza una Tabla ad-hoc.Cuando n > 50, se utiliza la distribución “t” de Student hacia la cual tiende asintóticamente

252

Volver

Ejemplo # 1

253

Volver

Ejemplo # 1(Continuación)

254

Volver

Ejemplo # 2

255

Volver

Ejemplo # 2(continuación)

256

Volver

Ejemplo # 3

257

Volver

Ejemplo # 3(continuación)

258

Volver

CONCLUSIONES

Ejemplo # 1 : El coeficiente de correlación de Spearman,

estimado por la muestra es de 0.62, mayor al coeficiente crítico de 0.50 al nivel de significancia del 5%, lo que implica que sólo tenemos una probabilidad del 5% o menor, de equivocarnos al afirmar que existe una correlación positiva entre ambas variables

259

Volver

CONCLUSIONES

Ejemplo # 2 : El coeficiente de correlación de Spearman,

estimado para esta muestra es de 0.82, mayor al coeficiente crítico de 0.59 al nivel de significancia del 5%, lo que implica que sólo tenemos una probabilidad del 5% o menor, de equivocarnos al afirmar que estas variables están asociadas

260Volver

CONCLUSIONES(continuación)

Ejemplo # 3 : El valor empírico obtenido de ‘t’ alcanzó un valor

superior a 10, valor muy superior al valor crítico de 2, con lo cual cae claramente en la así llamada Región crítica, por lo cual se rechaza la Hipótesis Nula, aceptándose la Hipótesis Alternativa que postula la existencia de una relación entre ambas variables. La probabilidad de cometer un error al hacer esta afirmación es prácticamente nula.

261

Volver

CELDA NUMERO 12

Coeficiente de correlación de rankings T, de Kendall

SITUACIONES DE USO

Este coeficiente está destinado a resolver los mismos problemas que el coeficiente de correlación de Spearman para variables basadas al menos en una escala ordinal. Es especialmente útil para determinar si existen diferencias entre los varios integrantes de un jurado en cuanto a sus apreciaciones, tal como se verá más adelante, o bien para calcular la correlación existente entre 2 variables medidas en la escala ordinal, a diferencia del coeficiente de correlación de Pearson, el que necesita que las variables estén en una escala al menos intervalar.Tal como en el caso del coeficiente de correlación de Pearson, el rango de valores que puede asumir este coeficiente fluctúa entre -1 y +1

262

Volver

Ejemplo

263

Volver

Ejemplo : (continuación)

264

Volver

Ejemplo : (continuación)

265

Volver

CONCLUSIONES

El coeficiente T obtenido es 0.667 y el test aplicado para detectar si se acepta o no la Hipótesis Alternativa unilateral arroja una probabilidad de sólo 0.0013 de obtener un valor como éste si la Hipótesis Nula de independencia fuere real. Por lo tanto, y recordando que el nivel de significancia elegido era de 0.05, se acepta la Hipótesis Alternativa de asociación positiva entre ambas variables.

266

Volver

CELDA NUMERO 12

Coeficiente de correlación parcial de rankings Txy,z de Kendall

SITUACIONES DE USO

Este coeficiente está destinado a resolver los mismos problemas que el coeficiente de correlación de Kendall, pero esta vez manteniendo constante el valor de una tercera variable (que llamaremos “Z”) que puede estar también correlacionada con las variables “X” e “Y”. Este método permite la no interferencia de esta tercera variable en el cálculo de la correlación entre X e Y.Tal como en el caso anterior del coeficiente de Kendall, las variables deben estar basadas al menos en una escala ordinal. Tal como en el caso del coeficiente de correlación de Pearson, el rango de valores que puede asumir este coeficiente fluctúa entre -1 y +1.Generalmente la Hipótesis Alternativa es bilateral, vale decir que ambas variables, X e Y, no son independientes cuando se mantiene constante el valor de la variable Z, aunque en algunas ocasiones puede testearse si la correlación entre ambas variables es positiva o negativa, vale decir, en estos casos el test es unilateral.Se presentarán dos ejemplos, uno basado en una muestra de 12 casos y el segundo en una muestra de 36 casos. En el segundo ejemplo lo único que se hizo fue repetir en 3 ocasiones consecutivas , la matriz de los 12 casos. El objetivo de este ejercicio consistió en demostrar los 2 posibles algoritmos a utilizar: uno utilizando una Tabla ad-hoc para muestras menores a 20 casos, y el segundo algoritmo, basado en la curva Normal, para muestras mayores a 20 casos.

267

Volver

Ejemplo 1

268

Volver

Ejemplo 1: (continuación)

269

Volver

Ejemplo 1: (continuación)

270

Volver

Ejemplo 2

271

Volver

Ejemplo 2: (continuación)

272

Volver

Ejemplo 2: (continuación)

273

Volver

Ejemplo 2: (continuación)

274

Volver

CONCLUSIONES

En el ejemplo # 1, con un tamaño muestral muy reducido, de sólo 12 casos, el test basado en la tabla ad-hoc para este tamaño muestral, detectó que las variables están asociadas, al nivel de significancia del 5%. El set de datos utilizados es el mismo que se utilizó con el coeficiente de correlación de Spearman y con el coeficiente de rankings de Kendall.

En esta ocasión, el coeficiente de correlación parcial es de 0.62, valor muy similar al 0.67 detectado por el coeficiente anterior de Kendall ( el test sin considerar la tercera variable Z).

Esta similitud de valores está indicando que la variable Z incide sólo muy levemente en el comportamiento de asociación entre las variables X e Y

275

Volver

CONCLUSIONES

En el ejemplo # 2, con un tamaño muestral también muy reducido, de sólo 36 casos, el test basado en la Distribución Normal Standard detectó que las variables están asociadas, al nivel de significancia del 5%.

Más aún, la probabilidad de errar al efectuar esta afirmación es bajísima, de sólo un 0.00000014

276

Volver

CELDA NUMERO 12

Coeficiente de Concordancia W, de Kendall

SITUACIONES DE USO

Este coeficiente está destinado a resolver los mismos problemas que el coeficiente de correlación de Kendall, pero en lugar de calcular el coeficiente de correlación entre 2 variables, las calcula para “k” variables o categorías alternativas { k > 2 } , las que cada persona de la muestra debe clasificar en un ranking.Tal como en el caso del coeficiente de Kendall para 2 variables, éstas deben estar medidas en una escala intervalar u ordinal, pudiendo estar ya originalmente en rankings, y si no lo están, el programa se preocupa de la transformación de los puntajes originales a rankings.

W, que es el estadígrafo a medir, fluctúa entre un mínimo de 0 y un máximo de 1

La Hipótesis Alternativa consiste en que existe consenso entre los entrevistados respecto al rankeo de las categorías. 277

Volver

(continuación)

A continuación de la determinación del valor de “W”, el programa testea si este valor puede ser considerado significativamente superior a cero, lo que estaría demostrando que sí existe consenso entre los entrevistados.Si el programa detecta que el valor de “W” es significativamente superior a cero, presenta las “k” categorías ordenadas de acuerdo al consenso encontrado.Este ranking basado en el consenso de los entrevistados no debe ser considerado como demostración de la objetividad o corrección del rankeo, puesto que se puede estar consensuados tanto cuando se está en lo correcto como cuando se está en lo incorrecto.En todo caso, presenta un método “democrático” de cómo elegir un rankeo (de grados de importancia, por ejemplo) que pueda servir de standard a futuro.

278

Volver

EjemplosLos 2 ejemplos hipotéticos siguientes presentan el resultado de una encuesta efectuada a 22 empleados de una empresa.En el primer ejemplo se detectó que los empleados NO concordaban en sus razones para participar en el Seminario.En el segundo ejemplo hipotético, los empleados SÍ concordaban.

El estudio se realizó para detectar si había consenso entre los funcionarios en cuanto a su razón para viajar a un seminario internacional de la empresa, y a conocer, si es que se detectaba el consenso, cuales eran las razones principales que tenían para participar en este seminario.Se les presentaron las siguientes 8 razones para querer viajar al seminario:1.- Valor del pasaje aéreo2.- Estado del tiempo en el lugar del seminario3.- La fecha en que se desarrollará el evento4.- El contenido del programa del seminario5.- La cantidad de personas participantes6.- La duración, en días, del Seminario7.- La nómina de conferencistas8.- La dependencia del viaje solamente en el estado de salud futuro del participante

279

Volver

Ejemplos(continuación)

El programa permite introducir la matriz de datos con su puntaje original o ya rankeados.En el caso de puntaje original, se permite, aunque no es deseable, el uso de puntajes repetidos para distintas razones alternativas, por parte del entrevistado.El programa luego atribuye rankeos promedios para las alternativas que se repiten. En el ejemplo siguiente se utilizó un puntaje de 1 a 10, donde el 1 indicaba la razón más importante según el entrevistado, y el puntaje 10 el menos importante.Por supuesto, puede utilizarse el criterio contrario para señalar el grado de importancia.

280

Volver

Ejemplo 1

281

Volver

Ejemplo 1(continuación)

282

Volver

Ejemplo 1(Continuación)

283

Volver

Ejemplo 2

284

Volver

Ejemplo 2(continuación)

285

Volver

Ejemplo 2(continuación)

286

Volver

Ejemplo 2(continuación)

287

Volver

CONCLUSIONESDEL SEGUNDO EJEMPLO

El test arrojó como resultado que existía consenso entre los empleados, y que las 3 razones principales para desear viajar al congreso son :1.- Valor del pasaje aéreo2.- Quienes serían los conferencistas3.- La fecha en que se realizaría el

Seminario

288

Volver

CELDA NUMERO 12

Coeficiente “u” de acuerdo de Kendall para comparaciones pareadas

o rankings

Este coeficiente está destinado a resolver los mismos problemas que el coeficiente W de Concordancia de Kendall, pero además de poder rankear directamente todas las alternativas, se ofrece la posibilidad, en este programa, de ingresar los datos en la forma de comparaciones pareadas.Para estos efectos se debe amoldar el cuestionario a esta situación, presentándole al entrevistado todos los pares posibles de conformar y pedirle que de cada uno de ellos elija el atributo de su preferencia.El número de pares que se pueden, y deben, presentar a cada entrevistado es el valor de la combinación de k sobre 2, vale decir k*(k-1)/2.Por ejemplo, si hay 5 atributos, “k” = 5, y el número de pares que se pueden formar es de 5*4/2 = 10Este método de medición suele usarse para evitar los problemas que puede tener el entrevistado al pedirle que rankee un número relativamente alto de alternativas.Además permite incorporar algunas aparentes inconsistencias, las cuales no son posibles cuando se rankea. Por ejemplo, en el caso de rankeo, si A>B ( se lee “A preferido a B”) y (B>C), entonces (A>C ) ; en cambio, en el caso de comparaciones pareadas, se puede dar que (A>B), (B>C) pero (C>A). En una situación así, no se hubieran podido rankear directamente los 3 atributos u objetos.

289

Volver

EJEMPLOS

Se presentarán dos ejemplos.En el primero, el ingreso de datos será en base a atributos rankeados.En el segundo ejemplo, los datos ingresarán en base a comparaciones pareadas.Las muestras serán muy pequeñas, pero en la práctica no hay límites superiores para el tamaño muestral

290

Volver

Ejemplo 1:

291

Volver

Ejemplo 1:(continuación)

292

Volver

Ejemplo 1:(continuación)

293

Volver

Ejemplo 2:

294

Volver

Ejemplo 2:(continuación)

295

Volver

Ejemplo 2:(continuación)

296

Volver

CELDA NUMERO 12

Coeficiente Tc de correlación entre “n” jueces y un criterio prefijado

SITUACIONES DE USO

Este coeficiente es similar al coeficiente “u” de Acuerdo de Kendall, ingresándose los datos en forma de rankings.El objetivo del análisis consiste en determinar si la información ingresada en forma de rankings es consistente con un ranking de control predeterminado, en lugar de determinar si los rankings son consistentes entre síEn todos los aspectos restantes, este test es similar al coeficiente de acuerdo de Kendall

297

Volver

CELDA NUMERO 12

Coeficiente Tc de correlación entre “n” jueces y un criterio prefijado

298

Volver

CELDA NUMERO 12

Coeficiente Tc de correlación entre “n” jueces y un criterio prefijado

299

Volver

CELDA NUMERO 12

Coeficiente Tc de correlación entre “n” jueces y un criterio prefijado

300

Volver

CELDA NUMERO 12

Coeficiente Tc de correlación entre “n” jueces y un criterio prefijado

301

Volver

CONCLUSIONES

El test arrojó como resultado que el rankeo de los entrevistados puede considerarse como estando de acuerdo con el ranking predeterminado el cual va de 1 a k, en orden consecutivo (con una probabilidad de menos de 6 milésimas de estar equivocados).Por razones de conveniencia, en la tabla de output aparecen los encabezamientos de los atributos del rankeo predeterminado, como “Sujeto1”, “Sujeto 2” , etc. pero podría ser cualquier otro nombre o letra, siempre y cuando ese orden de nombres o letras vaya de más importante a menos importante, (o mejor evaluado a peor evaluado).

302

Volver

CELDA NUMERO 12

Estadístico G de Gamma

SITUACIONES DE USO

Este coeficiente a diferencia de todos los coeficientes de correlación de variables ordinales presentados anteriormente, obtiene su información a partir de tablas de contingencia ya procesadas y no de información detallada a nivel de cada integrante de la muestra.Puesto que ambas variables son ordinales, hay que tener cuidado en ordenar las “k” columnas y las “r” filas de la tabla de contingencia en orden ascendente de cada variable.El coeficiente G puede asumir valores entre -1 y +1, para correlación perfecta negativa y perfecta positiva, respectivamente.

303

Volver

Ejemplo

Se presentará un ejemplo basado en una muestra aleatoria simple de 240 personas fumadoras o ex-fumadoras, las cuales pasaron por un tratamiento anti-tabaco.Las variables de estudio fueron :A = Años fumando (7 tramos)B = Nivel de éxito en dejar de fumar post-tratamiento ( 3 niveles)

304

Volver

Ejemplo

305

Volver

Ejemplo(continuación)

306

Volver

Ejemplo(continuación)

307

Volver

Ejemplo(continuación)

308

Volver

CONCLUSIONES

El test detectó que la correlación entre ambas variables es significativamente ( α= 0.01) positiva, de lo que se puede deducir que efectivamente, a mayor cantidad de años previos fumando, menos éxito tiene el tratamiento.Obsérvese que, en la tabla, la variable que indica el éxito relativo del tratamiento, va de más exitoso a menos exitoso. En consecuencia, la correlación positiva indica que a medida que aumentan los años previos fumando, menor es el éxito que se puede esperar del tratamiento.Si el orden en la tabla hubiese sido de menos exitoso (“transición fracasada”, vale decir “siguen fumando igual que antes”) a más exitoso :(“transición exitosa” vale decir “dejaron totalmente de fumar”), el coeficiente resultante habría tenido el mismo valor absoluto, pero habría sido de signo negativo

309

Volver

CELDA NUMERO 13

Indice Somer de Asociación Asimétrica dBA

SITUACIONES DE USO

Este coeficiente al igual que el G de Gamma, obtiene su información a partir de tablas de contingencia ya procesadas y no de información detallada a nivel de cada integrante de la muestra.Las variables originales deben ser ordinales al igual que en dicho test.Puesto que ambas variables son ordinales, hay que tener cuidado en ordenar las “k” columnas y las “r” filas de la tabla de contingencia en orden ascendente de cada variable.La variable A además de ser ordinal, debe ser independiente ( por. Ej. Nivel socio-económico, tramos etarios, tramos de años de educación, etc. ), es decir, generalmente, pero no exclusivamente, estas variables son de carácter demográfico.En segundo lugar, lo que se desea averiguar es si esta variable A tiene alguna incidencia o relación del tipo “antecedente consecuente” con la variable B, que es la variable considerada “dependiente” ( también ordinal).

310

Volver

(Continuación)

El Indice dBA puede asumir valores entre -1 y +1, para correlación perfecta negativa y perfecta positiva, respectivamente.El test, luego de estimar el valor de dBA evalúa si este valor puede ser considerado como significativamente diferente a cero.En caso contrario, debería aceptarse que la variable A no tiene ninguna incidencia respecto a la variable B.

El test es unívoco. Si quisiera analizarse si existe la misma relación pero en orden inverso, es decir de B en relación a A, se debería efectuar un nuevo test

311

Volver

Ejemplo

En un estudio efectuado a una muestra de clientes de un SuperMercado, se decidió evaluar, luego de una campaña promocional a favor de marcar los artículos empleando código de barras en lugar de marcar cada uno con su precio individual, si existía alguna relación entre el nivel educacional de los clientes y su predisposición a aceptar el mensaje de la campaña, es decir, a aceptar el uso del código de barras.

312

Volver

Ejemplo

313

Volver

Ejemplo(continuación)

314

Volver

Ejemplo(continuación)

315

Volver

CONCLUSIONES

El test arrojó como resultado un valor de dBA= 0.189, y luego el test de significancia de este valor arrojó una probabilidad de sólo 0.0014 de obtener este valor si la Hipótesis Nula de independencia fuera cierta.En consecuencia, se acepta la Hipótesis Alternativa de que ambas variables están asociadas, y en este caso, positivamente.Como se observa, este Indice de 0.189, si bien modesto, es positivo y está refrendado en cuanto a su diferencia respecto a cero en el Universo, gracias al test de significancia aplicado, por lo cual podemos decir que, a medida que aumenta el nivel educacional de los clientes del Supermercado, aumenta su apoyo al programa de presentar los precios a través del código de barras.Sin embargo, la magnitud de esta actitud positiva por parte de las personas de mayor nivel educacional, es modesta.

316

Volver

CELDA N° 13

TEST APLICABLE A UN PANEL

ESCALA DE MEDICION DE LA VARIABLE: INTERVALAR

1.- Test de permutaciones para replicaciones pareadas

317

Volver

CELDA NUMERO 13

Test de permutaciones para replicaciones pareadas

SITUACIONES DE USO

El objetivo de este test es determinar si ha habido algún cambio entre 2 mediciones de una misma variable efectuadas en un Panel, vale decir, el objetivo es medir si entre dos situaciones espaciales o temporales, se produjo un cambio. Puede utilizarse en estudios de Opinión o de Mercado, para medir cambios en el tiempo sobre una misma variable, o para detectar diferencias entre 2 situaciones u objetos diferentes.La muestra debe ser la misma en ambos casos ( panel) y la variable debe ser intervalar.Los resultados de este test son exactos, pero debido al algoritmo que se utiliza, basado en permutaciones, la carga computacional es muy alta, por lo cual no es recomendable utilizarlo cuando el tamaño muestral supera los 12 casos.En esos casos, se recomienda el uso del test T+ de Wilcoxon de rankings con signo

A continuación se presenta un ejemplo basado en una muestra de tamaño 12

318

Volver

Ejemplo

319

Volver

Ejemplo(continuación)

320

Volver

Ejemplo(continuación)

321

Volver

Ejemplo(continuación)

322

Volver

CELDA N° 14 :

2 MUESTRAS INDEPENDIENTES

ESCALA DE MEDICION DE LA VARIABLE: INTERVALAR

1.- Test de permutaciones para 2 muestras independientes

2.- Test del rango de Moses para diferencias de escala

323

Volver

CELDA NUMERO 14

Test de permutaciones para 2 muestras independientes

SITUACIONES DE USO

El objetivo de este test consiste en evaluar la Hipótesis Alternativa que la Media de la Población X de la que se extrajo la primera muestra es mayor que la Media de la Población Y : (μx > μx) , o es menor (μx < μx) , o simplemente ambas Medias son diferentes (μx ≠ μx) .

Puesto que el test compara medias, la variable a estudiar debe ser intervalar.

Este test da resultados probabilísticos exactos, pero sólo se puede implementar para muestras cuyo tamaño total : n1 + n2 = n, sea menor a 20 casos : (n < 20).

En el caso de muestras cuyo tamaño total : n1 + n2 = n , sea mayor o igual a 20 : (n ≥ 20), el programa implementa el algoritmo del “t” de Student.

324

Volver

(continuación)

A continuación se presentarán dos ejemplos, el primero basado en dos muestras independientes, una de ellas de tamaño 5 y la segunda de tamaño 4.El segundo ejemplo está basado en dos muestras , también relativamente pequeñas, de 22 casos la primera y de 8 casos la segunda.El propósito de presentar estos ejemplos consiste en demostrar los distintos ‘outputs’ computacionales de ambos algoritmos debido a los distintos tamaños muestrales totales, y en demostrar que con el algoritmo basado en el “t” de Student no hay problemas de limitación con los tamaños muestrales, pudiendo éstos ser de varios centenares o miles de casos. En ambos ejemplos utilizaremos el mismo criterio de evaluación, que en este caso será de un nivel de significancia

del 0.05 e Hipótesis Alternativa (μx > μx).

.

325

Volver

Ejemplo 1

326

Volver

Ejemplo 1:(continuación)

327

Volver

Ejemplo 1:(continuación)

328

Volver

Ejemplo 2:

329

Volver

Ejemplo 2:(continuación)

330

Volver

Ejemplo 2:(continuación)

331

Volver

Ejemplo 2:(continuación)

332

Volver

CELDA NUMERO 14

Test del rango, de Moses, para diferencias de escala

SITUACIONES DE USO

El objetivo de este test es similar al Test de Permutaciones que tiene como objetivo evaluar la diferencia entre las MEDIAS ARITMETICAS de 2 muestras independientes.En este Test, el objetivo se concentra en evaluar si hay diferencias entre las varianzas de 2 muestras independientes. En otras palabras, puede interesar conocer si : (σ2

x > σ2y) , o (σ2

x < σ2y), o simplemente si

ambas varianzas son diferentes (σ2x ≠ σ2

y). Puesto que el test compara varianzas, la variable a estudiar debe ser al menos intervalar.Este programa está diseñado para tamaños muestrales sobre 20 casos en cada muestra

333

Volver

Ejemplo

334

Volver

Ejemplo:(continuación)

335

Volver

Ejemplo:(continuación)

336

Volver

CONCLUSIONES

En base al resultado del test unilateral, se acepta la Hipótesis Alternativa que suponía que la varianza de la población representada por la primera muestra era menor que la varianza de la población representada por la segunda muestra.El test muestra que si la Hipótesis Nula de igualdad de las varianzas fuera cierta, entonces la probabilidad de obtener un valor de “t” como el obtenido empíricamente, sería sólo del 3,4%, valor inferior al nivel de significancia especificado del 5%.

337

Volver