3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

download 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

of 44

Transcript of 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    1/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 1

    Inferencia estadística por pruebas no paramétricas de hipótesis con

    variables categóricas nominales. Chi cuadrado ( X 2).

    Se denomina VARIABLE CATEGORICA o CUALITATIVA  a las que describen una

    cualidad, atributo, propiedad o características de un sujeto, fenómeno, factor, cosa, etc. ycuyos valores son categorías o clases excluyentes.

    Ejemplo: el sexo, la raza o clasificación étnica, la clase social, la categoría laboral,participar o nó en un programa de investigación o participación, el tipo de tratamientoaplicado, los distintos departamentos de una empresa, padecer o nó de un determinadosíntoma, estado civil, nivel socioeconómico, color del pelo, color de los ojos, etc. Es unavariable sobre las que únicamente es posible obtener una medida en escala de tiponominal (u ordinal, pero con muy pocos valores). Cuando se trabaja con este tipo devariables, los datos pueden organizarse en tablas de doble o más entradas en las quecada entrada representa un criterio de clasificación o categoría (una variable categórica).Como resultado de esta clasificación, la frecuencia, el número de casos o el

    porcentaje de los mismos   se presentan organizadas en casillas que contieneninformación sobre la relación existente entre ambos criterios. A estas tablas defrecuencias se les denomina tablas de co nt ingencia .

    Escala Nominal.- No poseen propiedades cuantitativas y sirven únicamente para asignar,designar o identificar las clases. Los datos empleados con las escalas nominales constangeneralmente de la frecuencia de los valores o de la tabulación de número de casos encada clase, según la variable que se está estudiando. El nivel nominal permite mencionarsimilitudes y diferencias (relación igualdad o desigualdad) entre los casos particulares.Los datos evaluados en una escala nominal se llaman también "observacionescualitativas", debido a que describen la cualidad, atributo o calidad de una persona o cosaestudiada, u "observaciones categóricas" porque los valores se agrupan en categorías.

    Por lo regular, los datos nominales o cualitativos se describen en términos de f recuencia,porcentaje o proporc iones . Para exhibir este tipo de información se usan con mayorfrecuencia tablas de contingencia y gráficas de barras. Ejemplo: color de ojos, estado civil,sexo, ansiedad, agresividad, alexitimia, claustrofobia, etc. Usada principalmente porvariables cualitativas o categóricas.

    Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras(característica que define a las escalas nominales) sino que mantiene una especie derelación entre sí. También permite asignar un lugar específico a cada objeto de un mismoconjunto, de acuerdo con la intensidad, nivel, fuerza, etc.; presentes en el momento de lamedición. Una característica importante de la escala ordinal es el hecho de que, aunquehay orden entre las categorías, la diferencia entre dos categorías adyacentes no es la

    misma en toda la extensión de la escala. Algunas escalas consisten en calificaciones demúltiples factores que se agregan después para llegar a un índice general. Usadaprincipalmente por variables cualitativas o categóricas.

    Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escalade posición", donde las observaciones se clasifican de mayor a menor (o viceversa). Aligual que en las escalas nominales, se emplean a menudo porcentajes y pro porc iones  en escalas ordinales. Ejemplo: nivel socioeconómico (Alto, Medio, Bajo), agresividad(intensa, promedio, baja), etc.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    2/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 2

    Desc rip ción d e Prueb as no p aramétric as

    Las pruebas y modelos estadísticos no paramétricos son aquellos cuya distribución delos datos no se ajusta a un tipo de distribución conocida, como por ejemplo la distribuciónnormal. Su distribución no puede ser definida ni conocida a priori,  pues son los datosobservados los que la determinan, por esto el empleo de estos métodos se hace

    recomendable cuando no se puede asumir que los datos se ajusten a una distribuciónconocida.

    Las pruebas no paramétricas nos permiten analizar datos en escala nominal u ordinal apesar de que no se conozcan los parámetros de una población (su media, moda,mediana, su distribución, su forma, etc.) y es utilizada para hacer un contraste dehipótesis.

    Empleo:

      Cuando los datos puntualizan a las escalas nominal u ordinal.  Se utiliza solo la frecuencia.  Se tabula el número de casos en cada clase estudiada  Poblaciones pequeñas.  Cuando se desconocen los parámetros media, moda, etc.  Cuando los datos son independientes.  Cuando se quiere contrastar o comparar hipótesis.  Investigaciones de tipo social. (Muestras pequeñas no representativas >5).  Cuando se requiere de establecer el nivel de confianza o significatividad en las

    diferencias.  Cuando la muestra es seleccionada no probabilísticamente.

    Pruebas no paramétricas

    Descripción.

    Para escala nominal:

      Leyes de la probabilidad y prueba binomial.

      Prueba   de Pearson para una muestra.  Prueba   de Pearson para do s y más m uestras in depend ientes.  Prueba de bond ad del ajuste mediante  .  Prueba   de pro porc iones p ara tres o más m uestras in depend ientes.  Prueba de probabilidad exacta de Fischer y Yates.  Prueba de McNemar para muestras dependientes.  Prueba Q de Cochran para tres o más muestras dependientes.   Análisis secuencial.

    Para escala ordinal:

      Prueba de Kolmogorov-Smirnov para una muestra.  Prueba de U Mann-Whitney para dos muestras independientes.

    http://es.wikipedia.org/wiki/A_priorihttp://es.wikipedia.org/wiki/A_priorihttp://es.wikipedia.org/wiki/A_priori

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    3/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 3

      Prueba de Wilcoxon de rangos señalados y pares igualados para dos muestrasdependientes.

       Análisis de varianza de una entrada de Kruskal-Wallis para más de dos muestrasindependientes.

       Análisis de varianza de doble entrada por rangos de Friedman para más de dos muestrasdependientes.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    4/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 4

    Prueba ji, chi, X  2cuadrada de Pearson para una muestra

    La prueba estadística de X 2 para una muestra se emplea frecuentemente como prueba de

    bondad de ajuste , sin embargo, en un plan experimental, en el que se cuenta con un grupomuestral, con diversas subclases y las mediciones están en escala nominal, resulta muy útil este

    procedimiento. Esta prueba permite determinar si existe o no una diferencia significativa entre elnúmero de casos observados en la realidad (práctica) en cada categoría y el número de casosesperados (teoría), en base a la hipótesis nula. Responde a la pregunta: ¿Se ajusta bien ladistribución de los datos observados a la distribución teórica o esperada?.

    Lo que se requiere es una hipótesis nula que permita especificar las frecuencias que han deesperarse en cada categoría y, posteriormente, un examen de esta hipótesis nula. La hipótesisnula puede examinarse mediante la siguiente fórmula:

         

     

    Donde:X

    2= valor estadístico de ji cuadrada.

    fo = frecuencia observada.fe = frecuencia esperada. 

    Si la hipótesis nula es cierta (no hay relación/asociación entre las variables, o lo que es igual, nohay diferencia entre frecuencias observadas y esperadas, por lo que hay independencia entre lasvariables en estudio), la función X 

    2  sigue una distribución de valores denominada Chi Cuadrado

    (X 2 ), con (f-1)*(c-1) grados de libertad, en la cual todos los valores cumplen con la condición de la

    Ho.

    Por esto, si existe una coincidencia grande entre las frecuencias observadas ( fo) y lasesperadas (fe), la X 

    2  resultante será pequeña, por lo que se aceptará Ho  (no se rechazará). Al

    aumentar la discrepancia (fo  – fe) , el valor de X 2

      aumenta, por lo que se puede rechazar lahipótesis nula Ho.

    La ji o chi cuadrada (X 2) se utiliza cuando:

      Cuando los datos puntualizan a las escalas nominal u ordinal.

      Se utiliza solo la frecuencia.

      Poblaciones pequeñas.

      Cuando se desconocen los parámetros media, moda, etc.

      Cuando los datos son independientes.

      Cuando se quiere contrastar o comparar hipótesis.

      Investigaciones de tipo social - muestras pequeñas no representativas >5.

      Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias.

      Cuando la muestra es seleccionada no probabilísticamente.  X 

    2 permite establecer diferencias entre f y se utiliza solo en escala nominal.

      Población > a 5 y < a 20 (no limitativo).

    Pasos.

    1. Establecer tipo y escala de la variable2. Hipótesis de trabajo o de investigación3. Elección de la prueba.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    5/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 5

    4. Planteamiento de las hipótesis estadísticas (Ho y Ha).5. Nivel de significación (α).6. Zona de rechazo.7. Gráfica de la zona de aceptación y rechazo de Ho.8. Arreglar las categorías y las frecuencias observadas en una tabla.9.  Aplicar la prueba estadística: calcular los valores de las frecuencias teóricas esperadas para

    este modelo experimental o tipo de distribución X 2  según Ho o teoría o hipótesis previa.

    Presentar en una tabla.10. Calcular las diferencias de las frecuencias observadas en el experimento con respecto a las

    frecuencias esperadas.11. Elevar al cuadrado las diferencias y dividirlas entre los valores esperados de cada categoría.12. Efectuar la sumatoria de los valores calculados. Obtener el valor X

    2 calculado.

    13. Calcular los grados de libertad (gl) en función de número de categorías [K]: gl = K - 1.14. Comparar el estadístico X

    2calculado con los valores de la distribución de ji cuadrada en la tabla.

    15. Decidir si se acepta o rechaza la hipótesis, si X2calculada es mayor (>) X

    2tabla(k-1), se rechaza

    Ho.16. Interpretar los resultados obtenidos.

    Ejemplo:

    Un investigador quiere comparar si hay diferencias en la cantidad de cigarros fumados por causadel estrés en personas que trabajan.

    Variable categórica nominal

    Cantidad de cigarrillos fumados por causa del estrés o fumar por causa del estrés.

    Hipótesis de trabajo o de investigación:

    Si  las personas que laboran en empresas consumen la misma cantidad de cigarrillos por causa delestrés, entonces   una muestra del personal de una agencia de ventas de autos (2013-2014) no presentará diferencias entre la cantidad de cigarrillos fumados por causa del estrés.

    Elección de la prueba.

    El modelo experimental tiene una muestra y la variable es categórica en escala nominal,

    presentando la frecuencia de los valores o de la tabulación de número de casos en cada clase, seelige la prueba X 2  de Pearson para una muestra (véase al final de la guía: Flujogramas/Flujograma

    1). 

    Planteamiento de las hipótesis estadísticas (Ho y Ha).

    Modelo para estas hipótesis:

    Ho :  no hay diferencia entre las frecuencias o no hay dependencia entre las variables estudiadas .La variación es causada por el azar. 

    Ha:  si hay diferencia entre las frecuencias o existe dependencia entre las variables estudiadas. Lavariación es causada por la posible variable independiente.

    Planteamiento de las hipótesis del problema:

      Hipótesis alt erna (Ha). Existirá diferencia significativa entre la cantidad de cigarros fumados porcausa del estrés en personas que trabajan. La hipótesis alterna también se conoce como H 1.

      Hipótesis nu la (Ho). No existirá diferencia significativa entre la cantidad de cigarros fumados porcausa del estrés en personas que trabajan, por lo que el consumo de cigarros por causa del estrésse puede considerar como efecto del azar.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    6/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 6

    Nivel de significación: α=0,05

    El valor alfa (α) es la probabilidad de rechazar Ho, siendo Ho verdadera. También se conoce comoerror de tipo 1 o error de tipo alfa (α) o falso positivo: no aceptar la Ho, siendo verdadera. Se afirmala existencia de una diferencia entre hipótesis cuando en realidad no existe. Seguidamente se tieneque decidir qué tan baja probabilidad es posible aceptar antes de rechazar el modelo propuesto enla Ho. Generalmente, el nivel de confianza escogido es de 5%. Si la probabilidad es menor de 0,05,la diferencia es “significativa”  y se rechaza Ho, y si es menor de 0,01, esta es considerada“altamente  significativa”. Por esto, para todo valor de probabilidad igual o menor que 0,05, seacepta Ha y se rechaza Ho.

    Para el valor o nivel de significación de 0,05:

    a) Si el valor de X 2  tabla es superior al valor de X 

    2  calculado, se acepta o no se rechaza Ho.

    b) Si el valor de X 2  tabla es menor al valor de X

    2 calculado, se rechaza Ho y se acepta Ha.

    c) Si el valor de probabilidad de X 2  calculado (para el # de grados de libertad prefijados) esigual o menor que 0,05, (por ejemplo 0,04/0,03/0,02/0,01/0,005, etc.) se acepta Ha y serechaza Ho, ya que esto indicaría la existencia de diferencias significativas entre lasvariables (ojo: los programas de estadística como SPSS, R, Statgraphic s , etc., usan estaforma de presentar los resultados de un análisis).

    Este valor puede obtenerse directamente de la tabla de valores críticos de X 2, adjunta alfinal de esta guía. Por ejemplo, si  X 

    2  calculado da un valor de 7,07 para un (1) grado de

    libertad, se busca en la tabla de valores críticos de  X 2  en la fila de valores X 

    2  para un grado

    de libertad (la primera fila debajo de los valores alfa (α) de probabilidad). Puede observarseque el valor de 7,07 se encuentra entre los valores de 6,63 (para 0,01 de probabilidad) y7,87 (para 0,005 de probabilidad). Ya que ambos valores de probabilidad son menores que0,05, se acepta Ha y se rechaza Ho.

    Si la probabilidad tiene un valor numéricamente alto (mayores que 0,05, como0,06/0,07/0,1, etc.) se considera que la desviación es debida al azar y que los datosrespaldan la Ho por lo que se rechaza Ha. Si la probabilidad es numéricamente baja(menores que 0,05, como 0,04/0,03/0,02/0,01/0,0005, etc.), la desviación no es debida alazar y que los datos respaldan la Ha.

    Zona de rechazo.

    Si el valor de  X 2   calculado es mayor que el valor de  X 

    2   tabla (para α = 0,05 y un # de gl

    establecidos) se rechaza Ho y se acepta Ha. Si el valor de probabilidad del X2 calculado es menor

    que 0,05 (ejemplo 0,03, 0,02, 0,01, etc.), para el # de grados de libertad prefijados, se rechaza Hoy se acepta la Ha.

    Gráfica de la zona de aceptación y rechazo de Ho.

    Si el α del X2 calculado es numéricamente mayor a0,05 (0,06/0,07/0,8), se acepta Ho.

    Si el α del X2 calculado es numéricamente menor a0,05 (0,04/0,02/0,001), se acepta H1

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    7/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 7

     Aplicación de la prueba estadística.

    Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas decada suceso bajo la hipótesis de uniformidad entre los valores. El cálculo de la frecuenciaesperada se efectúa en virtud de que para una hipótesis nula, a todas las casillas corresponde unvalor igual, por lo tanto:

    Cálculo de la frecuencia esperada:

       

    fo = 18fe = 6

    Tabla con los datos de las frecuencias observadas y esperadas:

    Tipo de

    frecuencia

    Variable (escala nominal)

    TotalFuma por causadel estrés

    No sabe No fuma porcausa del estrés

    Observada (fo) 9 2 7 18

    Esperada (fe) 6 6 6 18

    Fórmula de X 2 

         

     

    Donde:

    X2= valor estadístico de ji cuadrada.

    fo = frecuencia observada.

    fe = frecuencia esperada. 

    Cálculos de X 2:

    Calcular el número de grados de libertad (gl):

    gl = k   – 1 = 3 - 1 = 2 siendo k  el número de categorías estudiadas.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    8/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 8

    Cálculo de la estadística de prueba X 2  para los datos de fumar o no por causa del estrés.

    VariableFrecuencia

    observada (fo)Frecuencia

    esperada (fe)(fo-fe) (fo-fe)2  (fo-fe)2/fe

    Fuma por causa delestrés

    9 6 3 9 1,5000

    No sabe 2 6 -4 16 2,6667

    No fuma por causa delestrés

    7 6 1 1 0,1667

     X 2  4,3333

    Nivel de significación: α = 0,05

    El valor calculado de X 2se compara con los valores críticos de la tabla de valores críticos de  X 

    2.

    Se puede observar que para una probabilidad de 0,05 corresponde un valor crítico de  X 2  tabla

    (0,05, 2) de 5.99; por lo tanto, el estadístico ji cuadrado calculado o X 2 calculado de 4,33 es menor

    que el valor X2

     de la tabla, o tiene una probabilidad mayor que 0,05 (puede estar entre 0,1 y 0,25,ambos valores superiores o mayores a 0,05, exactamente da 0,1145, obtenido medianteDISTR.CHI de Excel).

    Decisión.

    En virtud de que: a) el valor de  X 2  tabla  es superior al valor de X

    2  calculado, se acepta o no se

    rechaza Ho o b) la  X 2

    calculada  es menor (

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    9/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 9

    Interpretación.

    El consumo de cigarros por causa del estrés se puede considerar como efecto del azar.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    10/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 10

    Prueba ji cuadrada de Pearson para dos y más mues trasindependientes. Tablas de con t ingenc ia.

    Cuando las observaciones de una investigación corresponden a muestras independientes y lasmediciones se tienen en escala nominal, la prueba de ji cuadrada es el procedimiento de elecciónpara el contraste de hipótesis. Esta prueba estadística se emplea en el análisis de dos o más

    grupos y de dos o más variables.

    Ejemplos: ¿existe alguna diferencia en la tasa de delincuencia de los niños procedentes dediferentes niveles socioeconómicos?, o en otras palabras, ¿la tasa de delincuencia en niños esindependiente del nivel socioeconómico o depende en parte de ese nivel?. Si se trata de unaencuesta de opiniones ¿podríamos determinar su existe una diferencia de opiniones entre hombresy mujeres respecto las compras de alimentos para la casa, colores de los autos, etc.?. El cálculo delas frecuencias esperadas se basan tanto en la hipótesis nula (la variable  X  es independiente de lavariable Y ) como en las frecuencias totales obtenidas, multiplicándose las frecuencias subtotales omarginales comunes a una casilla y dividiéndose entre la sumatoria total de las frecuencias, comose verá más adelante.

    La fórmula es:

         

     

    Donde: X 

    2 = valor estadístico de ji cuadrada.

    fo = frecuencia observada.fe = frecuencia esperada. 

    Pasos:

    1. Establecer tipo y escala de la variable2. Hipótesis de trabajo o de investigación3. Elección de la prueba.4. Planteamiento de las hipótesis estadísticas (Ho y Ha).5. Nivel de significación (α).6. Zona de rechazo.7. Gráfica de la zona de aceptación y rechazo de Ho.8.  Aplicar la prueba estadística: arreglar las observaciones en una tabla de contingencias.9. Determinar el valor teórico de las frecuencias para cada casilla.10. Calcular las diferencias entre los valores observados con respecto a los teóricos de cada casilla.11. Elevar al cuadrado las diferencias y dividirlas entre el valor teórico de la casilla correspondiente.12. Obtener la sumatoria de los valores anteriores, que es el estadístico X

    2.

    13. Calcular los grados de libertad (gl): gl = (K columnas -1) X [H hileras -1].

    14. El valor de X 2 

    se compara con los valores críticos de ji cuadrada de la tabla de valores críticos de X 

    2 y de acuerdo con los grados de libertad, y se determina la probabilidad.

    15. Decidir si se acepta o rechaza la hipótesis Ho, si  X 2 calculada es mayor (>) que  X 

    2 tabla, se

    rechaza Ho.16. Interpretar los resultados obtenidos.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    11/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 11

    Ejemplo:

    Comparar si el factor género influye en la cantidad de cigarros fumados por causa del estrés enpersonas que trabajan.

    Variables categóricas nominales

    Variable 1: Variable independiente: hombres y mujeres.Variable 2: Variable dependiente: Cantidad de cigarrillos fumados debido al estrés

    Elección de la prueba estadística.

    El modelo experimental tiene dos muestras independientes y la variable es categórica en escalanominal , presentando la frecuencia de los valores o de la tabulación de número de casos en cadaclase, con un tamaño de muestra mayor de 20, lo que en este caso mejora su eficacia. Además, esun estudio social que comprende una población pequeña en el que: a) se quiere contrastar oevaluar una hipótesis y b) no se conoce a priori la distribución de los datos de las variablesestudiadas. Por esto, se elige la prueba  X 

    2  de Pearson para dos muestras independientes (véase

    al final de la guía: Flujogramas/Flujograma 2).

    Hipótesis de trabajo o de investigación:

    Modelo para estas hipótesis:

    Si V.Ind . relación V. dep. (sección teórica).Entonces muestra V.Ind . relación V. dep. (sección práctica).

    Si   los hom bres y las mujeres   que laboran en empresas consumen  la misma  cantidad decigarrillo fumados por causa del estrés, entonces   una muestra del personal femenino ymascul ino   de un departamento de cobranzas de un banco regional (2013-2014) no presentarádiferencias entre la cantidad de cigarrillos fumados por causa del estrés .

    Ejemplos de relaciones entre variables:

    Caso A Caso B

    Relación en sección teórica la misma/igual/idéntica/semejantes/similares

    Diferente/ desigual/ disímiles/  desemejante/ dispar/ distinto 

    Relación en sección práctica no presentarán diferencias/ nose observarán diferencias/nose detectarán diferencias/ no

    hay diferencias

    se encontrarán diferencias/ presentará diferencias/ se

    observarán diferencias/ Si haydiferencias

    En conclusión

    Observar : se nul i f ican  diferencias, se niegan  las

    diferencias, no existendiferencias, no hay diferencias

    Observar : se afirman lasdiferencias, hay diferencias,

    existen diferencias, seconfirman las diferencias

    Guía para la redacción de: H o  (hipótesis nula) H 1  (hipótesis alterna)

    Planteamiento de las hipótesis estadísticas (H o hipótesis nula y H a o H 1  hipótesis alterna). 

    Modelo para estas hipótesis:

    Ho :  no hay diferencia entre las frecuencias de la variable dependiente o no hay dependencia entrelas variables estudiadas. La variación no es importante y es causada por el azar.  ( Ho : f1=f2=f3=fn).

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    12/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 12

    Ha:  si hay diferencia entre las frecuencias de la variable dependiente o existe dependencia entrelas variables estudiadas. La variación es importante y es causada por la posible variableindependiente. ( Ha : f1≠f2≠f3≠fn o al menos 2 frecuencias son diferentes).

    Planteamiento de las hipótesis estadísticas del problema:

      Hipótesis nu la (Ho). No habrá diferencia significativa entre la cantidad de cigarros fumados porcausa del estrés en hombres y mujeres que trabajan, ya que no hay dependencia entre lasvariables estudiadas por lo que las escasas variaciones en el consumo de cigarros por causa delestrés se puede considerar como efecto del azar.

      Hipótesis alt erna (Ha).  Habrá diferencia significativa entre la cantidad de cigarros fumados porcausa del estrés en hombres y mujeres que trabajan, ya que existe dependencia entre las variablesestudiadas por lo que las relevantes variaciones en el consumo de cigarros se puede considerarcomo efecto/causa del estrés. La hipótesis alterna también se conoce como H1.,

    Nivel de significación: (α = 0,05).

    El valor alfa (α) es la probabilidad de rechazar Ho, siendo Ho verdadera : (error de tipo 1 o error detipo alfa (α) o falso positivo) no aceptar la Ho, siendo verdadera. Para este valor:

    a) Si el valor de X2

     tabla es superior al valor de X2

     calculado, se acepta o no se rechaza Ho.b) Si el valor de X

    2 tabla es menor al valor de X

    2 calculado, se rechaza Ho y se acepta Ha.

    c) Dicho de otro modo, para todo valor de probabilidad de X2  calculado  que seanuméricamente igual o menor que 0,05, se acepta Ha y se rechaza Ho (los paquetesestadísticos SPSS, R, Statgraphics, etc. presentan los resultados de esta forma). Si laprobabilidad tiene un valor numéricamente alto (mayores que 0,05, como 0,06/0,07/0,1, etc.)se considera que la desviación es debida al azar y que los datos respaldan la Ho por lo que serechaza Ha. Si la probabilidad es numéricamente baja (menores que 0,05, como0,04/0,03/0,02/0,01/0,0005, etc.), la desviación no es debida al azar y que los datos respaldanla Ha.

    Zona de rechazo.

      Si el valor de  X 2   calculado es mayor que el valor de  X 

    2   tabla (para α = 0,05 y un # de gl

    establecidos) se acepta Ha y se rechaza Ho. Dicho de otro modo:  Si el valor de X 

    2  tabla es menor al valor de  X 

    2  calculado se acepta Ha y se rechaza Ho.

      Si el valor de X 2  tabla es mayor al valor de  X 

    2  calculado se acepta Ho y se rechaza H1.

      Si el valor de probabilidad de  X 2   calculado es menor que 0,05 (como 0,04/0,03/0,005, etc.)

    para el # de grados de libertad prefijados, se acepta la Ha.

    Gráfica de la zona de aceptación y rechazo de Ho.

    Si el α del X2 calculado es numéricamente mayor a0,05 (0,06/0,07/0,8), se acepta Ho.

    Si el α del X2 calculado es numéricamente menor a0,05 (0,04/0,02/0,001), se acepta H1 

     X 2 tabla (α/GL) 

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    13/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 13

    Entonces tenemos que:

    Tabla de contingencia 3X2 con las frecuencias observadas

    Variable género

    Variable fumar por estrésMARGINAL O

    SUBTOTALFUMA POR CAUSADEL ESTRÉS

    NO SABENO FUMA POR

    CAUSA DEL ESTRÉS

    HOMBRE 15 10 25 50

    MUJER 20 5 35 60

    MARGINAL OSUBTOTAL

    35 15 60 110

    TOTAL

     Aplicación de la prueba estadística.

    Calculamos los valores de la frecuencia teórica esperada para cada casilla.

    En este caso, el cálculo de las frecuencias esperadas se realiza multiplicándose las frecuenciassubtotales o marginales comunes a una casilla y dividiéndose entre la sumatoria total de lasfrecuencias.

         

       

     

               

     Agrupamos estos valores de la frecuencia esperada en una tabla:

    Tabla de las frecuencias esperadas:

    FUMA POR CAUSADEL ESTRÉS

    NO SABENO FUMA POR

    CAUSA DEL ESTRÉSMARGINAL O

    TOTAL

    HOMBRE 15,91 6,82 27,27 50

    MUJER 19,09 8,18 32,73 60

    MARGINAL OTOTAL 35 15 60 110

    Una gráfica de la frecuencia observada y esperada sería la siguiente:

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    14/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 14

    Una vez obtenidos los valores teóricos, aplicamos la fórmula de X 2.

         

     

    Donde:

    X2= valor estadístico de ji cuadrada.

    fo = frecuencia observada.

    fe = frecuencia esperada. 

    Cálculo de X 2:

     

         

     

    También podemos hacer estos cálculos en forma tabular:

    Calculo de la estadística de prueba X 2para los datos de género vs. causa del fumar

    0

    5

    10

    15

    20

    25

    30

    35

    Hombrefuma por

    estrés

    Hombre nosabe

    Hombre nofuma por

    estrés

    Mujer fumapor estrés

    Mujer nosabe

    Mujer nofuma por

    estrés

    15

    10

    25

    20

    5

    35

    15,91

    6,82

    27,27

    19,09

    8,18

    32,73

       F   r   e   c .

       A    b   s   o    l .   s   i   m .    (

       F   A   S    )

    Género fuma o no por estrés

    Frecuencia observada y esperada para género y fumar o no por estres

    F. observada

    F. esperada

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    15/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 15

    Variablegénero

    Variable fumar fo fe (fo-fe) (fo-fe)2  (fo-fe)2/fe

    HOMBREFuma por causa del

    estrés15 15,91 -0,91 0,8281 0,0520

    HOMBRE No sabe 10 6,82 3,18 10,1124 1,4828

    HOMBRE No fuma por causa delestrés

    25 27,27 -2,27 5,1529 0,1890

    MUJERFuma por causa del

    estrés20 19,09 0,91 0,8281 0,0434

    MUJER No sabe 5 8,18 -3,18 10,1124 1,2362

    MUJERNo fuma por causa del

    estrés35 32,73 2,27 5,1529 0,1574

     X 2  3,1608

    Cálculo de los grados de libertad (gl).

    gl = (K - 1) (H - 1) = (3 - 1) (2 - 1) = 2 (k = columnas y h = hileras o filas)

    Nivel de significación: α = 0,05.

    El valor de  X 2  calculado de 3,15 con 2 grados de libertad. Este dato se compara con los de la

    tabla de valores críticos de ji cuadrada; en la misma se puede obtener el valor de  X 2

    (0,05,2) es 5,99,que corresponde a la probabilidad de 0,05, lo cual significa que: a) el valor X 

    2 tabla es menor que el

    valor X 2 calculado, por lo que no s e puede rechazar la hipótesis nu la  y b) el estadístico calculado

    tiene una probabilidad numéricamente mayor que 0,05, ya que 3,16 se encuentra entre los valoresde 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad (probablemente 0,2054,obtenido por DIST:CHI de Excel) por lo que no p odemos rechazar la hipótesis n ula . Dicho deotra forma, si observamos la tabla de valores críticos de X 

    2 al final de la guía, los valores de X2

    más parecidos a 3,15 son: 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad para 2grados de libertad. En esta tabla, para estos grados de libertad (2), estos valores de X 

    2  son los más

    parecidos al valor de  X 2  calculado  de 3,15 obtenido, y sus niveles de significación ya son

    numéricamente mayores que 0,05. El valor de probabilidad real (P valor de X 2   calculado es 0,2054,obtenido con DIST.CHI de Excel) es numéricamente mayor de 0,05. Por todo esto, no podemosrechazar la hipótesis nu la .

    Decisión.

    En razón de que el valor de  X 2 o ji cuadrada calculada es de 3,15 y es menor que el valor de X2

    tabla (0,05,2) cuyo valor es de 5,99, se acepta la Ho y se rechaza la Ha. También pude decirse quela X 

    2  calculada tiene una probabilidad numéricamente mayor que 0,05 (en este caso es 0,2054),

    por lo que cae en la zona de aceptación de Ho. Entonces no hay diferencias significativas entre elconsumo de cigarros por causa del estrés entre hombres y mujeres que trabajan.

    Ver gráfica a continuación.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    16/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 16

    Si el α del X calculado es numéricamente mayor a

    0,05 (0,06/0,07/0,8), se acepta Ho.Si el α del X  calculado es numéricamente menor a

    0,05 (0,04/0,02/0,001), se acepta H1

    Otra forma de ver este gráfico sería:

    (Escala aproximada)

    Si el α del X calculado es numéricamente mayor a 0,05

    (0,06/0,07/0,8), se acepta Ho.Si el α del X  calculado es numéricamente

    menor a 0,05 (0,04/0,02/0,001), se acepta H1

    Resultado de Statg raphic ś Centur ion XV:Pruebas de IndependenciaPrueba  Estadístico  Gl   Valor-P  

    Chi-Cuadrada 3,165 2 0,2055 

    El StatAdvisor

    X2 tabla (0,05;2)= 5,99X

    2 calculado= 3,16

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    17/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 17

    Esta tabla muestra los resultados de la prueba de hipótesis ejecutada para determinar si serechaza, o no, la idea de que las clasificaciones de fila y columna son independientes (Ho). Puestoque el valor-P es mayor o igual que 0,05, no se puede rechazar la hipótesis de que filas ycolumnas son independientes (Ho) con un nivel de confianza del 95,0%. Por lo tanto, la filaobservada para un caso en particular, pudiera no tener relación con su columna.

    Puede observarse que los paquetes estadísticos no emplean el valor crítico o tabla del estadístico

    calculado (X 2 

    ), sino que trabajan con el P valor del estadístico calculado, que en este caso es X 2  

    para aceptar o rechazar la Ho.

    Interpretación.

    El consumo de cigarros entre hombres y mujeres que trabajan, no se debe al estrés, se debe adiversos factores ocasionado por el azar.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    18/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 18

    Prueba j i (X 2  ) cuad rad a de Pear son par a tres o más mues tras indep end ien tes

    Ejemplo:

    En una investigación transversal de enfermedad diarreica en niños menores de seis años, unmédico tuvo el interés de conocer si existían diferencias respecto a la condición socioeconómica deuna población a la que estudio, o dicho de otro modo, ¿la incidencia de la enfermedad diarreica enniños menores de seis años es independiente del nivel o condición socioeconómica o depende enparte de ese nivel?.

    Variable categórica ordinal

    Variable 1: variable independiente: condición o nivel socioeconómico (alto, medio, bajo).

    Variable categórica nominal

    Variable 2: variable dependiente: niños menores de 6 años en condición diarreica (con diarrea y sindiarrea).

    Elección de la prueba estadística.

    El modelo experimental tiene 3 o más muest ras ind epend ientes  y las variables son categóricas

    en escala nom inal y ordinal, presentando la frecuencia de los valores o de la tabulación denúmero de casos en cada clase, con un tamaño de muestra por casilla mayor de 5. Además,estamos interesados en con trastar las 3 mu estras independientes estudiadas , es un estudiosocial que comprende una población relativamente pequeña en el que: a) se quiere contrastar oevaluar una hipótesis y b) no se conoce a priori la distribución de los datos de las variablesestudiadas. Por esto, se elige la prueba  X 

    2   de Pearson para 3 o más muestras independientes

    (véase al final de la guía: Flujogramas/Flujograma 4).

    Hipótesis de trabajo o de investigación:

    Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en lostres grupos de condición socioeconómica.

    Modelo para estas hipótesis:

    Si V.Ind . relación V. dep. (sección teórica).

    Entonces muestra V.Ind. relación V. dep. (sección práctica).

    Planteamiento de la hipótesis de investigación de este ejemplo:

    Si  el nive l socioeconómico  afecta/influye en la incidencia de la enfermedad diarréica en niñosmenores de 6 años, entonces   una muestra no probabilística de niños menores de 6 añospertenecientes a 3 distintos estratos sociales  de la ciudad de Maracay (2013-2014)  presentarándiferencias en la incidencia de la enfermedad diarréica.

    Ejemplos de relaciones entre variables:

    Caso A Caso B

    Relación en secciónteórica

    No afecta/ no influ ye/ no altera/la m isma/igu al/idént ica /semejantes/simi lares

    Afecta/ inf luye/ altera/Diferente/ desiguales/

    d isím il es

    Relación en sección práctica

    no p resent arán d iferenc ias/ nose ob serv arán dif erenci as/no s edetect arán d iferenc ias/ no hay

    diferencias

    se enc on trarán d iferenc ias/pres entará difer enc ias/ s eob serv arán dif erenci as/ Si

    hay diferencias

    En conclusión

    Observar: se nul i f icandiferencias, no hay diferencias,no existen d iferencias, se niegan

    las diferencias

    Observar: se afirman lasdiferencias, hay diferencias,

    existen diferencias, seconf i rman las di ferencias

    Guía para la redacción de: H o  (hipótesis nula) H 1  (hipótesis alterna)

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    19/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 19

    Planteamiento de las hipótesis estadísticas (H o y H a ).

    Modelo para estas hipótesis:

    Ho   (nulifica diferencias entre las frecuencias): no hay diferencia entre las frecuencias observadaspara la variable dependiente, por lo que existe independencia o no hay dependencia/relación entrelas variables estudiadas. La variación es causada por el azar. ( Ho : f1=f2=f3=fn).

    Ha  (afirma/confirma diferencias entre las frecuencias): si hay diferencia entre las frecuencias de lavariable dependiente o existe dependencia o relación entre las variables estudiadas. La variaciónes causada por la posible variable independiente. ( Ha : f1≠f2≠f3≠fn o al menos 2 frecuencias sondiferentes).

    Planteamiento de las hipótesis estadísticas del problema:

      Hipótesis alterna (Ha) .  Existen diferencias relevantes entre las frecuencias o incidencias de laenfermedad diarreica en niños menores de 6 años que pertenecen a las tres clases económicasestudias. En otras palabras, las diferencias que se observan en las frecuencias de enfermedaddiarreica en las tres clases socioeconómicas no se deben al azar, por lo que se puede afirmar queexiste  una relación o dependencia entre las variables estudiadas (Nivel socioeconómico y lapresencia de la enfermedad).

      Hipótesis nula (Ho) . No existen diferencias significativas entre las frecuencias de la enfermedaddiarreica en niños menores de 6 años que pertenecen a las tres clases económicas estudias. Enotras palabras, las diferencias que se observan en las frecuencias de enfermedad diarreica en lastres clases socioeconómicas se deben al azar, por lo que se puede afirmar que no existe  unarelación entre las variables estudiadas o que las mismas son independientes   entre si (Nivelsocioeconómico y la presencia de la enfermedad).

    Nota : si se da el caso de la aceptación de la hipótesis alterna, esto pudiera deberse a que la mayorfrecuencia, incidencia o presencia de la enfermedad diarreica se observa en la condiciónsocioeconómica baja; a su vez, la mayor frecuencia observada en niños sanos  se presenta en elnivel socioeconómico alto. Estas diferencias son significativas. Esta hipótesis alterna (Ha o H1) es laque posee una mayor diferencia de la presencia de la enfermedad entre las clases sociales.

    Nivel de significación: (α = 0,05). 

    Nota: debemos recordar que alfa (α) es la probabilidad de rechazar la hipótesis nula (Ho), siendoesta verdadera, también conocido como la probabilidad de cometer el error de tipo alfa (α), falsopositivo o error de tipo 1. Dicho de otro modo, se afirma la existencia de una diferencia entre lasfrecuencias observada y esperada cuando en realidad no existe.

    Zona de rechazo.

    Si el valor de X2  calculado es mayor que el valor de X

    2  tabla (para α = 0,05 y un # de gl

    establecidos) se acepta Ha y se rechaza Ho (

     ).

    Si el valor de probabilidad de X2  calculado es numéricamente menor que 0,05 (como

    0,04/0,03/0,005, etc.) para el # de grados de libertad prefijados, se acepta la Ha.

    Dicho de otro modo:

    a) Si el valor de X 2 tabla es superior al valor de X 

    2 calculado, se acepta o no se rechaza Ho.

    b) Si el valor de X 2 tabla es menor al valor de  X 

    2 calculado, se rechaza Ho y se acepta Ha.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    20/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 20

    c) Dicho de otro modo, para todo valor de probabilidad de X2 calculado que sea igual omenor que 0,05, se acepta Ha y se rechaza Ho (los paquetes estadísticos SPSS, R,Statgraphics, etc. presentan los resultados de esta forma). Si la probabilidad tiene un valornuméricamente alto (mayores que 0,05, como 0,06/0,07/0,1, etc.) se considera que ladesviación es debida al azar y que los datos respaldan la Ho por lo que se rechaza Ha. Sila probabilidad es numéricamente baja (menores que 0,05, como0,04/0,03/0,02/0,01/0,0005, etc.), la desviación no es debida al azar y que los datosrespaldan la Ha.

    Gráfica d e la zona d e aceptac ión y r echazo d e Ho.

    Si el α del X2 calculado es numéricamente mayor a 0,05(0,06/0,07/0,8), se acepta Ho.

    Si el α del X2 calculado es numéricamentemenor a 0,05 (0,04/0,02/0,001), se acepta H1

    Entonces tenemos que:

    Tabla de contingencia (2X3) del estado de la enfermedad diarreica con grupo condiciónsocioeconómica (frecuencias observadas).

    Grupo según estado de la enfermedad

    Grupo según nivelsocioeconómico

    Con diarrea Sin diarrea MARGINAL OSUBTOTAL

     Alta 15 25 40

    Media 20 32 52

    Baja 60 15 75

    MARGINAL OSUBTOTAL

    95 72 167

    TOTAL

     Aplicación de la prueba estadística.

    Calculamos los valores de la frecuencia teórica esperada para cada casilla.

    Se calculan las frecuencias esperadas basándonos en la hipótesis nula, la cual afirma que: a) noexisten diferencias significativas entre las frecuencias de las variables estudiadas (nivelsocioeconómico y presencia de la enfermedad), b) las variables son independientes o no guardanrelación entre si y c) las diferencias se deben al azar o a efectos de muestreo. En este caso, si lahipótesis nula (Ho) es correcta y la incidencia de la enfermedad es independiente del nivelsocioeconómico, deberíamos esperar a que hubiera la misma proporción de sujetos quecontrajeron la dolencia en cualquier de los tres niveles socioeconómicos, por lo que el cálculo de

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    21/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 21

    las frecuencias esperadas se realiza multiplicándose las frecuencias subtotales o marginalescomunes a una casilla y dividiéndose entre la sumatoria total de las frecuencias.

     Agrupamos estos valores de la frecuencia esperada en una tabla:

    Tabla de las frecuencias esperadas:

    Grupo según nivelsocioeconómico

    Grupo según estado de la enfermedad MARGINAL OSUBTOTAL DE LAS

    FILASCon diarrea Sin diarrea

     Alta 22,75 17,24 40

    Media 29,58 22,42 52

    Baja 42,66 32,33 75

    MARGINAL OSUBTOTAL DE LAS

    COLUMNAS95 72 167

    TOTAL

    Una vez obtenidos los valores teóricos, aplicamos la fórmula.

         

     

    Donde:

    X2= valor estadístico de ji cuadrada.

    fo = frecuencia observada.

    fe = frecuencia esperada. 

    Cálculo de X 2:

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    22/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 22

     

            

    También podemos hacer estos cálculos en forma tabular:

    Cálculo de la estadística de prueba  X 2

    para los datos de estado enfermedad vs. nivelsocioeconómico.

    Variablenivel socioeconómico

    Variableestado

    enfermedadFo fe (fo-fe) (fo-fe)2 (fo-fe)2/fe

    Alta Con diarrea 15 22,75 -7,75 60,0625 2,6401

    Alta Sin diarrea 25 17,25 7,75 60,0625 3,4819

    Media Con diarrea 20 29,58 -9,58 91,7764 3,1027

    Media Sin diarrea 32 22,42 9,58 91,7764 4,0935

    Baja Con diarrea 60 42,66 17,34 300,6756 7,0482

    Baja Sin diarrea 15 32,34 -17,34 300,6756 9,2973

     X 2  29,6637

    Las diferencias entre las frecuencias se pueden observar mejor en este gráfico:

    Cálcu lo d e los g rado s de l ibertad (gl).

    gl = (K - 1) x (H - 1) = (2 - 1) x (3 - 1) = 2 (k = columnas y h = hileras o filas).

    0

    10

    20

    30

    40

    50

    60

    Con diarrea Sin diarrea Con diarrea Sin diarrea Con diarrea Sin diarrea

    Clase Alta Clase Alta Clase Media Clase Media Clase Baja Clase Baja

    15

    25

    20

    32

    60

    15

    22,75

    17,25

    29,58

    22,42

    42,66

    32,34

       F   r   e   c   u   e   n   c   i   a   a    b   s   o    l   u   t   a    (   F   A   S    )

    Nivel socioeconómico y estado enfermedad

    Frecuencia (obs/esp) para cada nivel socioeconomico y estado

    enfermedad

    frecuencia observada

    frecuencia esperada

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    23/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 23

    Nivel de signif ic aci ón: α = 0,05.

    El valor de X 2 calculado de 29,664 con 2 grados de libertad. Este dato se compara con los de la tabla

    de valores críticos de ji cuadrada; en la misma se puede obtener el valor de  X 2

    (0,05,2) es 5,99, quecorresponde a la probabilidad de 0,05, lo cual significa que: a) el valor  X 

    2 calculado es mayor que

    el valor X 2 tabla, por lo que se puede rechazar la hipótesis nula  y b) el estadístico calculado ( X 

    2  

    calculado) tiene una probabilidad menor que 0,05 por lo que podemos rechazar la hipótesis n ula .

    Si observamos la tabla de valores críticos de X 2

     al final de la guía, el mayor valor que podemosobtener de X 

    2  para 2 grados de libertad es 10,597 para un nivel de significación de 0,005. En esta

    tabla, para estos grados de libertad (2), este valor de X 2  es el más parecido al valor de X 

    2 calculado de

    29,664 obtenido, y su nivel de significación ya es menor que 0,05. En una tabla más grande, elvalor crítico de ji o X 

    2cuadrada con 2 grados de libertad más cercano al calculado es de 27,63, con

    una probabilidad igual a 0,000001 (P valor de X 2   calculado es 3,61x10

    -7, obtenido con DIST.CHI de

    Excel). Por todo esto, podemos rechazar la hipótesis nu la .

    Decisión.

    En razón de que el valor de X 2 o ji cuadrada calculada es de 29,664 y es mayor que el valor de X

    tabla (0,05,2) cuyo valor es de 5,99, se rechaza la Ho y se acepta la Ha. El estadístico X2

    calculadode 29,64 con 2 grados de libertad tiene una probabilidad de 3,61x10

    -7  (DIST.CHI) y menor que

    0,05, por lo que se rechaza Ho. Por lo tanto, se acepta Ha y se rechaza Ho. Todo esto se confirma

    con los resultados obtenidos en paquete estadístico Statgraphic´s Centurión XV  para esteproblema:

    Statg raphic ś Centu rión XV:

    Pruebas de IndependenciaPrueba  Estadístico  Gl   Valor-P  

    Chi-Cuadrada 29,664 2 0,0000 

    El StatAdvisorEsta tabla muestra los resultados de la prueba de hipótesis ejecutada para determinar si serechaza, o no, la idea de que las clasificaciones de fila y columna son independientes. Puesto queel valor-P es menor que 0,05, se puede rechazar la hipótesis de que filas y columnas sonindependientes con un nivel de confianza del 95,0%. Por lo tanto, la fila observada para un casoparticular, está relacionada con su columna.

    Esto puede apreciarse en los siguientes gráficos:

    (valores de prob./escala aproximada)Si la probabilidad del X  calculado es numéricamente

    mayor a 0,05 (0,06/0,07/0,8), se acepta Ho.Si la probabilidad del X  calculado es

    numéricamente menor a 0,05 (0,04/0,02/0,001),se acepta H1

    X2 calculado (3,61x10

    -7/2)= 29,664X

    2 tabla 0 05 2 = 5 99

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    24/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 24

    Interpretación. 

    Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en lostres grupos de condición socioeconómica, por lo que ambas variables están relacionadas o sondependientes. La población de niños de condición socioeconómica baja muestra la frecuencia másalta de diarrea, con respecto a los otros grupos sociales. Estas diferencias son significativas al nivelde confianza de p menor que 3,61x10

    -7 (DIST.CHI), según la gráfica anterior.

    Entre las clases socioeconómicas media y alta parece no existir diferencia alguna, lo cual se puedecomprobar al construir las tablas de contingencias y al ejecutar la prueba X

    2  como ejercicio e

    interpretarla.

    Contingencia 2 X 2; clase media y alta en oposición a clase baja.

    Grupo Con diarrea Sin diarrea Total

    Clase baja + media 35 57 92

    Clase baja 60 15 75

    Total 95 72 167

    X2

    (1gl) = 29.66 p menor que 0,001

    Contingencia 2 X 2; clase media y alta en oposición a clase baja.

    Grupo Con diarrea Sin diarrea Total

    Clase alta 15 25 40

    Clase media 60 15 75

    Total 35 57 92X

    2(1gl) = 0,008 p menor que 0,05

    Nota : muchos investigadores consideran que la prueba  X 2   de independencia como un

    planteamiento alternativo a la consideración de la prueba  X 2   utilizada para evaluar diferencias

    potenciales entre variables que influyen en muestras pertenecientes a determinadas poblaciones,por lo que para una tabla de contingencias que tiene C columnas y F filas, hileras o renglones, laprueba  X 

    2  puede generalizarse como una prueba de independencia mediante la presentación de

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    25/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 25

    una análisis confirmatorio más formal basado en una hipótesis de independencia en las respuestasconjuntas de dos variables categóricas.

    Según estos autores, como prueba de independencia, las hipótesis nulas y alternativas serían:

    Ho: las dos variables categóricas son independientes (es decir, no hay relación entre ellas).

    H1: las dos variables categóricas están relacionadas (es decir, son dependientes entre ellas).

    Según este planteamiento, el nivel de significación, zona de rechazo, la gráfica de aceptación yrechazo, la aplicación de la prueba estadística, la fórmula de los estadísticos de prueba, suaplicación y las reglas de decisión son las mismas, las hipótesis establecidas y las conclusiones alas que se llegan son diferentes.

    En consecuencia, por ejemplo, en el caso anterior, llegamos a la conclusión de que habíaevidencia de la existencia de diferencias significativas entre las frecuencias observadas deenfermedad diarreica en los tres grupos de condición socioeconómica. Desde un punto de vistadiferente, podemos llegar a la conclusión de que existe una relación significativa o dependenciaentre la incidencia de la enfermedad diarreica y la condición socioeconómica de los niñosestudiados.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    26/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 26

    Prueba ji cuadrada de proporciones para tres o más muestras

    independientes

    La prueba de ji cuadrada de proporciones (X2) es un modelo estadístico aplicable cuando en el

    modelo experimental se tienen múltiples muestras (tres o más muestras) independientes.

    La razón de dicha prueba estadística radica en que si el tamaño de las muestras es pequeño(menor que 5), conservará la misma eficacia que la X

    2 de Pearson con tamaños grandes de

    muestra.

    La fórmula de esta prueba es:

    Donde:

    X2 = estadística de ji cuadrada.

    = proporción promedio de que acontezca el suceso.

    = proporción promedio de que no acontezca el suceso, expresada en proporción.

    p = proporción observada del suceso.

    Ni = tamaño de la muestra del subgrupo. 

    Pasos.

    1. Elaborar una tabla de contingencias y calcular las proporciones de cada subgrupo. Determinarlas probabilidades promedio de que acontezca o no el suceso.

    2. Calcular las diferencias de las probabilidades observadas con respecto a la probabilidad

    promedio (p - ), elevarlas al cuadrado (p - )2, multiplicarlas por el tamaño de la muestra delsubgrupo y obtener la sumatoria Ni (p - )

    2.

    3. Calcular el recíproco del producto de y

    4. Multiplicar este último valor por la sumatoria calculada, que corresponde al estadístico X2p.

    5. Calcular los grados de libertad y el número de hileras -1 (H - 1).6. Comparar el estadístico de ji cuadrada de proporciones en la tabla de valores críticos de X

    2, de

    modo que se obtenga la probabilidad.7. Decidir si se acepta o rechaza la hipótesis.

    Ejemplo:

    Un investigador desea conocer el efecto que ejerce el ambiente físico de sobreestimulación en lascaracterísticas estructurales del cerebro, de manera que lo propone como alternativa para mejorarlas alteraciones que la desnutrición proteicocalórica produce en el encéfalo. En virtud de ello,planea un diseño experimental con 24 ratas de la raza Wistar, a la mitad de las cuales induce a la

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    27/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 27

    desnutrición con una dieta baja en proteínas. A las ratas restantes les aporta una dieta normal pararoedores. Divide estos dos subgrupos de animales en tres condiciones ambientales.

     Al término del experimento, los animales son sacrificados y se les extrae el cerebro, para obtener elpeso húmedo. El investigador considera a la masa total como un primer indicador de los cambiosestructurales del encéfalo.

    En virtud de que los pesos encefálicos poseen varianzas desiguales, no se distribuyennormalmente y los intervalos de los pesos no tienen una progresión aritmética, el investigadordecide no utilizar una prueba paramétrica. Por ello, elige distribuir los pesos en función de lamediana.

    Elección de la prueba estadística.

    El modelo experimental tiene tres o más grupos independientes y la variable es categórica en

    escala nominal, presentando la frecuencia de los valores o de la tabulación de número de casos encada clase, con un tamaño de muestra por casilla mayor de 5. Por esto, se elige la prueba  X 

    2  de

    Pearson para 3 o más muestras independientes (véase al final de la guía: Flujogramas/Flujograma4).

    Planteamiento de la hipótesis. 

      Hipótesis alterna (Ha). Las frecuencias observadas de las ratas, cuyos pesos se distribuyeron enfunción de la mediana, muestran diferencias significativas entre bien nutridos y desnutridos. Asimismo, hay diferencias en los animales aislados y estimulados.

      Hipótesis nula (Ho) Las diferencias en las frecuencias en la distribución con base en la mediana delos pesos encefálicos se deben al azar.

    Nivel de significación.

    Para todo valor de probabilidad igual o menor que 0,05, se acepta Ha y se rechaza Ho.

    Zona de rechazo.

    Para todo valor de probabilidad mayor que 0,05, se acepta Ho y se rechaza Ha.

     Aplicación de la prueba estadística.

    Las frecuencias observadas de los pesos cerebrales distribuidos en función de la mediana y elcálculo de las proporciones para cada subgrupo.

    Peso encefálico de 24 ratas.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    28/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 28

    Cálculo de los grados de libertad (gl).

    gl = H - 1 = 6 - 1 = 5

    El estadístico X2p de 12 se compara con los valores críticos de X

    2 y se determina la probabilidad.

    Se puede observar que el valor de 11.07 con cinco grados de libertad corresponde a un valor de pigual a 0,05. El calculado es mayor que el crítico y, por lo tanto, con p menor que 0,05.

    Decisión. 

    En razón de que el valor estadístico tiene una probabilidad menor que 0,05, cae en el nivel designificancia, de manera que se acepta Ha y se rechaza Ho.

    Interpretación. Existen diferencias significativas, al nivel de confianza de p menor que 0,05, entre las frecuenciasde los pesos de los cerebros distribuidos en relación con la mediana. En los animales bien nutridosse observan bajas frecuencias inferiores a la mediana, en oposición a lo observado en ratasdesnutridas.

    Respecto al ambiente, parece que no hay diferencias entre los aislados y los estimulados; sinembargo, al aplicarse la prueba estadística, los animales no contestan la pregunta planteada por lahipótesis alterna, en el sentido de que en los estimulados y los aislados también existendiferencias.

    Recuerde que esto es solo una guía, incremente sus conocimientos consultando laliteratura especializada recomendada para este curso en la biblioteca de la UBA, ladisponible en las páginas especializadas en INTERNET o la que usted pueda obtener enlas bibliotecas locales.

    También puede ver el siguiente video: Análisis de la relación entre dos variables cualitativas:Test Chi cuadrado. Módulo 4 https://www.youtube.com/watch?v=XvPEeQAjTW8. 

    https://www.youtube.com/watch?v=XvPEeQAjTW8https://www.youtube.com/watch?v=XvPEeQAjTW8https://www.youtube.com/watch?v=XvPEeQAjTW8https://www.youtube.com/watch?v=XvPEeQAjTW8

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    29/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 29

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    30/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 30

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    31/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 31

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    32/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 32

    Valores críticos de X 2 Para una combinación particular de grados de libertad y nivel de significación, lasentradas representan los valores críticos de  X 

    2  correspondientes a un área de extremo

    superior especificada (α). Valores críticos obtenidos mediante la funciónPRUEBA.CHI.INV de Excel. Los valores tabulados pueden emplearse en una pruebabilateral o de dos colas, cuando la Ho indica igualdad y la Ha indica desigualdad deproporciones, medias, etc. El X2 calculado a un alfa (α) dado es significativo si es igual omayor que el valor indicado en la tabla.

    Nivel de significación (puede emplearse en una prueba bilateral o de dos colas)

    GL 0,995 0,99 0,975 0,95 0,9 0,75 0,25 0,1 0,05 0,025 0,01 0,005

    1 0,000 0,000 0,001 0,004 0,016 0,102 1,323 2,706 3,841 5,024 6,635 7,879

    2 0,010 0,020 0,051 0,103 0,211 0,575 2,773 4,605 5,991 7,378 9,210 10,597

    3 0,072 0,115 0,216 0,352 0,584 1,213 4,108 6,251 7,815 9,348 11,345 12,838

    4 0,207 0,297 0,484 0,711 1,064 1,923 5,385 7,779 9,488 11,143 13,277 14,860

    5 0,412 0,554 0,831 1,145 1,610 2,675 6,626 9,236 11,070 12,833 15,086 16,750

    6 0,676 0,872 1,237 1,635 2,204 3,455 7,841 10,645 12,592 14,449 16,812 18,548

    7 0,989 1,239 1,690 2,167 2,833 4,255 9,037 12,017 14,067 16,013 18,475 20,278

    8 1,344 1,646 2,180 2,733 3,490 5,071 10,219 13,362 15,507 17,535 20,090 21,955

    9 1,735 2,088 2,700 3,325 4,168 5,899 11,389 14,684 16,919 19,023 21,666 23,589

    10 2,156 2,558 3,247 3,940 4,865 6,737 12,549 15,987 18,307 20,483 23,209 25,188

    11 2,603 3,053 3,816 4,575 5,578 7,584 13,701 17,275 19,675 21,920 24,725 26,757

    12 3,074 3,571 4,404 5,226 6,304 8,438 14,845 18,549 21,026 23,337 26,217 28,300

    13 3,565 4,107 5,009 5,892 7,042 9,299 15,984 19,812 22,362 24,736 27,688 29,819

    14 4,075 4,660 5,629 6,571 7,790 10,165 17,117 21,064 23,685 26,119 29,141 31,319

    15 4,601 5,229 6,262 7,261 8,547 11,037 18,245 22,307 24,996 27,488 30,578 32,801

    α 1 - α 

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    33/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 33

    Nivel de significación (puede emplearse en una prueba bilateral o de dos colas)

    GL 0,995 0,99 0,975 0,95 0,9 0,75 0,25 0,1 0,05 0,025 0,01 0,005

    16 5,142 5,812 6,908 7,962 9,312 11,912 19,369 23,542 26,296 28,845 32,000 34,267

    17 5,697 6,408 7,564 8,672 10,085 12,792 20,489 24,769 27,587 30,191 33,409 35,718

    18 6,265 7,015 8,231 9,390 10,865 13,675 21,605 25,989 28,869 31,526 34,805 37,156

    19 6,844 7,633 8,907 10,117 11,651 14,562 22,718 27,204 30,144 32,852 36,191 38,582

    20 7,434 8,260 9,591 10,851 12,443 15,452 23,828 28,412 31,410 34,170 37,566 39,997

    21 8,034 8,897 10,283 11,591 13,240 16,344 24,935 29,615 32,671 35,479 38,932 41,401

    22 8,643 9,542 10,982 12,338 14,041 17,240 26,039 30,813 33,924 36,781 40,289 42,796

    23 9,260 10,196 11,689 13,091 14,848 18,137 27,141 32,007 35,172 38,076 41,638 44,181

    24 9,886 10,856 12,401 13,848 15,659 19,037 28,241 33,196 36,415 39,364 42,980 45,559

    25 10,520 11,524 13,120 14,611 16,473 19,939 29,339 34,382 37,652 40,646 44,314 46,928

    26 11,160 12,198 13,844 15,379 17,292 20,843 30,435 35,563 38,885 41,923 45,642 48,290

    27 11,808 12,879 14,573 16,151 18,114 21,749 31,528 36,741 40,113 43,195 46,963 49,645

    28 12,461 13,565 15,308 16,928 18,939 22,657 32,620 37,916 41,337 44,461 48,278 50,993

    29 13,121 14,256 16,047 17,708 19,768 23,567 33,711 39,087 42,557 45,722 49,588 52,336

    30 13,787 14,953 16,791 18,493 20,599 24,478 34,800 40,256 43,773 46,979 50,892 53,672

    31 14,458 15,655 17,539 19,281 21,434 25,390 35,887 41,422 44,985 48,232 52,191 55,003

    32 15,134 16,362 18,291 20,072 22,271 26,304 36,973 42,585 46,194 49,480 53,486 56,328

    33 15,815 17,074 19,047 20,867 23,110 27,219 38,058 43,745 47,400 50,725 54,776 57,648

    34 16,501 17,789 19,806 21,664 23,952 28,136 39,141 44,903 48,602 51,966 56,061 58,964

    35 17,192 18,509 20,569 22,465 24,797 29,054 40,223 46,059 49,802 53,203 57,342 60,275

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    34/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 34

    Nivel de significación (puede emplearse en una prueba bilateral o de dos colas) 

    GL 0,995 0,99 0,975 0,95 0,9 0,75 0,25 0,1 0,05 0,025 0,01 0,005

    36 17,887 19,233 21,336 23,269 25,643 29,973 41,304 47,212 50,998 54,437 58,619 61,581

    37 18,586 19,960 22,106 24,075 26,492 30,893 42,383 48,363 52,192 55,668 59,893 62,883

    38 19,289 20,691 22,878 24,884 27,343 31,815 43,462 49,513 53,384 56,896 61,162 64,181

    39 19,996 21,426 23,654 25,695 28,196 32,737 44,539 50,660 54,572 58,120 62,428 65,47640 20,707 22,164 24,433 26,509 29,051 33,660 45,616 51,805 55,758 59,342 63,691 66,766

    41 21,421 22,906 25,215 27,326 29,907 34,585 46,692 52,949 56,942 60,561 64,950 68,053

    42 22,138 23,650 25,999 28,144 30,765 35,510 47,766 54,090 58,124 61,777 66,206 69,336

    43 22,859 24,398 26,785 28,965 31,625 36,436 48,840 55,230 59,304 62,990 67,459 70,616

    60 35,534 37,485 40,482 43,188 46,459 52,294 66,981 74,397 79,082 83,298 88,379 91,952

    80 51,172 53,540 57,153 60,391 64,278 71,145 88,130 96,578 101,879 106,629 112,329 116,321

    100 67,328 70,065 74,222 77,929 82,358 90,133 109,141 118,498 124,342 129,561 135,807 140,169

    120 83,852 86,923 91,573 95,705 100,624 109,220 130,055 140,233 146,567 152,211 158,950 163,648

    140 100,655 104,034 109,137 113,659 119,029 128,380 150,894 161,827 168,613 174,648 181,840 186,847

    Región de

    aceptación de HoRegión de rechazo de

    Ho

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    35/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 35

     Anexo.

    Tipos de Variables, escalas y funciones CHI de Excel.

    a) Se denomina VARIABLE CATEGORICA o CUALITATIVA a las que describen un

    atributo, propiedad o características de un sujeto, fenómeno, factor, cosa, etc. y

    cuyos valores son categorías o clases excluyentes. Ejemplo: el sexo, la raza o

    clasificación étnica, la clase social, la categoría laboral, participar o nó en un

    programa de investigación o participación, el tipo de tratamiento aplicado, los

    distintos departamentos de una empresa, padecer o nó de un determinado

    síntoma, estado civil, nivel socioeconómico, color del pelo, color de los ojos, etc.

    Es una variable sobre las que únicamente es posible obtener una medida en

    escala de tipo nominal (u ordinal, pero con muy pocos valores). Cuando se trabaja

    con este tipo de variables, los datos pueden organizarse en tablas de doble o más

    entradas en las que cada entrada representa un criterio de clasificación o

    categoría (una variable categórica). Como resultado de esta clasificación, la

    frecuencia, el número de casos o el porcentaje de los mismos se presentan

    organizadas en casillas que contienen información sobre la relación existente entre

    ambos criterios. A estas tablas de frecuencias se les denomina tablas de

    contingencia.

    b) Se denomina VARIABLE CUANTITATIVAS O NUMERICAS a aquellas cuyas

    medidas posibles se pueden expresar por números, las que se han obtenido por

    medición o recuento. Por ejemplo: temperatura corporal, edades, número de

    pacientes hospitalizados, número de accidentes, tiempo de espera para ser

    atendido en un servicio, etc.

    Tipos De Variables Cuantitativas

    Se denomina VARIABLE CUANTITATIVA DISCRETA a aquellas cuyas posibles

    medidas son un conjunto finito o infinito numerable de valores numéricos.

    Por ejemplo: número de hijos por familia, número de accidentes por día, número de hojas

    por tallo de una cierta planta, etc.

    Se denomina VARIABLE CUANTITATIVA CONTINUA a aquellas cuyo valor observado

    está determinado por números reales, generalmente esas variables pueden tomar toda

    una gama de valores dentro de la recta real.

    Ejemplo: Peso de una persona, estatura; edad; presión sanguínea, etc.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    36/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 36

    Definiciones según otra bibliografía

    Tipos de variables: 

    Clasificación:

    Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas(categóricas), dependiendo si los valores presentados tienen o no un orden de magnitudnatural (cuantitativas), o simplemente un atributo no sometido a cuantificación(cualitativa).

    Una variable es medida utilizando una escala de medición. La elección de la(s) escala(s)de medición a utilizar depende, en primer lugar, del tipo de variable en estudio, y, además,del manejo estadístico a la que se someterá la información. En términos prácticos, existeuna correspondencia directa entre el concepto de variable y escala de medición.

    Un atributo corresponde a un valor específico e una variable, como ser el caso de lavariable sexo, la que posee dos atributos: varón o mujer. En variables que exploran elgrado de acuerdo o desacuerdo frente a una afirmación los atributos podrían ser:

    1 = muy en desacuerdo

    2 = en desacuerdo

    3 = indiferente

    4 = de acuerdo

    5 = muy de acuerdo

    Dependiendo de los valores que puede tener una variable cualitativa, ésta puede a su vezser dicotómicas (cuando sólo pueden adoptar un sólo valor sin jerarquía entre sí; hombre -

    mujer, positivo-negativo, presente-ausente), o bien, poli o multicotómicas ,si existe laposibilidad de que adopten múltiples valores (edad, talla, nivel socioeconómico, grupossanguíneos, calificación previsional de usuarios).

    1. Las variables cualitativas pueden agruparse en variables nominales u ordinales.Hablaremos de variable nominal cuando los datos correspondan a una variablecualitativa que se agrupa sin ninguna jerarquía entre sí, como por ejemplo:nombres de personas, de establecimientos, raza, grupos sanguíneos, estado civil.Estas variables no tienen ningún orden inherente a ellas ni un orden de jerarquía.

    2. Si las categorías o valores que adopte una variable cualitativa poseen un orden,secuencia o progresión natural esperable, hablaremos de variable ordinal, como

    por ejemplo: grados de desnutrición, respuesta a un tratamiento, nivelsocioeconómico, intensidad de consumo de alcohol, días de la semana, meses delaño, escalas de Killip o Apgar. A pesar de este orden jerárquico no es posibleobtener valoración numérica lógica entre dos valores.

    3. Las variables de tipo cuantitativo pueden a su vez ser clasificadas como continuaso discretas. Las escalas cuantitativas son reconocidas también como escalasintervalares o numéricas.

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    37/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 37

    Si entre dos valores determinados existen infinitas posibilidades de valores,hablaremos de una variable de tipo continuo. Ejemplos de este tipo de variablesson: el peso, la talla, la presión arterial o el nivel de colesterol sérico. En lapráctica, salvo contadas excepciones no se dispone de métodos de mediciónsofisticados como para poder medir exactamente los valores, por ejemplo, de talla.En estricto rigor, la probabilidad que dos individuos tengan exactamente la misma

    talla o edad es muy baja.

    Si la variable a medir sólo puede adoptar un sólo valor numérico, entero, convalores intermedios que carecen de sentido, hablaremos de variable cuantitativade tipo discreto. Son ejemplos de ellas: el número de hijos, de unidades vecinalesdel sector, número de exámenes de laboratorio o de pacientes atendidos.

    Tanto las variables discretas como las continuas pueden agruparse construyendointervalos, entre cuyos valores extremos se ubicarán las diferentes observacionesregistradas. Sin embargo, estrictamente hablando, sólo las variables continuaspueden ser objeto de categorización mediante intervalos.

    Cuantitativas (intervalares) 

    Continuas 

    Ej. Presión arterial, peso, edad, talla, IMC

    Discretas 

    Ej. Número de hijos, episodios de infecciónurinaria

    Categóricas (cualitativas) Ordinales 

    Ej.Etapificación tumores, Apgar, Killip

    Nominales -Dicotómicas : Ej vivo/muerto, sexo-Policotómicas : Ej. Grupo sanguíneo, raza

    Escalas de medición p ara var iables

    Definición de escala

    Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de cualquierclase; instrumento para asignar un número o guarismo que indicará cuánto hay de algo; un recursode medición que provee un conjunto de normas (numeradas de acuerdo con ciertas reglas detrabajo) con las que se puede comparar el objeto que será medido, para asignarle un número ovalor matemático que represente su magnitud. El término es de amplia aplicación: una escala dealguna clase está incluida en toda medición o estimación. Implícito en cada caso hay un conjuntode reglas para asignar números o valores: son estas reglas las que dan significado a lascantidades. Los objetos pueden ser perceptuales o conceptuales.

    La escala de medida de una característica tiene consecuencias en la manera de presentaciónde la información y el resumen. La escala de medición -grado de precisión de la medida de lacaracterística- también determina los métodos estadísticos que se usan para analizar los datos.Por lo tanto, es importante definir las características por medir. Las escalas de medición másfrecuentes son las siguientes:

    Escala Nominal.- No poseen propiedades cuantitativas y sirven únicamente para asignar, designaro identificar las clases. Los datos empleados con las escalas nominales constan generalmente dela frecuencia de los valores o de la tabulación de número de casos en cada clase, según la variable

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    38/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 38

    que se está estudiando. El nivel nominal permite mencionar similitudes y diferencias entre loscasos particulares. Los datos evaluados en una escala nominal se llaman también "observacionescualitativas", debido a que describen la cualidad, atributo o calidad de una persona o cosaestudiada, u "observaciones categóricas" porque los valores se agrupan en categorías. Por loregular, los datos nominales o cualitativos se describen en términos de porcentaje o proporciones.Para exhibir este tipo de información se usan con mayor frecuencia tablas de contingencia ygráficas de barras. Ejemplo: color de ojos, estado civil, sexo, etc. Usada principalmente por variablescualitativas o categóricas.

    Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras(característica que define a las escalas nominales) sino que mantiene una especie de relaciónentre sí. También permite asignar un lugar específico a cada objeto de un mismo conjunto, deacuerdo con la intensidad, fuerza, etc.; presentes en el momento de la medición. Una característicaimportante de la escala ordinal es el hecho de que, aunque hay orden entre las categorías, ladiferencia entre dos categorías adyacentes no es la misma en toda la extensión de la escala. Algunas escalas consisten en calificaciones de múltiples factores que se agregan después parallegar a un índice general. Usada principalmente por variables cualitativas o categóricas.

    Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala deposición", donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en

    las escalas nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.Ejemplo: nivel socioeconómico (Alto, Medio, Bajo), agresividad (intensa, promedio, baja), etc.

    Escala de Intervalo.- Refleja distancias equivalentes entre los objetos y en la propia escala. Esdecir, el uso de ésta escala permite indicar exactamente la separación entre 2 puntos, lo cual, deacuerdo al principio de isomorfismos, se traduce en la certeza de que los objetos así medidosestán igualmente separados a la distancia o magnitud expresada en la escala, por lo que empleaun intervalo igual y regular entre dos puntos de medida. También posee un punto “cero” relativo,debajo del cual la variable sigue existiendo y que es cuantitativamente distinto entre las distintasescalas empleadas para medir un mismo fenómeno (temperatura medida en °C, °F, °K, etc.,tiempo medido según diferentes civilizaciones como mayas, chinos, japoneses, calendariogregoriano, etc., coeficiente intelectual, etc.). Usada principalmente por variables cuantitativas ointervalares.

    Escala de Razón.- Constituye el nivel óptimo de medición, posee un cero verdadero o absolutocomo origen, también denominada escala de cocientes o proporciones. La existencia de un cero,natural y absoluto, significa la posibilidad de que el objeto estudiado carezca de propiedad medida,además de permitir todas las operaciones aritméticas y el uso de números representadacantidades reales de la propiedad medida.

    Con esto notamos que esta escala puede ser usada para medir la velocidad de respuesta de ciertofenómenos psicológicos, pero no de todos, pues no se puede hablar de cero inteligencia o ceroaprendizaje, etc. Usada principalmente por variables cuantitativas o intervalares. Consultas:

    http://www.ray-

    design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=237:descripcionn

    opara&catid=53:pruebasnopara&Itemid=62

    http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=239:ji-una-muestra&catid=53:pruebasnopara&Itemid=62 

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    39/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 39

    http://www.ray-

    design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=240:ji-mas-

    muestras&catid=53:pruebasnopara&Itemid=62

    DISTRIBUCIÓN CHI-CUADRADO EN EXCELFUNCIONES CON LA DISTRIBUCIÓN Y PRUEBAS X 2 

    DISTR.CHIDevuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chicuadrado de una sola cola. La distribución X2 está asociada a una prueba X2. Utilice laprueba X2 para comparar los valores observados con los esperados. Por ejemplo, unexperimento genético podría estar basado en la hipótesis de que la próxima generaciónde plantas presentará un conjunto determinado de colores. Al comparar los resultadosobservados con los resultados esperados, puede decidir si su hipótesis original es válida.

    Sintaxis

    DISTR.CHI(x;grados_de_libertad)X es el valor al que desea evaluar la distribución.Grados_de_libertad es el número de grados de libertad.

    Observaciones

    •  Si uno de los argumentos no es numérico, DISTR.CHI devuelve el valor de error#¡VALOR!

    •  Si el argumento x es negativo, DISTR.CHI devuelve el valor de error #¡NUM!•  Si el argumento grados_de_libertad no es un entero, se trunca.•  Si el argumento grados_de_libertad < 1 o si grados_de_libertad ≥ 10^10, 

      DISTR.CHI devuelve el valor de error #¡NUM!•  DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una variable

    aleatoria de X2.

    Función PRUEBA.CHI

    Devuelve la prueba de independencia. PRUEBA.CHI devuelve el valor de la distribución

    chi cuadrado (X 2 ) para la estadística y los grados de libertad apropiados. Puede usar

    pruebas X 2  para determinar si un experimento se ajusta a los resultados hipotéticos.

    IMPORTANTE Esta función se ha sustituido por una o más funciones nuevas que

    pueden proporcionar una mayor exactitud y cuyos nombres reflejan mejor su uso. Esta

    función sigue estando disponible para la compatibilidad con versiones anteriores de Excel.Sin embargo, si no se requiere la compatibilidad con versiones anteriores, sería

    aconsejable usar las nuevas funciones de ahora en adelante, porque describen con más

    exactitud su funcionalidad.Para obtener más información sobre la nueva función,

    consulte Función PRUEBA.CHICUAD. 

    https://support.office.microsoft.com/es-es/article/Funci%C3%B3n-PRUEBACHICUAD-7bc9aaf3-f49e-4b37-993d-c194fffde514https://support.office.microsoft.com/es-es/article/Funci%C3%B3n-PRUEBACHICUAD-7bc9aaf3-f49e-4b37-993d-c194fffde514https://support.office.microsoft.com/es-es/article/Funci%C3%B3n-PRUEBACHICUAD-7bc9aaf3-f49e-4b37-993d-c194fffde514https://support.office.microsoft.com/es-es/article/Funci%C3%B3n-PRUEBACHICUAD-7bc9aaf3-f49e-4b37-993d-c194fffde514

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    40/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 40

    Sintaxis

    PRUEBA.CHI (intervalo_real,intervalo_esperado) 

    Argumento  Descripción 

    intervalo_real  El intervalo de datos que contiene las observaciones para probar los

    valores esperados.

    intervalo_esperado  El intervalo de datos que contiene la relación del producto de totales de

    fila y columna con el total general.

    Comentarios generales

      Si los argumentos tienen un número distinto de puntos de datos, esta función devuelve el valor de

    error #N/A.

      La prueba χ 2 primero calcula una estadística χ 2 con la fórmula:  

     

     

    donde:

     A ij  = frecuencia real en la fila i, columna j

    E ij  = frecuencia esperada en la fila i, columna j

    r = número de filas

    c = número de columnas

      Un valor bajo de X 2  es un indicador de independencia. Como puede ver en la fórmula, X 

    2  siempre es

    positivo o 0, y es 0 sólo si A ij = E ij por cada i,j.

      PRUEBA.CHI devuelve la probabilidad de que un valor de la estadística X 2   sea al menos tan alto

    como el valor calculado por la fórmula anterior se pueda producir por casualidad con el supuesto deindependencia. Al calcular esta probabilidad, PRUEBA.CHI  usa la distribución X 2   con un número

    apropiado de grados de libertad, g l. Si r > 1 y c > 1, g l = (r - 1)x(c - 1). Si r = 1 y c > 1, g l = c - 1 o si

    r > 1 y c = 1, g l = r - 1. r = c= 1 no se permite y se devuelve #N/A.

      El uso de PRUEBA.CHI resulta muy adecuado cuando cada E ij no es demasiado pequeño. Algunos

    estadísticos sugieren que cada E ij debe ser mayor o igual que 5.Muestra

    Para que el siguiente ejemplo resulte más sencillo de comprender, puede copiar los datos en una

    hoja en blanco y, a continuación, escribir la función debajo de los datos. No seleccione los

    encabezados de fila o columna (1, 2, 3...A, B, C...) cuando copie los datos de ejemplo en una hoja

    en blanco.Hombres (real)  Mujeres (real)  Descripción 

    58 35 De acuerdo

    11 25 Neutral

    10 23 En desacuerdo

    Hombres (esperado)  Mujeres (esperado)  Descripción 

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    41/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 41

    Hombres (real)  Mujeres (real)  Descripción 

    45,35 47,65 De acuerdo

    17,56 18,44 Neutral

    16,09 16,91 En desacuerdo

    Fórmula  Descripción (resultado) 

    =PRUEBA.CHI(A2:B4,A6:B8)  Estadística χ 2 de los datos de la tabla es

    16,16957 con 2 grados de libertad

    (0,000308)

    O más resumido:

    PRUEBA.CHIDevuelve la prueba de independencia. PRUEBA.CHI devuelve el valor de la distribuciónchi cuadrado (X2) para la estadística y los grados de libertad apropiados. Las pruebas X2pueden utilizarse para determinar si un experimento se ajusta a los resultados teóricos.

    Sintaxis

    PRUEBA.CHI(rango_actual;rango_esperado)Rango_actual es el rango de datos que contiene observaciones para probar frente avalores esperados.Rango_esperado es el rango de datos que contiene la relación del producto de los totalesde filas y columnas con el total global.

    Observaciones• Si rango_actual y rango_esperado tienen un número diferente de puntos de datos,

    PRUEBA.CHI devuelve el valor de error #N/A.• La prueba X2 primero calcula una estadística X2 y después suma las diferencias entrelos valores reales y los valores esperados. La ecuación para esta función esPRUEBA.CHI=p( X>X2 ), donde:y donde:

     Aij = frecuencia actual en la iésima fila, jésima columnaEij = frecuencia esperada en la iésima fila, jésima columnar = número de filasc = número de columnasPRUEBA.CHI devuelve la probabilidad para una estadística X2 y grados de libertad, gl,donde gl = (r - 1)(c - 1).

    PRUEBA.CHI.INVDevuelve para una probabilidad dada, de una sola cola, el valor de la variable aleatoriasiguiendo una distribución chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...),entonces PRUEBA.CHI.INV(probabilidad,...) = x. Utilice esta función para comparar losresultados observados con los resultados esperados, a fin de decidir si la hipótesisoriginal es válida.

    SintaxisPRUEBA.CHI.INV(probabilidad;grados_de_libertad)

  • 8/19/2019 3.- Guía Ji Chi Cuadrada X2 Inferencia Estadística Con Variables Categóricas

    42/44

    Prof. René Castro Psicoestadística UBA

    Psicología Página 42

    Probabilidad es una probabilidad asociada con la distribución chi cuadrado.Grados_de_libertad es el número de grados de libertad.

    Observaciones

      Si uno de los argumentos no es numérico, PRUEBA.CHI.INV devuelve el valor de

    error #¡VALOR!  Si probabilidad < 0 o si probabilidad > 1, PRUEBA.CHI.INV devuelve el valor de

    error #¡NUM!

      Si el argumento grados_de_libertad no es un entero, se trunca.

      Si grados_de_libertad < 1 o si grados_de_libertad ≥ 10^10, PRUEBA.CHI.INVdevuelve el valor de error #¡NUM!

    .CHI.INV usa una técnica iterativa para calcular la función. Dado un valor de probabilidad,PRUEBA.CHI.INV itera hasta que el resultado tenga una exactitud de ± 3x10^-7. SiPRUEBA.CHI.INV no converge después de 100 iteraciones, la función devuelve el valorde error #N/A.

    Para completar este tema, puede ver un video en YouTube: Universidad de Salamanca.Análisis de la relación entre dos variables cualitativas: Test Chi cuadrado Disponible en:https://www.youtube.com/watch?v=XvPEeQAjTW8. Análisis de la relación entre dos variables cualitativas. Chi cuadrado: causas de lasignificación Módulo 4 Disponible:  https://www.youtube.com/watch?v=qAHXnbp1lHY 

    https://www.youtube.com/watch?v=XvPEeQAjTW8https://www.youtube.com/watch?v=XvPEeQAjTW8https: