Cuaderno Estadistica

122
  ESTADÍSTICA INFERENCIAL Facultad de Psicología CICLO 14-15 Mtra. Joanna Koral Chávez López

description

Explicación del uso del programa spss de manera sencilla para la cuantificacion de pruebas estandarisadas

Transcript of Cuaderno Estadistica

  • ESTADSTICA INFERENCIAL Facultad de Psicologa

    CICLO 14-15 Mtra. Joanna Koral Chvez Lpez

  • NDICE INTRODUCCIN ................................................................................................................................... 7

    TEORIA DE LA PROBABILIDAD .............................................................................................................. 8

    PRUEBA DE HIPTESIS ......................................................................................................................... 9

    PROCEDIMIENTO PARA LLEVAR A CABO UNA PRUEBA DE HIPTESIS: .................................................. 10

    1.- Enunciar la hiptesis nula, la hiptesis de investigacin y definir la direccin de la prueba ( si es de una

    cola o de dos colas). ................................................................................................................................. 10

    2.- Determinar el nivel de significancia ................................................................................................. 11

    3.- Seleccionar el estadstico de prueba y calcular el valor p ................................................................... 12

    4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con () .............. 14

    5.- Interpretar los resultados obtenidos .................................................................................................. 14

    PRUEBAS DE ASOCIACIN................................................................................................................... 19

    Coeficiente de Correlacin Producto-Momento de Pearson (r) ............................................................ 23

    Procedimiento para calcular la r .............................................................................................................. 23

    Regla de decisin ..................................................................................................................................... 24

    Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1).................. 24

    EJEMPLO: s ............................................................................................................................................... 25

    SPSS .......................................................................................................................................................... 26

    Reporte de resultados de la correlacin Pearson .................................................................................... 27

    Coeficiente de Correlacin de Spearman de Rangos Ordenados (rho)................................................... 29

    Procedimiento: ......................................................................................................................................... 30

    Regla de decisin ..................................................................................................................................... 30

    Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2) .............. 31

    EJEMPLO: .................................................................................................................................................. 32

    SPSS .......................................................................................................................................................... 33

    Reporte de resultados de la correlacin Spearman ................................................................................. 34

    CHI-CUADRADA (X2)............................................................................................................................ 35

    Caractersticas .......................................................................................................................................... 35

    Procedimiento para calcular Chi- cuadrada ............................................................................................ 35

    Regla de decisin ...................................................................................................................................... 36

    Grados de libertad .................................................................................................................................... 36

    EJEMPLO ................................................................................................................................................... 36

    CONCLUSIN ............................................................................................................................................ 37

  • SPSS .......................................................................................................................................................... 38

    REGRESIN LINEAL ............................................................................................................................. 39

    Introduccin ............................................................................................................................................. 39

    La recta de regresin ................................................................................................................................ 39

    La mejor recta de regresin ..................................................................................................................... 41

    Bondad de ajuste...................................................................................................................................... 42

    Resumen ................................................................................................................................................... 43

    EJERCICIOS DE TAREA DE CORRELACIONES .......................................................................................... 44

    PRUEBAS PARAMTRICAS O DE COMPARACIN ................................................................................. 47

    La prueba t ......................................................................................................................................... 47

    La prueba t de Student relacionada (mismos grupos, muestras dependientes) .................................... 50

    Cundo utilizarla....................................................................................................................................... 50

    Lgica de la prueba .................................................................................................................................. 50

    Procedimiento .......................................................................................................................................... 51

    Regla de decisin ...................................................................................................................................... 51

    Como se escriben los resultados de la prueba t para muestras relacionadas ......................................... 51

    Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3) .................. 52

    EJEMPLO ................................................................................................................................................... 53

    SPSS .......................................................................................................................................................... 53

    La prueba t de Student no relacionada (para muestras independientes) .............................................. 57

    Cundo utilizarla....................................................................................................................................... 57

    Lgica de la prueba .................................................................................................................................. 57

    Procedimiento .......................................................................................................................................... 58

    Regla de decisin ...................................................................................................................................... 59

    Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4) ............. 60

    EJEMPLO ................................................................................................................................................... 61

    SPSS .......................................................................................................................................................... 62

    INTRODUCCIN AL ANLISIS DE LA VARIANZA .................................................................................... 66

    ANOVA UNIFACTORIAL MUESTRAS INDEPENDIENTES .......................................................................... 71

    Definicin de varianza. ............................................................................................................................. 71

    Uso de ANOVA unifactorial (para muestras independientes). ................................................................ 71

    EJEMPLO: .................................................................................................................................................. 72

    SPSS .......................................................................................................................................................... 75

  • Tabla de varios niveles de significancia para valores crticos de F (tabla 4) ........................................... 79

    Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin ................... 80

    Tabla de varios niveles de significancia para valores crticos de F (tabla 4) continuacin ................... 81

    PRUEBAS NO PARAMTRICAS ............................................................................................................ 89

    U de Man-Whitney ............................................................................................................................. 89

    Caractersticas: ......................................................................................................................................... 89

    Lgica de la prueba .................................................................................................................................. 89

    Procedimiento para calcular U de Man-Whitney ................................................................................... 89

    Regla de decisin ...................................................................................................................................... 90

    Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5) ....................................... 91

    Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 5) continuacin. ................ 92

    .................................................................................................................................................................. 92

    EJEMPLO ................................................................................................................................................... 93

    SPSS .......................................................................................................................................................... 94

    Prueba de Rangos de Wilcoxon (W) .................................................................................................... 98

    Caractersticas: ......................................................................................................................................... 98

    Lgica de prueba ...................................................................................................................................... 98

    Procedimiento para calcular el valor de W .............................................................................................. 98

    Regla de decisin ...................................................................................................................................... 99

    Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 6) .................................................. 100

    EJEMPLO ................................................................................................................................................. 102

    Kruskal-Wallis (H) ............................................................................................................................. 107

    Caractersticas: ....................................................................................................................................... 107

    Lgica de prueba .................................................................................................................................... 107

    Procedimiento para calcular el valor H ................................................................................................. 107

    Regla de decisin ................................................................................................................................... 108

    Tabla de varios Niveles de Significancia para H (tabla 7) ...................................................................... 108

    Tabla de vario Niveles de Significancia para H (tabla 7) continuacin .................................................. 108

    EJEMPLO ................................................................................................................................................. 109

    CONCLUSIN: ......................................................................................................................................... 110

    SPSS ........................................................................................................................................................ 111

    EJERCICIOS DE TAREA ............................................................................................................................. 113

    Prueba de Friedman () ............................................................................................................... 116

  • Caractersticas: ....................................................................................................................................... 116

    Lgica de la prueba ................................................................................................................................ 116

    Procedimiento para calcular el valor de ....................................................................................... 116

    Regla de decisin .................................................................................................................................... 117

    Tabla de varios Niveles de Significancia para Friedman () (tabla 8) .............................................. 117

    Tabla de varios Niveles de Significancia para Friedman () (tabla 8) continuacin ...................... 117

    EJEMPLO ................................................................................................................................................. 118

    SPSS ........................................................................................................................................................ 120

    EJERCICIOS DE TAREA ............................................................................................................................. 122

    REFERENCIAS ................................................................................................................................... 122

  • NDICE DE TABLAS

    Tabla de varios niveles de significancia del coeficiente de correlacin de Pearson (tabla 1)

    Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2)

    Tabla de varios niveles de significancia para la prueba t de Student Relacionada (tabla 3)

    Tabla de varios niveles de significancia para la prueba t de Student No Relacionada (tabla 4)

    Tabla de varios niveles de significancia para valores crticos de F (tabla 5)

    Tabla de varios Niveles de Significancia para U de Mann- Whitney (tabla 6

    Tabla de varios Niveles de Significancia para Wilcoxon (W) (tabla 7)

    Tabla de varios Niveles de Significancia para H (tabla 8)

    Tabla de varios Niveles de Significancia para Friedman ()(tabla 9)

    Tabla de varios Niveles de Significancia para CHI-CUADRADA (X2) (tabla 10)

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina7

    INTRODUCCIN El estudio de determinadas caractersticas de una poblacin se efecta a travs de diversas muestras que pueden extraerse de ella.

    El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con reposicin.

    Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada muestra podemos calcular un estadstico (media, desviacin tpica, proporcin,...) que variar de una a otra. As obtenemos una distribucin del estadstico que se llama distribucin muestral.

    Las dos medidas fundamentales de esta distribucin son la media y la desviacin tpica (tambin denominada error tpico). Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande las distribuciones muestrales son normales y en esto se basarn todos los resultados que alcancemos. El objetivo que se proponen las tcnicas del anlisis descriptivo es la presentacin y la descripcin de los datos de nuestra investigacin de la manera ms significativa y eficaz. El anlisis Inferencial va ms all de la descripcin de los datos; uno de sus objetivos bsicos es hacer afirmaciones acerca de una, o varias, caractersticas de la poblacin a partir de los datos provenientes de una muestra. Para generalizar en una poblacin, de manera vlida, los resultados obtenidos en una muestra es necesario considerar la forma en la que se distribuyen los datos de la muestra e identificar un modelo estadstico o probabilstico que corresponda al diseo de investigacin utilizado y a las caractersticas de la variable de inters (continua o discreta), a fin de establecer si las afirmaciones que hacemos de la poblacin tiene un sustento vlido o son debidas al azar.

    Un modelo estadstico es una distribucin que describe la probabilidad de ocurrencia de las variables aleatorias, es decir, la probabilidad de que la variable X tome cada uno de los valores posibles x, o P(X=x); esto es: el grado en el cual los resultados que encontramos en una muestra ocurren en realidad en la poblacin. A esta correspondencia se le denomina funcin de probabilidad. Las distribuciones de probabilidad pueden representarse mediante una tabla, una grfica o una frmula.

    La mayora de los casos prcticos a los que nos enfrentamos en Ciencias Sociales se refiere a variables aleatorias cuyas funciones de probabilidad se ajustan a los modelos estadsticos o distribucin de probabilidades. Existen diferentes tipos de distribuciones de probabilidad. Una forma de clasificarlas es mediante el tipo de variables: discretas (se cuentan) y continuas (se miden). Para las variables continuas, la distribucin de probabilidades se denomina funcin de densidad, ya que las probabilidades corresponden a reas bajo la curva.

    Cuando se realiza una investigacin, rara vez se extrae ms de una muestra de una determinada poblacin. Esta muestra nica se convierte en la base a partir de la cual realizamos inferencias acerca de dicha poblacin. Si extraemos numerosas muestras del mismo tamao utilizando el mismo procedimiento de muestreo al azar, y calculamos un estadstico, por ejemplo la media o una proporcin para esa muestra, tendramos mltiples ejemplos de dicho estadstico (Newton y Rudestam ,1999). Las

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina8

    diferencias entre las medias de las muestras extradas nos daran una idea acerca de qu tan bien est funcionando el procedimiento de muestreo empleado. Si este proceso se repite una gran cantidad de veces obtendramos una distribucin de estas muestras, es decir, una distribucin muestral. En resumen, las distribuciones mustrales se obtienen a partir de extraer muestras del mismo tamao (n) elegidas al azar en una poblacin determinada. Cada muestra del mismo tamao nos proporciona una observacin (dato), es decir, el estadstico muestral (x,, P) que sera incluido en dicha distribucin. La probabilidad de obtener un estadstico determinado como resultado del azar est contemplado en la distribucin muestral del estadstico considerado, por lo que con dicha distribucin se puede determinar la probabilidad que corresponde a cada estadstico calculado y con ello evaluar si implica que el estadstico observado es un resultado esperado por azar o no. Como puede advertirse, a cada estadstico le corresponde una distribucin muestral: media, diferencia entre medias, proporciones, diferencias entre proporciones, varianzas, etc.

    Una de las distribuciones mustrales ms importantes en Estadstica es la distribucin normal (z), con mucho, la ms importante de todas las distribuciones de probabilidad. Su grfica produce la ya conocida curva en forma de campana. Dicha distribucin posee las siguientes caractersticas:

    1. Tiene forma de campana. 2. Es asinttica con respecto al eje X. 3. Es simtrica. 4. El rea total bajo la curva es igual a 1. 5. La mayor parte de los valores se concentran al centro de la distribucin, mientras que en los

    extremos se localizan el menor nmero de los casos.

    La distribucin normal de probabilidad es, de acuerdo con Smith (1970); una grfica idealizada de ciertas distribuciones de frecuencias comunes para las cuales n es muy grande. No necesariamente tiene estas proporciones justas, ella puede ser considerablemente ms alta y delgada, pero siempre ser simtrica y en forma de campana se llama curva normal de probabilidad porque describe, entre otras cosas, la distribucin ms probable de ciertos eventos al azar (p.13)

    Esto quiere decir que cuando la muestra es grande y ha sido elegida al azar, es decir: no seleccionada propositivamente de acuerdo con ciertos parmetros muy particulares de la investigacin, la distribucin de los datos tender a ser normal, por tanto, esta aproximacin a la curva normal no siempre se puede esperar, especialmente cuando la muestra de sujetos es muy pequea.

    TEORIA DE LA PROBABILIDAD La teora de la probabilidad es la parte de las matemticas que estudia los fenmenos aleatorios Estos deben contraponerse a los fenmenos determinsticos, los cuales son resultados nicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 grados Celsius a nivel del mar se obtendr vapor. Los fenmenos aleatorios, por el contrario, son aquellos que se obtienen como resultado de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de una moneda. La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina9

    Muchos fenmenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado, donde el fenmeno no se repite en las mismas condiciones, debido a que la caractersticas del material hace que no exista una simetra del mismo, as las repeticiones no garantizan una probabilidad definida. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parmetros que intervienen; sta es una de las razones por las cuales la estadstica, que busca determinar estos parmetros, no se reduce inmediatamente a la teora de la probabilidad en s.

    El trabajo estadstico se orienta, en gran medida, a la verificacin de nuestra hiptesis de investigacin. El proceso de comprobacin de una hiptesis tiene como propsito determinar si los efectos estadsticos observados, calculados para una muestra, son reales en la poblacin o son simplemente un resultado del error de muestreo. El procedimiento que subyace al proceso de comprobacin de una hiptesis es la estadstica inferencial. Por medio de ella extraemos conclusiones acerca de una poblacin con base en los estadsticos obtenidos a partir de una muestra.

    Utilizamos la estadstica inferencial con el propsito de validar los datos que hemos obtenido a lo largo de la investigacin. Nuestro objetivo es llegar a una conclusin con respecto a nuestra hiptesis de investigacin, lo que nos conducir a llevar a cabo una prueba de hiptesis; as, la hiptesis de investigacin derivar en una serie de hiptesis estadsticas.

    PRUEBA DE HIPTESIS El propsito de la prueba de hiptesis es ayudar al investigador a tomar una decisin acerca de una poblacin mediante el examen de una muestra de ella.

    A continuacin se presentan conceptos indispensables para comprender la prueba de hiptesis:

    Hiptesis: Es una proposicin acerca de una o ms poblaciones. Dicha proposicin se creer cierta si los datos de la muestra llevan al rechazo de la hiptesis nula.

    Hiptesis de investigacin (H1): es la conjetura o suposicin que motiva la investigacin.

    Hiptesis nula (H0): se establece de tal forma que pueden ser evaluadas por medio de tcnicas estadsticas adecuadas. Esta hiptesis se establece con el propsito expreso de ser RECHAZADA. En consecuencia, el complemento de la conclusin que el investigador desea alcanzar se convierte en el enunciado de hiptesis nula. En el proceso de prueba, la hiptesis nula se rechaza o no se rechaza. Si la hiptesis nula no se rechaza, se dir que los datos sobre los cuales se basa la prueba no proporcionan evidencia suficiente que cause el rechazo. Si el procedimiento de prueba conduce al rechazo, se concluye que los datos disponibles no son compatibles con la hiptesis nula, pero sirven como apoyo a alguna otra hiptesis.

    En resumen, es posible establecer las siguientes reglas empricas para decidir qu proposicin se utiliza como hiptesis nula y cul como hiptesis de investigacin.

    a) La conclusin a la que se desea o espera llegar como resultado de la prueba generalmente se usa como hiptesis de investigacin.

    b) La hiptesis nula debe contener una proposicin de igualdad, ya sea =, o . c) La hiptesis nula es la que debe ser COMPROBADA.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    0

    d) Las hiptesis nula y de investigacin son complementarias. Es decir, las dos contemplan de manera exhaustiva todos los valores posibles que los parmetros de suposicin pueden asumir.

    PROCEDIMIENTO PARA LLEVAR A CABO UNA PRUEBA DE HIPTESIS:

    1.- Enunciar la hiptesis nula, la hiptesis de investigacin y definir la direccin de la prueba ( si es de una cola o de dos colas).

    La confirmacin o rechazo de nuestra hiptesis de investigacin parte de enunciar una o varias hiptesis estadsticas: nula (H0) (aseveracin de que no hay alguna diferencia entre el valor esperado de la muestra y el valor real de la poblacin) y de investigacin (H1) (aseveracin de que existe diferencia entre el valor esperado y el real).

    Un aspecto que influye de manera especial en la probabilidad de rechazar o no la hiptesis nula (H0) es si podemos predecir en qu direccin se ubicar nuestro estadstico muestral en relacin con el parmetro poblacional. La direccin de la prueba se establece mediante la hiptesis de investigacin y est determinada por el nmero de colas (una o dos colas) en la curva de distribucin muestral. Para definir si se trata de una prueba de una o dos colas, es necesario examinar cuidadosamente el objetivo de investigacin y la hiptesis de investigacin para que a partir de ellos podamos enunciar nuestra hiptesis de investigacin (H1).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    1

    La tabla siguiente presenta las formas ms usuales de enunciar la hiptesis de investigacin:

    FORMAS USUALES DE ENUNCIAR LA HIPTESIS DE INVESTIGACIN

    De una cola con direccin positiva: El contenido de la pregunta de investigacin incluye trminos como mayor que, ms, incremento, ms rpido, etc.

    Plantear una prueba de una cola, positiva en la H1 y un signo >

    De una cola con direccin negativa: El contenido de la pregunta de investigacin incluye trminos como menor que, menos, disminucin, ms lento, etc.

    Plantear una prueba de una cola, negativa en la H1 y un signo <

    De dos colas no direccional: El contenido de la pregunta de investigacin no incluye ninguna declaracin sobre la direccin del efecto de la variable o la diferencia entre grupos, o simplemente afirma desigualdad.

    Plantear una prueba de dos colas, neutral en la H1.

    En el contraste o prueba se utilizan las puntuaciones tipificadas Z.

    2.- Determinar el nivel de significancia Al tomar una decisin sobre rechazar o no la H0 puedes incurrir en los siguientes errores:

    Error de tipo I (): Rechazar una hiptesis nula cuando es verdadera. Error de tipo II (): Aceptar una hiptesis nula cuando es falsa.

    Para controlar el error tipo I se utiliza un nivel de significancia , el cual es el nivel de riesgo que ests dispuesto a tomar al concluir que la hiptesis nula (H0) es falsa cuando es cierta. La siguiente tabla muestra los niveles convencionales de significancia que se utilizan tpicamente en la investigacin.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    2

    Usos tpicos del nivel de significancia

    Probabilidad de rechazar la H0 cuando es cierta

    Nivel de significancia

    Usos tpicos

    Nivel de riesgo Alto .10 En investigaciones exploratorias, donde se conoce poco sobre un tema

    Nivel de riesgo Moderado .05 y .01 Niveles convencionales en investigacin mediante encuestas e instrumentos de evaluacin psicomtrica y educativa.

    Nivel de riesgo Bajo .01 y .001 Niveles convencionales en investigacin biolgica, de laboratorio y mdica, donde un error constituye una amenaza.

    Por su parte el error tipo II se controla aumentando el tamao de la muestra.

    3.- Seleccionar el estadstico de prueba y calcular el valor p Una Prueba estadstica tiene asociado un modelo estadstico (probabilstico), de lo que se infiere que la prueba elegida para aplicar a nuestros datos debe seguir un conjunto de suposiciones que habremos de considerar para interpretar de manera correcta sus resultados. Estas suposiciones parten principalmente de la forma en que se constituy la muestra y del tipo de escalas que se emple en la definicin operacional de nuestras variables. Adicionalmente, para seleccionar la prueba ms apropiada para nuestra investigacin, debemos considerar otros criterios, los cuales se mencionan a continuacin.

    Nmero de variables observadas y tipo (dependientes o independientes)

    Escala de medicin de las variables: si son variables nominales/ordinales, lo ms apropiado son pruebas de proporciones, si son de intervalo/razn, lo ms indicado es el clculo de pruebas de medias, diferencias de medias o anlisis de varianza.

    Nmero demuestras con las que estamos trabajando y tipo de muestras (independientes o relacionadas)

    Tamao de la muestra (s)

    El valor p es la probabilidad de ocurrencia por azar del estadstico de prueba, de acuerdo a la distribucin muestral de dicho estadstico. En vista de que la eleccin de la prueba estadstica es una de las tareas ms complejas del proceso de investigacin, checa el rbol de decisin estadsticas para elegir la prueba adecuada para tu investigacin.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    3

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    4

    4.- Tomar la decisin de aceptacin o rechazo lo cual implica comparar el valor de p con () Si p (), se rechaza la H1 y se acepta H0

    La decisin sobre la aceptacin de una hiptesis estadstica est basada en si hay o no suficiente evidencia para concluir que la hiptesis nula (H0) es falsa. Si la probabilidad del valor obtenido es mayor que un nivel de significancia especificado, se acepta la hiptesis nula H0; si la probabilidad es igual o menor al nivel especificado, se rechaza la hiptesis nula (H0) y se acepta la hiptesis de investigacin (H1).Cuando se acepta la hiptesis nula se concluye que es cierta, pero cuando los datos la contradicen fuertemente se concluye que es falsa.

    5.- Interpretar los resultados obtenidos Esto implica analizar si los datos obtenidos son congruentes con los antecedentes sealados en el marco terico o si los contradicen. Adicionalmente deber revisarse la posibilidad de aumentar el tamao de la muestra si se considera que la inexistencia de una relacin significativa pueda deberse a un error de muestreo. Entonces por todo lo anterior la prueba de hiptesis constituye la columna vertebral de nuestro proyecto de investigacin: ah es donde reside nuestra tesis central, aquello que queremos comprobar. El inicio del procedimiento de la prueba de hiptesis es establecer una o ms hiptesis (Downie y Heath, 1973). La primera que se establece es la hiptesis de la no diferencia o hiptesis nula, por ejemplo entre las medias de dos poblaciones. Esto tambin puede hacerse planteando que las medias de ambas poblaciones son iguales, o dicho de otra manera, las muestras estudiadas provienen de la misma poblacin. Un siguiente aspecto a considerar es el nivel de significacin () que tiene que ver con la seguridad que queremos tener de no cometer errores al aceptar o rechazar la hiptesis nula. As en un alfa de 5 (0.05), tenemos 5 posibilidades por cada 100 veces que se extraiga una muestra de una poblacin, de que la diferencia o no diferencia encontrada sea incorrecta. Si establecemos un alfa de 1 (0.01), el riesgo de equivocarnos es de uno en cien, si el alfa es menor: 0.001, el riesgo es de uno en mil y as sucesivamente. Con mucha frecuencia, nuestros estudios intentan medir el grado de relacin que existe entre dos variables determinadas. Nos preguntamos, por ejemplo: en qu medida influye el grado de escolaridad de los padres en el grado de escolaridad alcanzado por los hijos?, o bien, en qu medida las calificaciones grupales en matemticas estn vinculadas a las calificaciones en ciencias naturales o al modelo de enseanza del profesor de la asignatura? El propsito del contraste de hiptesis es determinar si nuestras suposiciones acerca de la relacin entre dos o ms variables son correctas. Para ello, requerimos elegir una prueba estadstica que nos permita realizar dicho contraste, sin embargo es importante considerar el objetivo de nuestra

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    5

    investigacin (comparar, encontrar asociaciones, establecer diferencias) para poder determinar qu prueba estadstica es la adecuada. En el proceso de seleccin de la prueba estadstica tenemos dos posibilidades: elegir una prueba paramtrica o una no paramtrica. Cuando se cumplen determinados criterios (criterios paramtricos); por ejemplo que los datos se encuentren mnimo en un nivel de medicin intervalar, que los datos de la muestra hayan sido obtenidos de una poblacin normalmente distribuida, es posible utilizar una prueba paramtrica. Si los datos no se ajustan a una distribucin normal o si el nivel de medicin empleado no es por lo menos intervalar, entonces se utilizan pruebas no paramtricas.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    6

    Las pruebas de asociacin ms comnmente utilizadas en Ciencias Sociales se describen a continuacin: El Coeficiente de correlacin es el indicador que nos permite examinar, de manera objetiva, la fuerza y direccin de la relacin entre variables que presentan un fundamento lgico y coherente para su asociacin, por lo que sus valores se calculan con una direccin de relacin positiva o negativa, alejndose o acercndose a la unidad. Entre las pruebas no paramtricas que permiten identificar la fuerza y direccin de la asociacin entre variables, se encuentra:

    Coeficiente de correlacin de rangos ordenados de Spearman (rho): permite explicar la direccin (positiva o negativa) de una relacin, as como la proporcin de la variacin en los rangos de Y, explicada por el conocimiento de los valores del rango de X. Aplica slo para variable de carcter ORDINAL.

    Coeficiente de correlacin de Pearson (r): Permite el dimensionar de la magnitud y direccin de una relacin entre variables medidas a partir de intervalos. La r de Pearson es un coeficiente de correlacin que mide la estrechez del ajuste de las coordenadas X, Y, alrededor de la lnea de regresin. Es apropiada para medir la relacin entre variables de INTERVALO/RAZN U ORDINAL, A mayor valor absoluto de la r de Pearson, las coordenadas estarn ms cercanas a la lnea, lo que nos indica una mayor asociacin entre las variable.

    Prueba de Chi-cuadrada (X2): permite explicar la direccin (positiva o negativa) de una relacin, as como la proporcin de la variacin en los rangos de Y, explicada por el conocimiento de los valores del rango de X. Aplica slo para variable de carcter NOMINAL.

    La comparacin entre grupos es usualmente empleada en la investigacin social, pues con ello se comprueba la significancia al evaluar muestras que se incluyen y se excluyen de una situacin determinada. En el caso de la comparacin de dos grupos se parte de considerar la presencia de un determinado factor en uno de ellos, mientras que en el otro, ocurre el caso contrario. Entre las pruebas de comparacin paramtricas se encuentran:

    Prueba t de Student para muestras independientes (t): es una prueba de la diferencia entre medias muestrales para dos grupos o muestras independientes. La variable a partir de la cual se calcula la media debe ser de INTERVALO/RAZN, que en este tipo de prueba representa a la variable dependiente. La variable independiente debe ser de tipo NOMINAL/ORDINAL dicotmica.

    Prueba t de Student para muestras relacionadas (t): se utiliza para comprobar la hiptesis de que las puntuaciones de una variable de INTERVALO/RAZN difieren en el tiempo para los mismos sujetos. Este tipo de diseo es antes-despus y en l una variable se mide dos veces para los mismos individuos con algn tipo de intervencin entre la aplicacin de las pruebas.

    Anlisis de Varianza para muestras independientes (ANOVA): es una prueba de diferencia de medias muestrales para tres o ms grupos o muestras independientes. La variable a partir de la cual se calcula la media (variable dependiente) debe ser de INTERVALO/RAZON, siendo en este tipo de prueba la variable dependiente. La variable independiente debe ser de tipo NOMINAL/ORDINAL.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    7

    Anlisis de Varianza para muestras relacionadas (ANOVA): se utiliza para comprobar la hiptesis de que las puntuaciones de una variable de INTERVALO/RAZON difieren en el tiempo para los mismos sujetos. Este tipo de diseo es antes-despus, en el cual una variable se mide tres o ms veces para los mismos individuos con algn tipo de intervencin (variable independiente) entre las pruebas.

    En ocasiones, los datos o las condiciones de nuestra investigacin no cumplen o no tenemos elementos para suponer que cubren estas condiciones (el ms comn es el nivel de medida de los datos). En esos casos tenemos que recurrir a las pruebas no paramtricas que, aun cuando son menos potentes, no establecen condiciones para los parmetros de la poblacin de la cual se obtuvieron las muestras. El principio bsico de las pruebas no paramtricas es el mismo que el de las pruebas paramtricas: comparar los resultados obtenidos contra lo esperado por azar. Las pruebas no paramtricas ofrecen algunas ventajas:

    Se obtiene probabilidades exactas independientes de la forma de la poblacin de la cual se sac la muestra.

    Si se tienen menos de seis sujetos, no existe otra opcin para procesar los datos.

    Existen pruebas no paramtricas apropiadas para observaciones hechas en poblaciones diferentes.

    Son apropiadas para datos medidos a nivel nominal u ordinal.

    La prueba a utilizar en cada especfico depende del objetivo de la investigacin, en concordancia con el objetivo de la prueba estadstica, del nivel de medida de los datos, del nmero de muestras y de si stas son independientes o relacionadas

    Resumen de procedimiento estadsticos en relacin con el tipo de muestra

    Tipo de muestra Procedimiento Estadstico Dos muestras independientes U de Mann Whitney Dos muestras relacionadas Wilcoxon K muestras independientes Kruskall Wallis K muestras relacionadas Friedman

    Cuando se realizan prueba de hiptesis, se calcula la probabilidad de que los resultados obtenidos en una investigacin puedan ser debidos al azar, en el supuesto de que la hiptesis nula sea cierta. Esta probabilidad es el grado de significacin estadstica (valores menores a 0.05, como 0.04, 0.01 o 0.002)

    o valor de p. Basndose en esta probabilidad, se decidir rechazar o no la hiptesis nula. As, cuanto menor sea el valor de p, menor ser la probabilidad de que los resultados obtenidos se deban al azar y mayor evidencia habr en contra de la hiptesis nula. Si dicha probabilidad es menor que un valor de p fijado previamente (habitualmente se toma p

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez

    Pg

    ina1

    8

    Sin embargo, es importante no olvidar que estamos tomando la decisin de rechazar una hiptesis con base en los resultados obtenidos en una muestra. Cuando se extrae una muestra existe la probabilidad de cometer errores. La probabilidad de cometer un error tipo I, es lo que mide precisamente el grado de significacin p.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina1

    9

    PRUEBAS DE ASOCIACIN La correlacin es la forma numrica en la que la estadstica ha podido evaluar la relacin de dos variables, es decir, mide la dependencia de una variable con respecto de otra variable independiente.

    Para poder entender esta relacin tendremos que analizarlo en forma grfica:

    Si tenemos los datos que se presentan en la tabla y consideramos que la edad determina el peso de las personas entonces podremos observar la siguiente grfica:

    1698 47

    2045 15

    1348 100

    1268 120

    demanda

    0

    50

    100

    150

    1000 1500 2000

    Donde los puntos representan cada uno de los pares ordenados y la lnea podra ser una recta que represente la tendencia de los datos, que

    en otras palabras podra decirse, que se observa que a mayor edad mayor peso.

    La correlacin se puede explicar con la pendiente de esa recta estimada y de esta forma nos podemos dar cuenta que tambin existe el caso en el que al crecer la variable independiente decrezca la variable dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir que no existe correlacin. Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

    As en estadstica podremos calcular la correlacin para datos no agrupados y agrupados.

    La correlacin refleja si existe relacin o asociacin entre dos variables, no se habla de causalidad (causa-efecto) por lo que no hay una variable dependiente y una independiente, aunque puede suceder que una variable sea antecedente de otra. Un uso muy importante de la correlacin es la determinacin de la confiabilidad test- retest de los instrumentos de prueba. La confiabilidad test-retest significa que existe consistencia en los puntajes obtenidos en aplicaciones repetidas de la prueba. Las tcnicas correlacionales nos permiten cuantificar la relacin entre los puntajes obtenidos en las dos aplicaciones y, de esta manera, medir la confiabilidad test- retest del instrumento. La correlacin sirve principalmente para averiguar si existe una relacin y para determinar su magnitud (fuerza) y direccin (si esta es positiva o negativa) de esta. El coeficiente de correlacin expresa de manera cuantitativa la magnitud y direccin de una relacin y puede adquirir valores de 1 a 1, incluyendo el cero, 1 r 1. Sus caractersticas son:

    edad peso

    15 60

    30 75

    18 67

    42 80

    28 60

    19 65

    31 92

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    0

    El signo indica el sentido de la relacin, una correlacin negativa representa una asociacin inversamente proporcional, es decir, a medida que una variable se incrementa, la otra disminuye; por otro lado, en una correlacin positiva o directamente proporcional, a medida que aumenta una, la otra tambin se incrementa.

    La magnitud de la relacin est dada por el valor del coeficiente y se interpreta como sigue:

    0 hasta 0.299 No hay relacin entre las variables (nula)

    0.3 hasta antes de 0.499 La relacin es baja (dbil)

    0.5 hasta antes de 0.799 La relacin es moderada

    0.8 a 1 hay una correlacin alta (fuerte) entre las variables

    La ausencia de asociacin lineal no significa necesariamente que las variables no tengan relacin

    entre s. Existen muchas variables con una correlacin de tipo curvilneo y debe ser evaluada de otra manera.

    Una forma grfica de ver la relacin entre variables son las grficas de dispersin o dispersigrama (grfica de pares de valores X y Y), donde cada punto representa el lugar en que se cruzan las calificaciones de la primera variable (X) y la segunda variable (Y) para cada participante. Si se traza una lnea que cruce la mayora de los puntos se puede apreciar el tipo de relacin. Existen varios tipos de correlacin:

    1.- Correlacin directa La correlacin directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

    2.- Correlacin inversa La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    1

    3.- Correlacin nula La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables. En este caso se dice que las variables no correlacionan y la nube de puntos tiene una forma redondeada.

    Grado de Correlacin El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte: la correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

    2. Correlacin dbil: la correlacin ser dbil cuanto ms separados estn los puntos de la recta.

    3. Correlacin nula

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    2

    Regresin Lineal La regresin consiste en estimar valores de una variable, conociendo ya antes los valores de otra variable. Es decir, con la regresin se puede conocer una variable a partir de otra. Ejemplo a partir de la estatura de una persona se conoce su peso; de la capacidad lingstica su comprensin en el estudio, de su inteligencia su posibilidad de aprobar un examen, etc. Las variables son: la PREDICTOR y la PREDICTANDO; la INDEPENDIENTE y la DEPENDIENTE. Los datos se marcan en una grfica de dispersin uniendo los puntos consecuencia de unir en las coordenadas los valores de las variables X y Y. Las coordenadas se usan tambin para ver qu tipo de regresin es, pues puede ser rectilnea, circular, elptica, etc. Por medio de la representacin en el eje de coordenadas se obtiene la LINEA DE AJUSTE, lo cual se logra por medio de la ecuacin de la recta.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    3

    Coeficiente de Correlacin Producto-Momento de Pearson (r) La funcin de la correlacin de Pearson es determinar si existe una relacin lineal entre dos variables de intervalo y que esta relacin no sea debida al azar (que la relacin sea estadsticamente significativa). La correlacin producto-momento de Pearson es una prueba de Asociacin, de la cual se obtiene un valor, mismo que mide el grado de correlacin o relacin entre los puntajes obtenidos en dos variables. Esta prueba permite estudiar hasta dnde los puntajes altos en una variable tienden a asociarse con puntajes altos en la otra, y si los puntajes bajos en una tienden a asociarse con puntajes bajos en la otra. La prueba de Pearson tiene en cuenta los valores reales de los puntajes al calcular el grado de correlacin entre dos variables. Por eso, en esta prueba si es importante que las dos variables se midan con la misma escala. El r refleja el grado de correlacin y lo expresa con un nmero que va desde 1 (correlacin negativa perfecta) pasa por 0 (no existe correlacin) hasta +1 (correlacin positiva perfecta). Mientras ms cercano sea el valor observado de r a 1, ms probablemente ser significativo. Para que sea significativo, el valor observado de Pearson (r) debe ser igual o mayor que los valores crticos indicados en la tabla. La correlacin de Pearson se calcula mediante la siguiente frmula:

    =

    ( )( )

    [ 2( )2

    ][ 2( )2]

    Dnde:

    N = nmero de participantes. X, Y = calificaciones de las variables a relacionar. XY = Multiplicar X por Y y sumar. X y Y= Sumar valores de cada variable. (X) y (Y) = El total de la suma de cada condicin elevado al cuadrado. X y b = Elevar cada valor al cuadrado y sumarlos.

    Procedimiento para calcular la r 1. Calcular la correlacin de Pearson r, sustituyendo en la frmula:

    = ( )( )

    [ 2( )2

    ][ 2( )2]

    2. Se debe buscar el valor de tabla para la correlacin Pearson, para ello se calculan los grados de

    libertad (gl = N 1) y se establece el nivel de significancia para probar la H0.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    4

    Regla de decisin Si el coeficiente obtenido es mayor o igual al coeficiente de tabla se acepta la hiptesis de investigacin.

    Si obtenido crtico se rechaza la H0 y se aceptaH1 Si obtenido

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    5

    EJEMPLO: se desea saber si existe relacin entre la autoestima y la depresin en estudiantes de preparatoria. Para ello, un investigador aplica una escala de depresin (X) en la que los estudiantes con calificaciones ms altas tienen mayor depresin; tambin utiliza una escala de autoestima (Y) en la que los puntajes mayores indican mayor autoestima. Los resultados se muestran a continuacin: Redactar la conclusin con un nivel de significancia = 0.05

    H0: no existe relacin entre la depresin y la autoestima en estudiantes de preparatoria. H1: existe relacin entre la depresin y la autoestima en estudiantes de preparatoria.

    Depresin X

    Autoestima Y

    XY X2 Y2

    26 24 18 17 18 7

    15 20 18

    8 12 26 29 30 31 19 18 28

    208 288 468 493 540 217 285 360 504

    676 576 324 289 324 49

    225 400 324

    64 144 676 841 900 961 361 324 784

    X= 163 Y= 201 XY= 3363 X2=3187 Y2= 5055

    (X)2= 26569 (Y)2= 40401 N=9

    Sustituyendo valores en la formula.

    obtenido =()()()

    [() ()][()()] = -0.761

    Obtener r de tabla (tabla 1) En este caso con 9 participantes: gl = 9 1 = 8, por lo que r de tabla al nivel de significancia de 0.05 es r crtico =0.6319. Observando el coeficiente obtenido de robtenido=-0.761, ste es mayor al compararlo con el de tabla (no se debe considerar el signo) por lo que la hiptesis nula se rechaza, entonces: existe una relacin entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria. Adems esta relacin es moderada (est en el rango de 0.5 a 0.799) e inversamente proporcional (ya que tiene signo negativo). CONCLUSIN: Se encontr una relacin estadsticamente significativa, moderada e inversamente proporcional, entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05)

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    6

    SPSS Vamos a declarar primero las variables en SPSS

    La prueba de Pearson en el paquete estadstico SPSS se encuentra en Analizar / Correlaciones/Bivariadas.

    Ahora necesitamos enviar las variables quese deseen correlacionar a la ventana de Variables. Despus, seleccionar los Coeficientes de correlacin los cuales pueden ser Pearson dependiendo del nivel de medicin de las variables.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    7

    Dar click en el botn Opciones y seleccionar Medias y desviaciones tpicas, dar click en Continuar y despus en Aceptar. Los resultados para el ejemplo anterior seran los siguientes: En el paquete estadstico siempre se presenta una matriz de correlacin, en sta se tienen todas las variables incluidas en el anlisis en los renglones y se repiten en las columnas, en el lugar en que se cruza cada par de variables se tiene el coeficiente de Pearson y el nivel de significancia obtenido, adems del

    nmero de casos (ver datos en el crculo), como puede verse en la tabla de resultados, esta organizacin nos presenta informacin redundante (la correlacin entre la pareja de variables siempre se repite dos veces, se pueden tomar los resultados de cualquiera de las dos). Regla de decisin para la tabla de resultados en SPSS: Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la hiptesis nula.

    Sig. Asintt (bilateral) es a 0.05 se rechaza la hiptesis nula

    En el presente ejemplo se tiene una significancia de 0.017, menor a 0.05, por lo que se rechaza la hiptesis nula, entonces: existe una relacin entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria. Adems esta relacin es moderada e inversamente proporcional (tiene signo negativo). Correlaciones

    Reporte de resultados de la correlacin Pearson Para esta prueba se puede utilizar una grfica de dispersin poniendo los valores de la primer variable en X y los de la segunda variable en Y (forma 1), aunque se puede hacer tambin un diagrama ligando ambas variables con una flecha doble (forma 2). En cualquiera de las dos formas se deben mencionar el valor de la prueba estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la que se llega.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    8

    CONCLUSIN: Se encontr relacin estadsticamente significativa, moderada e inversamente proporcional, entre el puntaje de depresin y el de autoestima en estudiantes de preparatoria (rP = -0.761, p < 0.05).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina2

    9

    Coeficiente de Correlacin de Spearman de Rangos Ordenados (rho)

    La funcin de la correlacin de Spearman es determinar si existe una relacin lineal entre dos variables ordinales, y que esta relacin no sea debida al azar (que la relacin sea estadsticamente significativa). Aunque una de las variables pueda ser de intervalo, de cualquier manera se utiliza esta prueba si una de las dos est medida a nivel ordinal.

    Esta es una prueba de asociacin que mide el grado de correlacin entre los puntajes obtenidos en dos variables y que indica el nivel de significacin de la correlacin observada. Debe usarse cuando los datos experimentales se miden en una escala ordinal o cuando los datos no cumplen los otros supuestos necesarios para las pruebas paramtricas. Lgica de la prueba Si se predice que dos variables se correlacionan positivamente, los participantes que obtienen puntajes bajos en una de ellas tambin deben obtener puntajes bajos en la otra, y los que obtienen puntajes altos en una de ellas tambin deben obtener puntajes altos en la otra. Sin embargo, si no existe correlacin, es decir, si los puntajes estn distribuidos al azar, como lo predice la hiptesis nula, los rangos estarn mezclados puesto que un participante puede haber obtenido un rango alto en una de las variables y un rango bajo en la otra. La prueba de Spearman calcula las diferencias entre los rangos para los dos conjuntos de puntajes. Para calcular el estadstico llamado rho se restan estas diferencias de 1. Es evidente que mientras ms pequeas sean las diferencias entre los rangos de las dos condiciones, mayor ser el valor de rho, es decir, ms se acercar a +1. Para que el valor observado de rho pueda considerarse significativo, debe ser igual o mayor que los valores crticos que se encuentran en la tabla.

    La correlacin de Spearman se calcula mediante la siguiente frmula:

    = 1 6 2

    (2 1)

    Dnde:

    N = nmero de participantes d2 = diferencias entre los rangos asignados a las variables elevadas al cuadrado

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    0

    Procedimiento: 1. Ordene por rango los puntajes de la variable X, asignando 1 al puntaje ms bajo y as sucesivamente.

    2. Calcule la diferencia (d) entre cada par de rangos de X y de Y. 3. Eleve al cuadrado cada diferencia entre los rangos de X y Y. 4. Sume las diferencias elevadas al cuadrado para obtener d 5. Cuente el nmero de participantes (N) 6. Encuentre el valor de rho con la siguiente frmula:

    = 1 6 2

    (2 1)

    7. Se debe buscar el valor de tabla del coeficiente Spearman en la tabla 2, para ello se utiliza el nmero de casos (N) y el nivel de significancia elegido para probar la hiptesis nula.

    Regla de decisin Si el coeficiente Spearman obtenido es mayor o igual al de la tabla se rechaza la hiptesis nula.

    Si obtenido crtico se rechaza la H0 y se aceptaH1 Si obtenido

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    1

    Tabla de varios niveles de significancia del coeficiente de correlacin de Spearman (tabla 2)

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    2

    EJEMPLO: Se desea saber si existe relacin entre la actitud hacia el psiclogo (X) y la actitud hacia la psicoterapia (Y), en un grupo de padres de familia. La actitud es evaluada como sigue: 1 = muy desfavorable hasta 7 = muy favorable. Los resultados se muestran a continuacin:

    Redactar la conclusin con un nivel de significancia = 0.05

    H0: no existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia.

    H1: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia.

    Actitud hacia el Psiclogo

    X

    Actitud hacia Psicoterapia

    Y

    Rango X

    Rango Y d d2

    6 7 5 3 4 2 2 1 2

    7 5 4 2 6 3 3 2 1

    8 9 7 5 6 3 3 1 3

    9 7 6

    2.5 8

    4.5 4.5 2.5 1

    -1 2 1

    2.5 -2

    -1.5 -1.5 -1.5

    2

    1 4 1

    6.25 4

    2.25 2.25 2.25

    4

    N=9 d2= 27

    Sustituyendo valores en la formula.

    obtenido = 1 6 (27)

    9(811) = 0.769

    Obtener rho de tabla (tabla 2) El coeficiente en la tabla de valores crticos de correlacin Spearman, con 9 casos al 0.05 de significancia, es igual a 0.700, el coeficiente Spearman obtenido (0.769) es mayor al de tabla por lo que se rechaza la hiptesis nula, entonces: existe relacin lineal entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia. Esta relacin es moderada (est en el rango entre 0.5 y 0.8) y directamente proporcional (tiene signo positivo).

    CONCLUSIN: Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional, entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769, p = 0.05).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    3

    SPSS Vamos a declarar primero las variables en spss

    La prueba de Spearman en el paquete estadstico SPSS se encuentra en Analizar / Correlaciones / Bivariadas.

    Ahora necesitamos enviar las variables que se deseen correlacionar a la ventana de Variables. Despus, seleccionar los Coeficientes de correlacin de Spearman dependiendo del nivel de medicin de las variables.

    Dar click en Aceptar.

    Los resultados para el ejemplo anterior seran los siguientes: En el paquete estadstico SPSS, siempre se presenta una matriz de correlacin, en sta se tienen todas las variables incluidas en el anlisis en los renglones y se repiten en las columnas, en el lugar en que se cruza cada par de variables se tiene el coeficiente de Spearman y el nivel de significancia obtenido, adems del nmero de casos, esta organizacin presenta informacin redundante ya que las correlaciones por cada pareja de variables se repiten siempre 2 veces. Regla de decisin para la tabla de resultados en SPSS: Si el nivel de significancia (Sig. Asintt (bilateral)) es menor o igual a 0.05, se rechaza la hiptesis nula.

    Sig. Asintt (bilateral) es a 0.05 se rechaza la hiptesis nula

    En el presente ejemplo, el nivel de significancia obtenido =0.015 es menor a 0.05, por lo que se rechaza la hiptesis nula, entonces: existe relacin entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia. Adems la correlacin es moderada (est en el rango entre 0.5 y 0.8) y directamente proporcional (tiene signo positivo).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    4

    Correlaciones

    Reporte de resultados de la correlacin Spearman Para esta prueba se puede utilizar una grfica de dispersin poniendo los valores de la primer variable en X y los de la segunda variable en Y, aunque se puede hacer tambin un diagrama ligando ambas variables con una flecha doble, esta forma es la que se va a usar para ejemplificar los resultados de la correlacin Spearman. En cualquiera de las dos opciones se deben mencionar el valor de la prueba estadstica y el nivel de significancia con que se est rechazando, o aceptando, la hiptesis nula. Se puede poner el valor de probabilidad obtenido o simplemente decir que es menor, o mayor, al valor que hayamos elegido para la prueba de hiptesis. Adems se debe escribir la conclusin a la que se llega. CONCLUSIN: Se encontr una relacin estadsticamente significativa, moderada y directamente proporcional, entre la actitud hacia el psiclogo y la actitud hacia la psicoterapia, en padres de familia (rho = 0.769, p = 0.015) (ver diagrama). Estos datos se utilizarn para hacer la discusin posterior de los resultados encontrados en el estudio

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    5

    CHI-CUADRADA (X2) Es una distribucin de probabilidad. La prueba de chi cuadrada compara las frecuencias observadas en cada una de las celdas de una tabla de contingencia con las frecuencias esperadas (E) para cada una, para determinar si las diferencias se deben al azar, como lo afirma la hiptesis nula (Ho).

    El estadstico X (que se pronuncia chi cuadrada o ji cuadrada) refleja el tamao de las diferencias entre las frecuencias observadas y esperadas. Hay mayor probabilidad de que el resultado sea significativo a medida que la diferencia entre las frecuencias observadas y esperadas es mayor, por eso el valor observado de X debe ser igual o mayor que los valores crticos de la tabla.

    Caractersticas No analiza resultados solo categoras Las categoras asignadas es la nica medida del comportamiento de los participantes La prediccin se formula indicando el nmero de participantes que habr en cada categora

    Procedimiento para calcular Chi- cuadrada 1. Construir tabla de contingencia 2. Listar las frecuencias observadas (0) de acuerdo a su categora 3. Calcular las frecuencias esperadas (E) para cada categora. Esto consiste en multiplicar los

    totales marginales para cada variable entre el nmero total de participantes. 4. Calcular el valor de x2

    = ( )

    5. Calcular los grados de libertad

    C=# de columnas gl= (c-1)(r-1)

    R=# de filas

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    6

    CONCEPTO Y DEFINICIONES Tabla de contingencia. Se compone de dos vas o entradas y muestra la relacin contingente entre dos variables, cuando estas han sido clasificadas en categoras mutuamente excluyentes y cuando los datos de cada celda son frecuencias.

    Regla de decisin Si el valor obtenido es mayor o igual al valor crtico de tabla se acepta la hiptesis de investigacin.

    Si X2 obtenido X2 crtico se rechaza la H0 y se acepta H1 Si X2obtenido < X2 crtico se rechaza la H1 y se acepta H0

    Grados de libertad

    Es el nmero de datos que pueden variar libremente al calcular dicho estadstico.

    EJEMPLO

    CUANDO USARLA. Cuando se asignan categoras a los participantes y los datos son nominales. Solo analiza categoras no resultados.

    Hiptesis de investigacin

    El investigador predijo que habra un mayor porcentaje de estudiantes de tecnologa. Que adoptaran hbitos de estudio regular en comparacin con estudiantes de ciencias sociales.

    Datos de la muestra

    100 participantes. Un grupo de 50 estudiantes de ciencias sociales y otro grupo de 50 estudiantes de tecnologa. Se envi un cuestionario a todos los estudiantes en el que se les peda que indicaran sus hbitos de estudio de acuerdo a 3 categoras.

    1. Estudio regular 2. Estudio irregular concentrado en das puntuales 3. Combinacin de los 2 hbitos de estudio anterior

    H0: No existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares en comparacin con los estudiantes de ciencias sociales.

    H1: Existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares en comparacin con los estudiantes de ciencias sociales.

    Se observaron 44 respuestas de estudiantes de ciencias sociales y 42 de estudiantes de tecnologa.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    7

    Hbitos de estudio

    REGULAR IRREGULAR COMBINADA

    GPO 1 C.S.

    6 15 23 44

    GPO 2 TECNOLOGIA

    10 8 24 42

    16 23 47 86

    Frecuencia esperada

    C1=E

    = 8.19 C4=E=

    =7.81 gl= (3-1)(2-1)=(2)(1) gl=2

    C2=E=

    = 11.77 C5=E=

    =11.23

    C3=E=

    =24.05 C6=E=

    =22.95

    X2= (.)

    . +

    (.)

    . +

    (.)

    . +

    (.)

    . +

    (.)

    . +

    (.)

    .=3.11

    = ( )

    CONSULTAR PROBABILIDADES EN TABLA

    Chi cuadrada calculada debe ser mayor que los valores crticos de la tabla.

    gl =2 p

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    8

    El hecho de no haber encontrado resultados significantes se debe probablemente al elevado nmero de estudiantes que indicaron hbitos de estudios elevados.

    La prueba JI cuadrada solo puede comparar relaciones generales entre variables. Lo que equivale a hiptesis bilateral. El motivo de ello es que las relaciones entre las variables se pueden interpretar de distintas manera.

    SPSS Vamos a declarar primero las variables en spss

    Los valores para la variable GRUPOS sera 1= ciencias sociales y 2= tecnologa y los valores para la variable HAB sera 1=regular, 2=Irregular y 3= combinado.

    La prueba de chi-cuadrada en el paquete estadstico SPSS se encuentra en Analizar / estadstico descriptivos / tabla de contingencia.

    En la siguiente ventana pondremos la Variable Dependiente en filas y la Variable Independiente en columnas.

    Posteriormente en la opcin estadsticos seleccionamos la opcin CHI-Cuadrada continuar y en la opcin casillas habilitamos la opcin columna y continuar. Y damos clic en aceptar.

    Los resultados para el ejemplo anterior seran los siguientes:

    La primera tabla nos muestra la frecuencia esperada y observada para cada categora as como su porcentaje y el total de participantes. La segunda tabla muestra el valor obtenido de Chi-cuadrada que

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina3

    9

    es igual a 3.107 con un nivel de significancia p= 0.212 lo que significa que se acepta la hiptesis nula H0 ya que el valor de p es mayor a 0.05

    Por lo tanto, no existe un nmero mayor de estudiantes de tecnologa que tendran hbitos de estudios regulares en comparacin con los estudiantes de ciencias sociales. (X2=3.11, gl=2, p>0.05)

    Recursos de apoyo para el tema CHI-CUADRADA http://es.slideshare.net/sevilla_carlos2004/distribucion-de-chi-cuadrado https://www.youtube.com/watch?v=j3qFzFyey2Y

    REGRESIN LINEAL

    Introduccin El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin entre variables. Se adapta a una amplia variedad de situaciones. En la investigacin social, el anlisis de regresin se utiliza para predecir un amplio rango de fenmenos, desde medidas econmicas hasta diferentes aspectos del comportamiento humano. En el contexto de la investigacin de mercados puede utilizarse para determinar en cul de diferentes medios de comunicacin puede resultar ms eficaz invertir; o para predecir el nmero de ventas de un determinado producto. En fsica se utiliza para caracterizar la relacin entre variables o para calibrar medidas. Etc. Tanto en el caso de dos variables (regresin simple) como en el de ms de dos variables (regresin mltiple), el anlisis de regresin lineal puede utilizarse para explorar y cuantificar la relacin entre una variable llamada dependiente o criterio (Y) y una o ms variables llamadas independientes o predictoras (X1,X2, ...,Xk), as como para desarrollar una ecuacin lineal con fines predictivos. Adems, el anlisis de regresin lleva asociados una serie de procedimientos de diagnstico (anlisis de los residuos, puntos de influencia) que informan sobre la estabilidad e idoneidad del anlisis y que proporcionan pistas sobre cmo perfeccionarlo. Nuestro objetivo es el de proporcionar los fundamentos del anlisis de regresin. Al igual que en los captulos precedentes, no haremos hincapi en los aspectos ms tcnicos del anlisis, sino que intentaremos fomentar la compresin de cundo y cmo utilizar el anlisis de regresin lineal, y cmo interpretar los resultados. Tambin prestaremos atencin a otras cuestiones como el chequeo de los supuestos del anlisis de regresin y la forma de proceder cuando se incumplen

    La recta de regresin En el tema anterior (sobre correlacin lineal) hemos visto que un diagrama de dispersin ofrece una idea bastante aproximada sobre el tipo de relacin existente entre dos variables. Pero, adems, un diagrama de dispersin tambin puede utilizarse como una forma de cuantificar el grado de relacin lineal existente entre dos variables: basta con observar el grado en el que la nube de puntos se ajusta a una lnea recta. Ahora bien, aunque un diagrama de dispersin permite formarse una primera impresin muy rpida sobre el tipo de relacin existente entre dos variables, utilizarlo como una forma de cuantificar esa

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    0

    relacin tiene un serio inconveniente: la relacin entre dos variables no siempre es perfecta o nula; de hecho, habitualmente no es ni lo uno ni lo otro. Supongamos que disponemos de un pequeo conjunto de datos con informacin sobre 35 marcas de cerveza y que estamos interesados en estudiar la relacin entre el grado de alcohol de las cervezas y su contenido calrico. Un buen punto de partida para formarnos una primera impresin de esa relacin podra ser la representacin de la nube de puntos, tal como muestra el diagrama de dispersin de la figura 1

    Figura 1 Diagrama de dispersin de porcentaje de alcohol por n de caloras

    El eje vertical muestra el nmero de caloras (por cada tercio de litro) y el horizontal el contenido de alcohol (expresado en porcentaje). A simple vista, parece existir una relacin positiva entre ambas variables: conforme aumenta el porcentaje de alcohol, tambin aumenta el nmero de caloras. En esta muestra no hay cervezas que teniendo alto contenido de alcohol tengan pocas caloras y tampoco hay cervezas que teniendo muchas caloras tengan poco alcohol. La mayor parte de las cervezas de la muestra se agrupan entre el 4,5 % y el 5 % de alcohol, siendo relativamente pocas las cervezas que tienen un contenido de alcohol inferior a se. Podramos haber extendido el rango de la muestra incluyendo cervezas sin alcohol, pero el rango de caloras y alcohol considerados parece bastante apropiado: no hay, por ejemplo, cervezas con un contenido de alcohol del 50 %, o cervezas sin caloras. Cmo podramos describir los datos que acabamos de proponer? Podramos decir simplemente que el aumento del porcentaje de alcohol va acompaado de un aumento en el nmero de caloras; pero esto, aunque correcto, es poco especfico. Cmo podramos obtener una descripcin ms concreta de los resultados? Podramos, por ejemplo, listar los datos concretos de que disponemos; pero esto, aunque preciso, no resulta demasiado informativo. Podramos hacer algo ms interesante. Por ejemplo, describir la pauta observada en la nube de puntos mediante una funcin matemtica simple, tal como una lnea recta. A primera vista, una lnea recta podra ser un buen punto de partida para describir resumidamente la nube de puntos de la figura 1. Puesto que una lnea recta posee una frmula muy simple

    = + Podemos comenzar obteniendo los coeficientes B0 y B1 que definen la recta. El coeficiente b es la pendiente de la recta: el cambio medio que se produce en el nmero de caloras (Y) por cada unidad de cambio que se produce en el porcentaje de alcohol (X). El coeficiente a es el punto en el que la recta corta el eje vertical: el nmero medio de caloras que corresponde a una cerveza con porcentaje de alcohol cero. Conociendo los valores de estos dos coeficientes, se podra reproducir la recta y describir con ella la relacin existente entre el contenido de alcohol y el nmero de caloras. Aunque no entremos todava en detalles de cmo obtener los valores de a y b, s podemos ver cmo es esa recta (figura 2).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    1

    Figura 2 Diagrama de dispersin y recta de regresin (% de alcohol por n de caloras).

    Vemos que, en general, la recta hace un seguimiento bastante bueno de los datos. La frmula de la recta aparece a la derecha del diagrama. La pendiente de la recta (b) indica que, en promedio, a cada incremento de una unidad en el porcentaje de alcohol (Xi) le corresponde un incremento de 37,65 caloras (Y). El origen de la recta (a) sugiere que una cerveza sin alcohol (grado de alcohol cero) podra contener 33,77 caloras. Y esto, obviamente, no parece posible. Al examinar la nube de puntos vemos que la muestra no contiene cervezas con menos de un 2% de alcohol. As, aunque el origen de la recta aporta informacin sobre lo que podra ocurrir si extrapolamos (Aplicar un criterio conocido a otros casos similares para extraer conclusiones o hiptesis) hacia abajo la pauta observada en los datos hasta llegar a una cerveza con grado de alcohol cero, al hacer esto estaramos efectuando pronsticos en un rango de valores que va ms all de lo que abarcan los datos disponibles, y eso es algo extremadamente arriesgado en el contexto del anlisis de regresin.

    La mejor recta de regresin En una situacin ideal (e irreal) en la que todos los puntos de un diagrama de dispersin se encontraran en una lnea recta, no tendramos que preocuparnos de encontrar la recta que mejor resume los puntos del diagrama. Simplemente uniendo los puntos entre s obtendramos la recta con mejor ajuste a la nube de puntos. Pero en una nube de puntos ms realista (como la de las figuras 1 y 2) es posible trazar muchas rectas diferentes. Obviamente, no todas ellas se ajustarn igualmente bien a la nube de puntos. Se trata de encontrar la recta capaz de convertirse en el mejor representante del conjunto total de puntos. Existen diferentes procedimientos para ajustar una funcin simple, cada uno de los cuales intenta minimizar una medida diferente del grado de ajuste. La eleccin preferida ha sido, tradicionalmente, la recta que hace mnima la suma de los cuadrados de las distancias verticales entre cada punto y la recta. Esto significa que, de todas las rectas posibles, existe una y slo una que consigue que las distancias verticales entre cada punto y la recta sean mnimas (las distancias se elevan al cuadrado porque, de lo contrario, al ser unas positivas y otras negativas, se anularan unas con otras al sumarlas).

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    2

    Bondad de ajuste Adems de acompaar la recta con su frmula, podra resultar til disponer de alguna indicacin precisa del grado en el que la recta se ajusta a la nube de puntos. De hecho, la mejor recta posible no tiene por qu ser buena. Imaginemos una situacin como la presentada en el diagrama de la figura 3, en el que la recta consigue un ajuste bastante ms pobre que en el caso de la figura 2. Ahora hemos representado el porcentaje de alcohol de las cervezas (eje horizontal) y el precio de las mismas (eje vertical). Y no parece existir la misma pauta de relacin detectada entre las variables de la situacin anterior. As pues, aunque siempre resulta posible, cualquiera que sea la nube de puntos, para obtener la recta mnimo-cuadrtica, necesitamos informacin adicional para determinar el grado de fidelidad con que esa recta describe la pauta de relacin existente en los datos.

    Figura 3. Diagrama de dispersin, recta de regresin y ajuste (% de alcohol por precio).

    Cmo podemos cuantificar ese mejor o peor ajuste de la recta? Hay muchas formas de resumir el grado en el que una recta se ajusta a una nube de puntos. Podramos utilizar la media de los residuos, o la media de los residuos en valor absoluto, o las medianas de alguna de esas medidas, etc. Una medida de ajuste que ha recibido gran aceptacin en el contexto del anlisis de regresin es el coeficiente de determinacin R2: el cuadrado del coeficiente de correlacin mltiple. Se trata de una medida estandarizada que toma valores entre 0 y 1 (0 cuando las variables son independientes y 1 cuando entre ellas existe relacin perfecta). Este coeficiente posee una interpretacin muy intuitiva: representa el grado de ganancia que podemos obtener al predecir una variable basndonos en el conocimiento que tenemos de otra u otras variables. Si queremos, por ejemplo, pronosticar el nmero de caloras de una cerveza sin el conocimiento de otras variables, utilizaramos la media del nmero de caloras. Pero si tenemos informacin sobre otra variable y del grado de relacin entre ambas, es posible mejorar nuestro pronstico. El valor R2 del diagrama de la figura 2 vale 0,83, lo que indica que si conocemos el porcentaje de alcohol de una cerveza, podemos mejorar en un 83 % nuestros pronsticos sobre su nmero de caloras si, en lugar de utilizar como pronstico el nmero medio de caloras, basamos nuestro pronstico en el porcentaje de alcohol. Comparando este resultado con el correspondiente al diagrama de la figura 3 (donde R2 vale 0,06) comprenderemos el valor informativo de R2: en este segundo caso, el conocimiento del contenido de alcohol de una cerveza slo nos permite mejorar nuestros pronsticos del precio en un 6 %, lo cual nos est indicando, adems de que nuestros pronsticos no mejoran de forma importante, existe un mal ajuste de la recta a la nube de puntos.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    3

    Parece evidente, sin tener todava otro tipo de informacin, que el porcentaje de alcohol de las cervezas est ms relacionado con el nmero de caloras que con su precio.

    Resumen En este primer apartado introductorio hemos aprendido que el anlisis de regresin lineal es una tcnica estadstica que permite estudiar la relacin entre una variable dependiente (VD) y una o ms variables independientes (VI) con el doble propsito de: 1) Averiguar en qu medida la VD puede estar explicada por la(s) VI. 2) Obtener predicciones en la VD a partir de la(s) VI. El procedimiento implica, bsicamente, obtener la ecuacin mnimo-cuadrtica que mejor expresa la relacin entre la VD y la(s) VI y estimar mediante el coeficiente de determinacin la calidad de la ecuacin de regresin obtenida. Estos dos pasos deben ir acompaados de un chequeo del cumplimiento de las condiciones o supuestos que garantizan la validez del procedimiento.

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    4

    EJERCICIOS DE TAREA DE CORRELACIONES De los siguientes ejercicios lee y determina qu tipo de variables son y cul es su nivel de medicin, obtn el Coeficiente de Correlacin de Pearson o Spearman (segn los niveles de medicin de las variables), el Diagrama de dispersin, redacta las Hiptesis Nula y de Investigacin y las conclusiones en base a los resultados obtenidos. 1.- Para investigar la relacin entre la ortografa y la habilidad para la lectura, un investigador aplic exmenes de ortografa y de lectura a un grupo de 20 estudiantes seleccionados aleatoriamente de una gran poblacin de estudiantes no graduados. Se obtuvieron los siguientes resultados. Utiliza un =0.05.

    Estudiante Puntaje de ortografa

    Puntaje de lectura

    A 52 56

    B 90 81

    C 63 75

    D 81 72

    E 93 50

    F 51 45

    G 48 39

    H 99 87

    I 85 59

    J 57 56

    K 60 69

    L 77 78

    M 96 69

    N 62 57

    O 28 35

    P 43 47

    Q 88 73

    R 72 76

    S 75 63

    T 69 79

    2.- Para averiguar la validez de un determinado examen de lectura, los investigadores lo aplicaron a una muestra de 20 estudiantes cuya habilidad para leer haba sido previamente colocada por rangos por su profesor. El puntaje del examen y el puntaje que el profesor dio para cada estudiante se enumeran a continuacin: Utiliza un =0.05.

    Estudiante Puntaje lectura Puntaje del profesor

    A 28 18

    B 50 17

    C 92 1

    D 85 6

    E 76 5

    F 69 10

    G 42 11

    H 53 12

    I 80 3

    J 91 2

    K 73 4

    L 74 9

    M 14 20

    N 29 19

    O 86 7

    P 73 8

    Q 39 16

    R 80 13

    S 91 15

    T 72 14

  • Estadstica Inferencial Mtra. Joanna Koral Chvez Lpez Dra. Fabiola Gonzlez Betanzos

    Pg

    ina4

    5

    3.- Se analiza la relacin entre el desempeo del equipo y la nmina de los equipos de beisbol de la liga Americana. La nmina de los equipos de la Liga Americana se mide en millones de dlares por equipo, mientras que el desempeo se mide por el nmero de juegos ganados en la temporada, lo que quiere evaluarse es si existe relacin entre el gasto y el desempeo de los equipos profesionales de beisbol. Los datos se muestran en la siguiente tabla. Utiliza un =0.05.

    Participante X y

    1 8 12

    2 9 11

    3 8.5 6

    4 16 11

    5 12 10

    6 10 8

    7 12 6.3

    4.- Como parte de un estudio sobre el efecto de la presin del grupo sobre el conformismo individual en una situacin que implica riesgo monetario, dos investigadores administraron la escala F, una medida de autoritarismo (a mayor valor mayor autoritarismo) y una escala diseada para medir estatus de lucha social a 12 estudiantes. Se deseaba tener informacin acerca de la correlacin entre las puntuaciones de autoritarismo y aquellas de estatus de lucha social. Las puntuaciones

    fueron las siguientes: Utiliza un =0.05.

    PARTICIPANTE X Y

    A 82 42

    B 98 46

    C 87 39

    D 40 37

    E 116 65

    F 113 88

    G 111 86

    H 83 56

    I 85 62

    J 126 92

    K 106 54

    L 117 81

    5.- Un investigador supona que el desempeo de los alumnos de la carrera de medicina en materias afines y sinrgicas podra ser semejante. Para comprobar lo anterior, aplic dos exmenes a un grupo de diez alumnos (mientras ms grande sea el valor mejor estudiante es). Al aplicarles un examen de anatoma y otro de embriologa, el investigador tena la pretensin de averiguar si los estudiantes con puntuaciones bajas en una materia obtenan puntuaciones bajas en la otra y si quienes obtenan puntuaciones altas en una materia tambin lograban puntuaciones altas en la otra. A continuacin se muestran los resultados que consisten en aciertos obtenidos en una y otra materia y expresados en nmeros enteros. Utiliza un =0.01.

    Alumno Aciertos anatoma

    Aciertos embriologa

    1 65 74

    2 72 61

    3 75 69

    4 82 90

    5 50 51

    6 95 79

    7 87 95

    8 53 52

    9 83 77

    10 64 63

  • Estadstica Infer