Prueba de La Importancia Del Coeficiente de Correlacion

14
PRUEBA DE LA IMPORTANCIA DEL COEFICIENTE DE CORRELACION Se determina mediante la siguiente formula: Prueba t del coeficiente de correlación con 2 grados de libertad: Para calcular la hipótesis nula y la hipótesis alternativa emplearemos la siguiente formula: H₀: = 0 (la correlación entre la población es cero) H1: ≠ 0(la correlación entre la población es diferente de cero) «La letra griega p es el coeficiente de correlación entre la población y r es el coeficiente de correlación entre la muestra

Transcript of Prueba de La Importancia Del Coeficiente de Correlacion

Page 1: Prueba de La Importancia Del Coeficiente de Correlacion

PRUEBA DE LA IMPORTANCIA DEL COEFICIENTE DE CORRELACION

Se determina mediante la siguiente formula:

Prueba t del coeficiente de correlación con 2 grados de libertad:

Para calcular la hipótesis nula y la hipótesis alternativa emplearemos la siguiente formula:H₀: ᴘ = 0 (la correlación entre la población es cero)H1: ᴘ ≠ 0(la correlación entre la población es diferente de cero)«La letra griega p es el coeficiente de correlación entre la población y r es el coeficiente de correlación entre la muestra

Page 2: Prueba de La Importancia Del Coeficiente de Correlacion

UN EJEMPLO: Se determino el coeficiente de relación entre la ganancia en la venta de un vehículo de Applewood Auto Group y la edad de la persona que compro dicho vehículo era de 0.262. dado que el signo del coeficiente de correlación fue positivo, se concluyó que existía una relación directa entre ambas variables. Sin embargo debido a que la cifra de correlación era muy baja (cerca de cero) se concluyó que no había ganancias en una campaña de publicidad dirigida a los compradores mayores, que generan una ganancia mas grande. ¿Se puede concluir que no existe relación entre las dos variables? Utilice un nivel de significancia d 0.05

Page 3: Prueba de La Importancia Del Coeficiente de Correlacion

Solución:

Supongamos que la se recolectaron datos de 180 vehículos vendidos por Applewood Auto Group, lo cual es una muestra de la población de todos los vehículos vendidos durante los últimos años.

«La letra griega p es el coeficiente de correlación entre la población y r es el coeficiente de correlación entre la muestra»

Establecemos la hipótesis nula y la alternativa

Hay que probar la hipótesis nula de que el coeficiente de correlación es igual a cero.

La hipótesis alternativa que existe una correlación entre ambas variables.

H0: p ≤ 0 (La correlación entre la población es igual a cero)

H1: p ˃ 0 (La correlación entre la población es positiva)

Page 4: Prueba de La Importancia Del Coeficiente de Correlacion

Esta es una prueba de una cola, porque el interés es confirmar una asociación positiva entre las variables. El estadístico de prueba sigue la distribución t con n- 2 grados de libertad, son 180 – 2 = 178. Pero 178 no aparece en el apéndice B.2. el valor mas cercano es 180 por lo tanto se ocupara. La regla de decisión es rechazar la hipótesis nula si el valor calculado del estadístico de prueba es mayor a 1.653

= 0.262180 - 2

√1−0 .262= 3.622

Page 5: Prueba de La Importancia Del Coeficiente de Correlacion

Comparando el valor del estadístico de prueba de 3.622 con el valor critico de 1.653, se rechaza la hipótesis nula

Page 6: Prueba de La Importancia Del Coeficiente de Correlacion

ANALISIS DE REGRESÓN

En la sección anterior se desarrollaron medidas para expresar la fuerza y la dirección de la relación lineal entre dos variables. Aquí se elabora una ecuación para expresar la relación lineal entre dos variables. Además se desea estimar el valor de la variable dependiente Y con base en un valor seleccionado de la variable independiente X. La técnica para desarrollar la ecuación y proporcionar las estimaciones se denomina Análisis De Regresión.

ECUACIÓN DE REGRESION: EXPRESA LA RELACIÓN LINEAL ENTRE DOS VARIABLES.

Page 7: Prueba de La Importancia Del Coeficiente de Correlacion

PRINCIPIOS DE MINIMOS CUADRADOSSu objetivo es utilizar datos para trazar una línea que represente mejor la relación entre las dos variables.Se taraza un diagrama de dispersión para visualizar la posición de la línea.El diagrama de dispersión en la gráfica se reproduce en la gráfica, con una recta trazada por los puntos para ilustrar que una recta probablemente ajustaría los datos. Sin embargo, la recta trazada con una regla tiene una desventaja: su posición se basa en el criterio de la persona que traza la recta.

Llamadas de ventas y copiadoras vendidas de 10 representantes de ventas

Page 8: Prueba de La Importancia Del Coeficiente de Correlacion

Las rectas trazadas a mano en la gráfica representan los criterios de cuatro personas. Todas las rectas, excepto A, parecen razonables. Sin embargo, cada una generaría un estimado distinto de unidades vendidas para un número particular de llamadas de ventas.

Cuatro rectas superpuestas en el diagrama de dispersión

Al emplear la recta de regresión con un método matemático denominado principio de los mínimos cuadrados.Este método proporciona lo que comúnmente se conoce como recta del “mejor ajuste”.

Page 9: Prueba de La Importancia Del Coeficiente de Correlacion

PRINCIPIO DE MINIMOS CUADRADOS

Determina una ecuación de regresión al minimizar la suma de los cuadrados de las distancias verticales entre los valores reales de Y, y los valores pronosticados de Y.

Para ilustrar este concepto, se trazan los mismos datos en las tres gráficas siguientes. La recta de regresión en la gráfica se determinó con el método de los mínimos cuadrados. Es la recta de mejor ajuste porque la suma de los cuadrados de las desviaciones verticales respecto de sí misma es mínima. La primera gráfica (X = 3, Y = 8) se desvía 2 unidades de la recta, calculada como 10 − 8. El cuadrado de la desviación es 4. La desviación al cuadrado de la gráfica en X = 4, Y = 18 es 16. La desviación al cuadrado de la gráfica en X = 5, Y = 16 es 4. La suma de las desviaciones al cuadrado es 24, calculada como 4 + 16 + 4.

Page 10: Prueba de La Importancia Del Coeficiente de Correlacion

Para ilustrar este concepto, se trazan los mismos datos en las tres gráficas siguientes. La recta de regresión en la gráfica se determinó con el método de los mínimos cuadrados. Es la recta de mejor ajuste porque la suma de los cuadrados de las desviaciones verticales respecto de sí misma es mínima. La primera gráfica (X = 3, Y = 8) se desvía 2 unidades de la recta, calculada como 10 − 8. El cuadrado de la desviación es 4. La desviación al cuadrado de la gráfica en X = 4, Y = 18 es 16. La desviación al cuadrado de la gráfica en X = 5, Y = 16 es 4. La suma de las desviaciones al cuadrado es 24, calculada como 4 + 16 + 4.

Recta de mínimos cuadrados

Recta trazada con una regla

Recta diferente trazada con una regla

Suponga que las rectas en las gráficas 1 y 2 se trazaron con una regla. La suma de las desviaciones verticales al cuadrado en la gráfica 1 es 44. Para la gráfica 2 es 132.

Page 11: Prueba de La Importancia Del Coeficiente de Correlacion

FORMULA GENERAL DE LA ECUACION DE REGRESION LINEAL

Y = a + bXDonde:

Y, que se lee Y prima, es el valor de la estimación de la variable Y para un valor X seleccionado.

a es la intersección Y. es el valor estimado de Y cuando X = 0. En otras palabras es el valor estimado de Y donde la recta de regresión cruza el eje Y cuando X es cero.

b es la pendiente de la recta, o el cambio promedio en Y por cada cambio de una unidad (ya sea aumento o reducción) de la variable independiente X.

X es cualquier valor de la variable independiente que se seleccione.

Page 12: Prueba de La Importancia Del Coeficiente de Correlacion

FORMULAS OARA a Y b PENDIENTE PARA LA RECTA DE REGRESION

sy

sx

Donde:

r, es el coeficiente de correlación.

sy, es la desviación estándar de Y (variable dependiente)

Sx, es la desviación estándar de X (variable independiente)

INTERSECCION CON EL EJE Y

Donde:

YT:es la media de Y (la variable dependiente)

XT:es la media de X (es la variable independiente)

b = r

Page 13: Prueba de La Importancia Del Coeficiente de Correlacion

EJERCICIO:La gerente de ventas de Copier Sales of America, reunió información sobre los números de llamadas de ventas y copiadoras vendidas de una muestra de 10 representantes de ventas. Como parte de su presentación en la siguiente reunión de ventas, la señora Bancer desea presentar información específica acerca de la relación entre el número de llamadas y el número de ventas. Con el método de los mínimos cuadrados, determine una ecuación lineal que exprese la relación entre ambas variables. ¿cuál es el número esperado de copiadoras vendidas de un representante de ventas que hizo 20 llamadas?

Page 14: Prueba de La Importancia Del Coeficiente de Correlacion

La información obtenida por la gerente se muestra de la siguiente manera:

Coeficiente de correlación: 0.759

Desviación estándar de la variable independiente X: 9.189

Desviación estándar de la variable dependiente Y: 14.337

Media de la variable dependiente Y: 45

Media de la variable independiente X: 22

Número de llamadas hechas por un vendedor X:20