Solución de Práctica de Correlación y Regresión Lineal

download Solución de Práctica de Correlación y Regresión Lineal

of 22

description

estadistica

Transcript of Solución de Práctica de Correlación y Regresión Lineal

SOLUCIN DE PRCTICA DE CORRELACIN Y REGRESIN LINEAL

1. Desarrollo:

X: consumo anual de vino (litros por habitante).Y: N de muertes por enfermedad cardiaca, por cada 100000 hab.

Vamos a trabajar con la siguiente tabla:

Qu podemos decir sobre la relacin entre las dos variables? Encuentra la correlacin de Pearson.Para calcular la relacin de Pearson debemos trabajar con la siguiente tabla:

Para calcular la correlacin de Pearson:

Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.

Clculo de la varianza de X:

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:

Clculo de la varianza de Y:

De manera anloga al clculo de la varianza en X.

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.Reemplazando:

Clculo de Covarianza:

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:

Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor negativo, podemos decir que la relacin entre las variables X y Y es inversa, es decir a mayor consumo de vino (X) menor nmero de muertos por enfermedades cardiacas (Y).

Como el r tiende a -1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.

Podemos afirmar que a mayor consumo de vino menor nmero de muertes por enfermedad cardiaca? Realiza la nube de puntos y determina la ecuacin de regresin lineal.Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

Dnde:

Clculo de b:

Clculo de a:

Finalmente:

Obtenindose el siguiente grfico:

Podemos predecir aproximadamente el valor de la variable Y si sabemos el valor de X? Estima el N de muertes por enfermedad cardiaca en Rusia para un promedio de consumo anual de vino de 1.8 litros por habitante.

Aplicamos la ecuacin obtenida:

2. Desarrollo:

Para el siguiente ejercicio se trabajara con las variables:

X: horas trabajadas.Y: unidades producidas.

Con los siguientes datos:

Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:

Factor de Correlacin de Pearson:

Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.

Clculo de la varianza de X:

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:

Clculo de la varianza de Y:

De manera anloga al clculo de la varianza en X.

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.Reemplazando:

Clculo de Covarianza:

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:

Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor positivo, podemos decir que la relacin entre las variables X y Y es directa, es decir a mayor horas de trabajo (X) mayor nmero de unidades producidas (Y).

Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.

Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

Dnde:

Clculo de b:

Clculo de a:

Finalmente:

Obtenindose el siguiente grfico:

3. Desarrollo:

Para el siguiente ejercicio se trabajara con las variables:

X: Gastos semanales en publicidad.Y: Ventas Semanales.

Con los siguientes datos:

Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:

Factor de Correlacin de Pearson:

Dnde: Es la covarianza. Es la varianza de la variable X. Es la varianza de la variable Y.

Clculo de la varianza de X:

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de X.Reemplazando:

Clculo de la varianza de Y:

De manera anloga al clculo de la varianza en X.

Pues como son datos que no estn agrupados, entonces la frecuencia fi = 1, para cada uno de los valores de Y.

Reemplazando:

Clculo de Covarianza:

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente relacin de Pearson:

Podemos hacer el siguiente anlisis en base al resultado obtenido: Como el coeficiente de correlacin de Pearson result ser un valor positivo, podemos decir que la relacin entre las variables X y Y es directa, es decir a mayores gastos semanales en publicidad (X) mayores ventas semanales (Y).

Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los puntos definidos por (X, Y) estn bien cercanas a la recta generada por la regresin lineal.

Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

Dnde:

Clculo de b:

Clculo de a:

Finalmente:

La pendiente b = 10.7868, significa la razn de cambio entre las ventas semanales y los gastos semanales por publicidad.

Obtenindose el siguiente grfico:

Con estos datos podemos hacer los pronsticos:

Para el valor de 50 dlares en gastos semanales de publicidad:

Para el valor de 60 dlares en gastos semanales de publicidad:

Los errores de aproximacin:

Para el valor de 61 dlares en gastos semanales de publicidad:

Para el valor de 62 dlares en gastos semanales de publicidad:

Para el valor de 63 dlares en gastos semanales de publicidad: