Correlacion Regresion Universidad

11
UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/ EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES 1/11EJERCICIOS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES (CAPÍTULO 5 ) PROPUESTOS EN EXÁMENES 1º) Razone brevemente sobre los conceptos de Casualidad, Causalidad y Especificación de modelos estadísticos.(Junio 2003) Respuesta.- Consideremos en una población dos o más variables: - Es posible que exista relación entre ellas de modo que una variación de una o varias produzca como consecuencia una variación en otras, explicable mediante alguna teoría general (por ejemplo, de la teoría de la demanda se deduce que si aumentamos el precio, disminuye la demanda). En este caso decimos que existe relación de causalidad. - Es posible no obstante que encontremos relación entre las variables pero no exista modelo teórico lógico que fundamente la relación (por ejemplo, calificaciones obtenidas por 50 alumnos en una asignatura y producción de cereales de 50 provincias). Hablaremos en este caso de casualidad. - Así pues, al estudiar la relación entre variables, debemos especificar previamente un modelo teórico que recoja las principales relaciones de causalidad (por ejemplo, el nº de clientes de una cadena hotelera puede venir explicado por los precios de alojamiento, el número de turistas que visitan la localidad, etc.) 2º) En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones: 3 4 8 TOTAL 5 4 2 2 8 6 2 1 2 5 7 1 2 4 7 TOTAL 7 5 8 20 Obtenga: a) La regresión lineal simple de Y/ X (Y sobre X) y de X sobre Y (X/ Y). b) El coeficiente de determinación de ambas rectas de regresión. (Junio 2003) Solución.- Efectuamos los cálculos necesarios para obtener las medias y las varianzas: 3 4 8 n x i ·n x i 2 ·n 5 4 2 2 8 40 200 6 2 1 2 5 30 180 7 1 2 4 7 49 343 n ·j 7 5 8 20 119 723 y j ·n ·j 21 20 64 105 y j 2 ·n ·j 63 80 51 2 655 De la tabla se obtiene: a 10 = 119 20 = 5,95; a 01 = 105 20 = 5,25; a 20 = 723 20 = 36,15; a 02 = 655 20 = 32,75 y de aquí: m 20 = 36,15 – 5,95 2 = 0,7475; m 02 = 32,75 – 5,25 2 = 5,1875 Y X

Transcript of Correlacion Regresion Universidad

Page 1: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−1/11−

EJERCICIOS DE DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES (CAPÍTULO 5 )

PROPUESTOS EN EXÁMENES 1º) Razone brevemente sobre los conceptos de Casualidad, Causalidad y Especificación de modelos estadísticos.(Junio 2003) Respuesta.- Consideremos en una población dos o más variables: - Es posible que exista relación entre ellas de modo que una variación de una o varias produzca como consecuencia una variación en otras, explicable mediante alguna teoría general (por ejemplo, de la teoría de la demanda se deduce que si aumentamos el precio, disminuye la demanda). En este caso decimos que existe relación de causalidad. - Es posible no obstante que encontremos relación entre las variables pero no exista modelo teórico lógico que fundamente la relación (por ejemplo, calificaciones obtenidas por 50 alumnos en una asignatura y producción de cereales de 50 provincias). Hablaremos en este caso de casualidad. - Así pues, al estudiar la relación entre variables, debemos especificar previamente un modelo teórico que recoja las principales relaciones de causalidad (por ejemplo, el nº de clientes de una cadena hotelera puede venir explicado por los precios de alojamiento, el número de turistas que visitan la localidad, etc.) 2º) En una distribución de frecuencias para 2 variables (x, y), se ha obtenido la siguiente tabla de correlaciones:

3 4 8 TOTAL 5 4 2 2 8 6 2 1 2 5 7 1 2 4 7

TOTAL 7 5 8 20 Obtenga: a) La regresión lineal simple de Y/ X (Y sobre X) y de X sobre Y (X/ Y). b) El coeficiente de determinación de ambas rectas de regresión. (Junio 2003) Solución.- Efectuamos los cálculos necesarios para obtener las medias y las varianzas:

3 4 8 ni· xi·ni· xi2·ni·

5 4 2 2 8 40 200 6 2 1 2 5 30 180

7 1 2 4 7 49 343

n·j 7 5 8 20 119 723

yj·n·j 21 20 64 105

yj2·n·j 63 80

512 655

De la tabla se obtiene: a10 = 11920

= 5,95; a01 = 10520

= 5,25; a20 = 72320

= 36,15; a02 = 65520

=

32,75 y de aquí: m20 = 36,15 – 5,952 = 0,7475; m02 = 32,75 – 5,252 = 5,1875

Y X

Page 2: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−2/11−

Por otra parte, si multiplicamos cada valor de X por cada valor de Y y por su respectiva frecuencia, obtenemos la tabla

60 40 8036 24 9621 56 224

cuya suma de elementos da 637, de donde obtenemos: a11 = 63720

= 31,85 y de aquí:

m11 = 31,85 – 5,95·5,25 = 0,6125. Se tendrá pues: a) la recta de regresión de Y/X es:

y – 5,25 = ( )0,6125 x 5,950,7475

− ↔ y ≅ 0,82x + 0,37

y la recta de regresión de X/Y:

x – 5,95 = ( )0,6125 y 5,955,1875

− ↔ x ≅ 0,12y + 5,33

b) el coeficiente de determinación: R2 = 211

20 02

mm ·m

=20,6125

0,7475·5,1875 ≅ 0,0967

3º) Explique y valore el significado del coeficiente de correlación lineal de Pearson. (Junio 2003 reserva) Solución.- Consideremos una variable bidimensional (Xi, Yi), siendo Xi la variable independiente (exógena) e Yi la dependiente (endógena). Sea y = a+bx la recta de regresión de Y/X. Tenemos entonces las tres varianzas: S2

Y = m02, varianza de la variable Yi; S2Yt = varianza de la variable a+bXi, (varianza explicada

por la regresión); S2rY varianza de la variable Yi–a–bXi, (varianza residual). Se demuestra que

S2Y = S2

Yt + S2rY

Llamamos coeficiente de determinación R2 a la proporción (tanto por uno) de varianza explicada que forma parte de la varianza de la variable:

R2 = 2Yt2Y

SS

demostrándose que 2

2 11

20 02

mRm ·m

= y, obviamente, 0 ≤ R2 ≤ 1.

Llamamos coeficiente de correlación al cociente:

R = 11

20 02

mm · m

cumpliéndose que –1 ≤ R ≤ 1. Si es 1 ó –1, la varianza se compone exclusivamente de la varianza explicada, es decir, la varianza residual es nula y el ajuste de la nube de puntos a la recta de regresión es perfecto; si es cero entonces la varianza se compone exclusivamente de la varianza residual y la ecuación de regresión no es representativa.

Page 3: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−3/11−

4º) Una empresa quiere realizar un estudio sobre la influencia de las campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y sus ventas en los últimos 5 años: Años Gastos publicidad Ventas 1997 2,2 195 1998 2,5 200 1999 2,8 221 2000 2,9 230 2001 3,1 239 2002 3,5 248 a) Obtener un modelo lineal que permita predecir las ventas en función de los gastos en publicidad. b) Predecir las ventas de 2003 si se piensa invertir en publicidad 5 millones de euros. e) Valorar los errores obtenidos por la recta de regresión. (Junio 2003 reserva) Solución.- a) Consideramos la variable bidimensional (xi, yi) donde xi = “gastos en publicidad”; yi = “ventas”, tenemos la tabla:

xi yi x2i y2

i xi·yi 2,2 195 4,84 38025 429 2,5 200 6,25 40000 500 2,8 221 7,84 48841 618,8 2,9 230 8,41 52900 667 3,1 239 9,61 57121 740,9 3,5 248 12,25 61504 868

Totales: 17 1333 49,2 298391 3823,7 de donde se deduce:

a10= 2,83333333 m20= 0,17222222 a01= 222,166667 m02= 373,805556

m11= 7,81111111 de donde la recta de regresión de Y/X:

y – 222,17 = 7,81 (x 2,83)0,172

− ↔ y ≅ 45,35x + 93,66

b) sustituyendo en la recta x = 5 → y ≅ 320,43

c) El coeficiente de determinación R2 = 27,81

0,17·373,80≅ 0,9477, lo que indica que la recta

de regresión es representativa para realizar interpolaciones o extrapolaciones.

Page 4: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−4/11−

DE REFUERZO 1º) Una empresa se dedica a la decoración de locales comerciales. Hasta el momento ha participado en 5 proyectos, en los cuales el número de metros cuadrados decorados y el número de horas directamente empleadas han sido las siguientes:

nº de m2 nº de horas1.000 4.000 5.000 7.000 8.000

10 15 18 20 22

La empresa decide presentarse a un concurso-proyecto para decorar 3.000 m2 , para lo cual deberá elaborar el correspondiente presupuesto económico. Los datos a tener en cuenta para la elaboración del presupuesto económico son: a) El presupuesto sólo tendrá en cuenta los costes de instalación, ya que el material lo suministrará la entidad que convoca el concurso b) Para cubrir los restantes costes, la empresa decoradora incrementará su presupuesto en un 40% sobre el importe total de coste de la mano de obra que se utilice en el proyecto. c) El coste por hora de trabajo es de 18 €.

Dada la situación particular en que se encuentra la empresa decoradora, le interesa participar en el concurso con un presupuesto con el que sólo cubra los costes.

Bajo estas condiciones, y en el supuesto de que el número de horas trabajadas sea función lineal del número de metros cuadrados decorados, se pide: 1) ¿cuál será el presupuesto que presente la empresa decoradora?; 2) ¿qué grado de fiabilidad tendrá la cifra de presupuesto presentado?; 3) si se tratase de decorar, en un nuevo proyecto, 50.000 m2 , ¿qué crítica se le podría hacer al presupuesto que en su caso se presentase?. Solución.- 1) Obtenemos la recta de regresión lineal de Y (nº de horas) sobre X (nº de m2) :

x y x2 x·y y2 1000 10 106 10·103 100 4000 15 16·106 60·103 225 5000 18 25·106 90·103 324 7000 20 49·106 140·103 400 8000 22 64·106 176·103 484

25000 85 155·106 476·103 1533 a10 = 5.000 ; a01 = 17 ; a20 = 31·106 ; a02 = 306,6 ; a11 = 95,2·103 , de donde se obtiene:

m11 = 10,2·103 ; m20 = 6·106 y b = 20

11

mm

= 1,7·10−3 . Luego la recta de regresión es:

y − 17 = 1,7·10−3 (x −5000) ⇒ y = 1,7·10−3 x + 8,5 luego si x = 3000 m2 ⇒ y = 13,6 horas. Así pues, coste de la mano de obra = = 13,6·18 + 40% = 244,8 € + 40 % = 342,72 €.

Page 5: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−5/11−

2) Calculamos el coeficiente de correlación:

R = 6,17·10·6

10·2,10m·m

m6

3

0220

11 = = 0,9925.... es decir, un grado de fiabilidad superior al 99%.

2º) Qué ocurre cuando el coeficiente de correlación r = 1: a) Los valores teóricos no coinciden con los observados; b) La dependencia funcional existente viene dada por una recta decreciente; c) La varianza residual es 0; d)Ninguna de las anteriores. Solución.- c) La varianza residual es 0. 3º) Cuando la covarianza entre dos variables es 0: a) Las variables son estadísticamente independientes ; b) El grado de asociación lineal entre las variables es perfecto; c) El coeficiente de variación tendrá valores muy grandes; d) Ninguna de las anteriores. Solución.- d) Ninguna de las anteriores

4º) El coeficiente de determinación lineal indica: a) La varianza total menos la varianza explicada por la regresión; b) La proporción de varianza explicada por la regresión lineal; c) El ajuste de y mediante y = f (x); d) Ninguna de las anteriores.

Solución.- b) La proporción de varianza explicada por la regresión lineal. 5º) Dada la regresión lineal simple Y/X, el coeficiente de regresión (b) indica: a) La

variación que se produce en Y ante una variación de X en una unidad; b) Los resultados del ajuste; c) El grado de asociación lineal entre X e Y; d) Ninguna de las anteriores.

Solución.- a) La variación que se produce en Y ante una variación de X en una unidad 6º) Cuando el coeficiente de determinación R2 = 1, señálese la respuesta correcta: a) La

varianza residual es igual a la varianza de la variable dependiente; b) La suma de la varianza residual y la varianza dependiente también es la unidad; c) La varianza residual es nula; d) Ninguna de las anteriores. Solución.- Opción c.

7º) Cuando existe una relación exacta entre las variables, señálese la opción correcta: a) la varianza explicada por la regresión coincide con la varianza de la variable dependiente; b) El coeficiente de correlación es igual a cero; c) La varianza residual es igual a la varianza de la variable dependiente; d) Ninguna de las anteriores. Solución.- Opción a.

8º) Si a las variables estadísticas X e Y las sometemos a un cambio de origen y de escala, señálese la respuesta correcta: a) su covarianza queda afectada por el cambio de escala; b) su covarianza queda afectada por ambos cambios; c) su covarianza queda afectada por el cambio de origen; d) su covarianza no queda afectada por ninguno de los cambios. Solución.- Opción a.

Page 6: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−6/11−

9º) a) Definición de varianza residual y coeficiente de determinación; b) calcular la varianza residual y el coeficiente de correlación de la distribución siguiente:

xi yi 2 3 4 2 8 4 9 7 11 10

Solución.-

xi yi xi2 xi·yi yi

2 2 3 4 6 94 2 16 8 48 4 64 32 169 7 81 63 49

11 10 121 110 10034 26 286 219 178

a10 = 6,8 ; a01 = 5,2 ; a20 = 57,2 ; a02 = 35,6 ; a11 = 43,8 , de donde se obtiene: Sxy = m11 = 8,44 ; Sx

2 = m20 = 10,96 y Sy2 = m02 = 8,56. Así pues:

759,056,806,21

S

S1R;06,2

96,102336,7156,8

S

SSS

2y

2xy2

2x

2xy2

y2ry ≅−=−=≅−=−= ⇒ R ≅ 0,8712

10º) En una distribución de frecuencias para dos variables x, y se ha obtenido la siguiente tabla de correlaciones:

Y\X 3 4 8 TOTAL

5 4 2 2 8 6 2 1 2 5 7 1 2 4 7

TOTAL 7 5 8 20 Obtenga los momentos de 1er y 2º orden respecto a la media y respecto al origen de esta distribución.

Solución.- a10 = 20

119 = 5,95; a20 = 20723 = 36,15; a01 =

20105 = 5,25; a02 =

20655 = 32,75

m10 = m01 = 0 ; m20 = a20 − a012 = 0,7475; m02 = a02 −a01

2 = 5,1875 11º) a) Exprese la covarianza en función de los momentos respecto al origen en una distribución bidimensional; b) obtenga la regresión lineal simple de Y/X y de X/Y y el coeficiente de determinación de la siguiente distribución:

Page 7: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−7/11−

Y\X 2 3 4 TOTAL

4 5 6 2 13 5 4 4 2 10 6 3 6 8 17

TOTAL 12 16 12 40

Solución.- a) m11 = a11 − a10·a01 ; b) Y/X: y −3 = 74,02,0 (x − 5,1) ; X/Y : x − 5,1 =

6,02,0 (y

− 3); R2 = 6,0·74,0

04,0 ≅0,090..

12º) A partir de una muestra de 100 familias se hace un estudio de la relación entre los ingresos "x" y el ahorro "y". Los datos obtenidos, expresados en decenas de euros por mes son:

40-80 80-150 150-250 0-10 30 20 0 10-50 3 14 18 50-80 0 0 15

a) compruebe si el ahorro puede relacionarse con los ingresos según modelo lineal; b) calcular dicha función; c) ¿qué ocurriría con el ahorro si todas las familias aumentaran sus ingresos en 20 €?. Solución.- a) De la tabla de correlación extraemos la siguiente tabla:

xi yi ni xini yini xi2ni yi

2ni xiyini 60 5 30 1800 150 108000 750 9000 60 30 3 180 90 10800 2700 5400

115 5 20 2300 100 264500 500 11500 115 30 14 1610 420 185150 12600 48300 200 30 18 3600 540 720000 16200 108000 200 65 15 3000 975 600000 63375 195000

100 12.490 2.275 1.888.450 96.125 377.200 de donde se obtienen los momentos: a10 = 124,9 m20 = 3.284,49 a01 = 22,75 m02 = 443,69 a20 = 18.884,5 m11 = 930,525 a02 = 961,25 y de aquí el coeficiente de determinación ρ2 = 0,5942 y el coeficiente de correlación ρ = 0,77 que representa una dependencia del 77% entre las variables, aceptable para hacer predicciones con el modelo lineal. b) La recta de regresión lineal Y/X sería:

y −22,75 = 930 5253 284 49

,. ,

(x −124,9) ⇔ y = 0,2833x −12,6353

xi yi

Page 8: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−8/11−

c) De la recta de regresión se obtiene ∆y = 0,2833∆x luego si ∆x = 2 (decenas de €) ⇒ ⇒ ∆y = 0,5666 (decenas de €), luego un aumento de 20 € en los ingresos implicaría un aumento de 5,67 €. en los ahorros. 13º) Dada la relación funcional exacta entre dos variables y = bx, se ha realizado un ajuste mínimo cuadrático obteniéndose que la varianza de la variable dependiente es S2

y = 0,17. ¿Cuál sería el valor de la varianza residual (S2ry ) y de la varianza explicada por la

regresión (S2yt )?.

Solución.- Puesto que la relación entre las dos variables es funcional exacta ⇒ S2ry = 0 ;

S2yt = S2

y = 0,17 14º) Se ha observado durante 10 días el precio de un determinado producto de primera necesidad (X) y las unidades vendidas de dicho producto (Y) obteniendo los siguientes resultados:

Xi Yi 7 10005 2000

15 3002 50006 18003 7000

Obtenga 1) los momentos de 1º y 2º orden respecto al origen; 2) los momentos de 1º y 2º orden respecto a las medias; 3) ¿ cuál de las dos medias aritméticas es más representativa?; 4) la media aritmética de Y condicionada a que X = 15; 5) la recta de regresión de Y sobre X e interprete los resultados; 6) la varianza residual (S2

ry) y la varianza explicada por la regresión (S2

yt) , comentando los resultados. Solución.-

xi yi xi2 yi

2 xiyi

7 1.000 49 1.000.000 7.000 5 2.000 25 4.000.000 10.000

15 300 225 90.000 4.500 2 5.000 4 25.000.000 10.000 6 1.800 36 3.240.000 10.800 3 7.000 9 49.000.000 21.000

38 17.100 348 82.330.000 63.300

1) a10 = 6

38 ≅ 6,33; a01 = 6000.17 ≅2.850; a20 =

6348 ≅ 58; a02 =

6000.33.82 ≅ 13.721.667

2) m10 = m01 = 0 ; m20 = a20 −a102 = 58 − 40,11 = 17,89; m02 = a02 − a01

2 = 5.599.167 3) Los coeficientes de variación respectivos son:

CVX = 0,668 ; CVY = 0,830 El coeficiente de variación de X es menor que el de la Y, luego podemos considerar más representativa la media de la X.

Page 9: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−9/11−

4) 15XY = = 300 5) Se tiene Sxy = m11 = a11 −a10a01 = −7.490,5; S2

x = m20 = 17,89. Por lo tanto, la recta de regresión Y/X es: y = −418,7x + 5500

6) S2ry = m02 −

20

211

mm

= 2.462.912; S2y = m02 = a02 − a01

2 = 5.599.167 ; S2yt = S2

y − S2ry=

=3.136.255.

Puesto que R2 = 2y

2yt

SS

= 0,5601, llegamos a la conclusión que el modelo lineal no es

bueno en este caso. 15º) Se dispone de la siguiente información sobre el precio (x) y el consumo (y) de un artículo determinado

yi xi ni 7 100 36 200 2

14 30 23 500 18 180 12 700 1

a) elaborar la tabla de correlación correspondiente; b) obtener los momentos de 1er y 2º orden respecto al origen y respecto a la media; c) ¿qué opinión le merece la media aritmética de cada una de las variables?; d) en base a estos datos, ¿se podría afirmar que existe una dependencia lineal entre el precio y el consumo de este artículo? Solución.- a)

2 3 6 7 8 14 n i • xi·n i • xi2·n i •

30 0 0 0 0 0 2 2 60 1.800 100 0 0 0 3 0 0 3 300 30.000 180 0 0 0 0 1 0 1 180 32.400 200 0 0 2 0 0 0 2 400 80.000 500 0 1 0 0 0 0 1 500 250.000 700 1 0 0 0 0 0 1 700 490.000 n•i 1 1 2 3 1 2 10 2.140 884.200

yi·n•i 2 3 12 21 8 28 74 yi

2·n•i 4 9 72 147 64 392 688

b) a10 = 10140.2 = 214; a01 =

1074 = 7,4; a20 =

10200.882 = 88.420; a02 =

10688 = 68,8

m10 = m01 = 0 ; m20 = a20 −a102 = 88.420 − 45.796 = 42.624; m02 = a02 − a01

2 = 14,04

xiyi

Page 10: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−10/11−

c) Puesto que CVX = 214

45,206am

10

20 = ≅ 0,965 y CVY = 4,7

747,3am

01

02 = ≅ 0,506. Es más

representativa la media de la distribución marginal de la Y por tener menor coeficiente de variación. d) R = −0,7958 , por tanto, sí podemos considerar que existe una dependencia lineal, pues R > 0,75 16º) En la siguiente distribución conjunta calcular la varianza residual y el coeficiente de correlación:

xi yi

1 22 73 27 59 61 3

Solución.- De la tabla: xi yi xi

2 yi2 xiyi

1 2 1 4 22 7 4 49 143 2 9 4 67 5 49 25 359 6 81 36 54

11 3 121 9 3333 25 265 127 144

se obtienen los momentos: a10 = 5,5 m20 = a20 − a10

2 ≅ 13,92 a01 ≅ 4,16 m02 = a02 − a01

2 ≅ 3,81

a20 = 2656

≅ 44,17 m11 = a11 −a10·a01 ≅ 1,08

a02 = 1276

= 21,17

De aquí se deduce el coeficiente de correlación ρ = m

m m11

20 02⋅≅ 0,149 y la varianza

residual Sry2 = m02(1−ρ2) ≅ 3,72

17º) Hallar la recta de regresión de Y sobre X suponiendo que la variable X son los costes de personal (decenas de miles de euros) y la variable Y los parados (miles)de un sector de nuestra economía:

Años x y1998 2 11999 3 22000 2 42001 4 62002 6 7

Page 11: Correlacion Regresion Universidad

UNED. ELCHE. e-mail: [email protected] TUTORÍA DE FUNDAMENTOS DE ESTADÍSTICA APLICADOS AL TURISMO http://personal.telefonica.terra.es/web/imm/

EJERCICIOS DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES

−11/11−

Solución.- De la tabla:

x y x2 y2 xy 2 1 4 1 23 2 9 4 62 4 4 16 84 6 16 36 246 7 36 49 42

17 20 69 106 82se obtienen los momentos: a10 = 3,4 m20 = a20 − a10

2 ≅ 2,24 a01 ≅ 4

a20 = 695

= 13,8 m11 = a11 −a10·a01 ≅ 2,8

a02 = 106

5= 21,2

y de aquí se deduce la recta de regresión y − 4 = 1,25(x − 3,4) o bien, simplificando: 4y − 5x + 1 = 0