Post on 19-Jul-2016
ESTADISTICA ------- REGRESION LINEAL SIMPLE
EJERCICIOS - REGRESIÓN LINEAL SIMPLE
1. En una muestra de 10 adultos se registraron las siguientes mediciones de edad en años (X) y la hipertensión arterial (HTA) (Y):
X 38 42 43 46 48 50 54 60 65 67Y 120 124 135 138 135 140 143 150 160 170
a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?
b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.
c. De seguir la tendencia, cuánto se espera aumente la HTA para el próximo año.
a. Indique la tendencia y obtenga la línea recta de regresión de la HTA en función de la edad. ¿Qué opina Ud. del nivel de correlación entre las dos variables?
Y=A+BX B = 1.4869A = 65.2214
Y=65.2214+1.4869X
1
PERSONAS EDAD(X) HTA(Y) XY XX YY
1 38 120 4560 1444 144002 42 124 5208 1764 153763 43 135 5805 1849 182254 46 138 6348 2116 190445 48 135 6480 2304 182256 50 140 7000 2500 196007 54 143 7722 2916 204498 60 150 9000 3600 225009 65 160 10400 4225 2560010 67 170 11390 4489 28900∑ 513 1415 73913 27207 202319
N = 10
MEDIA DE X = 51.3
MEDIA DE Y = 141.5
ESTADISTICA ------- REGRESION LINEAL SIMPLE
35 40 45 50 55 60 65 700
20
40
60
80
100
120
140
160
180
f(x) = 1.48691158296821 x + 65.2214357937311R² = 0.938672778468123
Chart Title
Series2Linear (Series2)Linear (Series2)
b. Compruebe la idoneidad del modelo lineal de regresión. Si el modelo es apropiado pronostique la HTA de un adulto de 70 años.
COEFICIENTE DE COREELACION DE PIRSON r= 0.9689
COEFIECIENTE COVARIANZA = 1323.5
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.9689 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR
SI X=70, ENTONCES Y=
169.305247
% VARIANZA TOTAL = 100%% EXPLICADA POR LA RR= 94%%VAR NO EXPLICADA= 6%
c. de seguir la tendencia, cuánto se espera aumente la hta para el próximo año.
la variación del siguiente año es =1.5
2
ESTADISTICA ------- REGRESION LINEAL SIMPLE
2. Un estudio de mercado trata de averiguar si es efectiva la propaganda televisada de un producto que salió a la venta con relación al tiempo de publicidad (horas/semana). Se recopilaron datos a partir de la segunda semana de iniciada la publicidad resultando la tabla siguiente. No se pudo recopilar datos de la cuarta semana.
Semana 2 3 4 5 6 7Tiempo de propaganda 20 25 22 28 36 40Venta del producto S/. 300 310 - 320 350 420
Semana Tiempo de Venta XX YY XY
Propaganada (X)
del producto (Y)
2 20 300 400 90000 60003 25 310 625 96100 77504 22 297 484 88209 65345 28 320 784 102400 89606 36 350 1296 122500 126007 40 420 1600 176400 16800
∑ Total 171 1997 5189 675609 58644
n=6Media X =28.5Media Y =332.8
y = a + bx
b=5.5
a=176.6
a. Es efectiva la publicidad del producto
Y = 176.6 +5.5X
COEFICIENTE DE CORRELACION DE PIRSON r= 0.9309COEFIECIENTE COVARIANZA = 1729.5
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.9309 ˃0.60, por lo tanto la recta de regresion es confiable para predicir
b. En cuanto estimaría las ventas para la semana 4?
Reemplazando datos ala ecuación 1 del cuadro anterior.
3
ESTADISTICA ------- REGRESION LINEAL SIMPLE
hallamos la venta para la semana cuarta utilizando la formula siguiente: Media = Y Media= X
(Y)= y (X)= x
y - Y = b (x-X)…….. 1
Reemplazando datos ala ecuación 1 del cuadro anterior.
m -(1700+𝑚)/6= b (22-28.5)
Ahora calculamos la b.
𝑏= (6(52110+22𝑚) −171 (1700+𝑚))/ (6(5189) − (〖171) 〗^2)) 𝑏= (21960−3𝑚)/1893 (6𝑚−1700−𝑚)/6=(21960−39𝑚)/1893(−6.5)
(6𝑚−1700−𝑚)/2=(21960−39𝑚)/631(−6.5)
3155m-631*1700 = (2(21960)-78m) (-6.5m)
3155m-631*(1700) = -285480+507m
2648m = 787220
m = 297.3 = 297.
3. Un editor tomó una muestra de 7 libros, anotando el precio y el número de páginas respectivo, si los resultados:
Nro. de Pago. 630 550 400 250 370 320 610Precio S/. 10 8 7 4 6 6 9
a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el fin de predecir precios. ¿Qué porcentaje de la varianza total de precios se explica por esta función?.
b. Estime el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 páginas en una segunda edición. En cuento se incrementaría su precio.
c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.
4
ESTADISTICA ------- REGRESION LINEAL SIMPLE
200 250 300 350 400 450 500 550 600 650 7000
2
4
6
8
10
12
f(x) = 0.0132557145908994 x + 1.21565904721213R² = 0.945421942948628
PRECIO
a. Obtenga el modelo de regresión lineal simple entre el precio y el número de páginas, con el
Fin de predecir precio. ¿Qué porcentaje de la varianza total de precios se explica por esta función?
Y = 1.216+0.01326X
b. Estima el precio de un libro de 300 páginas. Si a este libro se le incrementa 20 paginas en una segunda edición. En cuanto se incrementara su precio.
COEFICIENTE DE CORRELACION DE PIRSON r= 0.9723COEFIECIENTE COVARIANZA =1772.857143
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.9723 ˃0.60, por lo tanto la recta de regresion es confiablepara predicir
5
N° DE LIBROS
N° de Pagina (X) Precio S/. (Y) XX YY XY
1 630 10 396900 100 63002 550 8 302500 64 44003 400 7 160000 49 28004 250 4 62500 16 10005 370 6 136900 36 22206 320 6 102400 36 19207 610 9 372100 81 5490
∑ Total 3130 50 1533300 382 24130
ESTADISTICA ------- REGRESION LINEAL SIMPLE
SI X=300, ENTONCES Y= 5.19
Si incrementa en 20 paginas entonces seria 320 hojas, entonces x=320
y= 5.46 y ahora la diferencia es = 0.27
RPTA.
% VARIANZA TOTAL = 100%% EXPLICADA POR LA RR =95%%VAR NO EXPLICADA= 5%
c. Cuántas páginas debería tener un libro cuyo precio se estima en 12.27 soles.
SI Y = 12.27, ENTONCES X= 833.93
4. Una muestra de 5 varones adultos de quienes se observaron las estaturas (X en pies, pulgadas) y los pesos (Y en libras) ha dado los siguientes resultados:
X 5´1´´ 5´2´´ 5´3´´ 5´4´´ 5´5´´Y 125 130 140 145 160
a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.
b. Usando la descomposición de la varianza calcule r2 e interprete el resultado.
Varones Publicidad (X) Ventanas (Y) XX YY XY1 0.039 125 0.001521 15625 4.8752 0.077 130 0.005929 16900 10.013 0.116 140 0.013456 19600 16.244 0.154 145 0.023716 21025 22.335 0.193 160 0.037249 25600 30.88
∑Total 0.579 700 0.081871 98750 84.335
Publicidad (X)5´1´´= 0.03855´2´´= 0.0775´3´´=0.11555´4´´=0.1545´5´´= 0.1925
0.579
6
ESTADISTICA ------- REGRESION LINEAL SIMPLE
1pies*pulg = 7.7*(10*-3)
n=5Media X =0.12Media Y =140.0
y = a + bx
b= 220.94
a=114.41
a. Realice una regresión lineal y utilice los datos para verificar que la varianza total de Y es igual a la varianza residual más la varianza explicada por la recta de regresión.
Y = 114.41+ 220.94 X
0 1 2 3 4 5 6 70
20000
40000
60000
80000
100000
120000
R² = 0.533169941492629f(x) = 12661.4285714286 x − 11398.3333333333
PESO
Ventanas (Y) XX YYLinear (YY) Linear (YY) XY
b. Usando la descomposición de la varianza calcule r2 e interprete el resultado.
COEFICIENTE DE CORRELACION DE PIRSON r= 0.982235323
COEFIECIENTE COVARIANZA =3.275
r es positiva, indica que tiene una tendencia lineal positiva, a mayor X, mayor Y
r = 0.98224 ˃0.60, POR LO TANTO LA RECTA DE REGRESION ES CONFIABLEPARA PREDICIR
r2 =0.9648
7
ESTADISTICA ------- REGRESION LINEAL SIMPLE
5. Una compañía de alimentos maneja una cadena de tiendas al menudeo. Para medir la eficiencia de las tiendas se estudió la relación del número de empleados (X) y el promedio del volumen de ventas mensuales (Y) en cientos de dólares para todas las tiendas durante el año pasado. La gráfica de los datos sugiere una relación lineal entre las variables. Se tiene la siguiente información:
n=100, ∑X=600, ∑Y=1600, ∑XY=13600, ∑X2=5200, ∑Y2=37700
a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?
b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?
c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.
EMPLEADOS
N. EMPL.(X)
P. VENT. (Y) XY XX YY
∑ 600 1600.00 13600 5200 37700
1.54 1.56 1.58 1.6 1.62 1.64 1.660.00
10.00
20.00
30.00
40.00
50.00
60.00
70.00
80.00
f(x) = 155.308917197452 x − 184.679649681529R² = 0.981335070867806
VENTAS
N = 100MEDIA DE X =6.000MEDIA DE Y =16.000
Y=A+BX
B =2.50A =1.00
Y=2.50X-1.00
Covarianza COVxy=4000coef. Correlación de Pearson r =0.9091copef. De determinación r*r = 0.8264r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y
r=0.9723>0.60, por lo tanto la recta de regresion es confiable para predecir.
8
ESTADISTICA ------- REGRESION LINEAL SIMPLE
a. Obtenga el modelo de regresión lineal simple para predecir las ventas a partir del número de empleados. ¿En cuánto se estiman las ventas para una tienda de 8 empleados?
si, X=8, entonces Y=21.000el precio incremento se le aumenta 20pag mas si, X=320, entonces Y= 801.000
b. ¿Qué porcentaje de las varianzas de las ventas es explicada por la variabilidad del número de empleados?
% varianza total= 100%% var. Explicada por la RR= 82.6%% var. No explicada= 17.4%
c. ¿Cuántos empleados tiene la tienda cuya venta promedio se estima en 1100 dólares.
El número de empleados que tiene la tienda, si su venta promedio es 1100 dólares es: 440.4
6. Sea Y el índice de precios al consumidor, tomando como base al año 2000 (es decir 2000=100). Para los datos que siguen:
Año 2001 2002 2003 2004 2005 2006 2007Y 106.0 111.1 117.2 121.3 125.2 128.0 132.6
a. Obtenga la recta de mínimos cuadrados que se ajuste a los datos.b. Realice la predicción del índice de precios para el año 2008, y compararlo con el
valor verdadero (144.4). ¿En qué año podemos esperar que el índice de precios sea 150.57, suponiendo que las tendencias presentes continúen?.
N AÑO(X) IND. CONS.(Y) XY XX YY
1 2001 106.0 212106 4004001 112362 2002 111.1 222422.2 4008004 12343.213 2003 117.2 234751.6 4012009 13735.844 2004 121.3 243085.2 4016016 14713.695 2005 125.2 251026 4020025 15675.046 2006 128.0 256768 4024036 163847 2007 132.6 266128.2 4028049 17582.76∑ 14028 841.4 1686287.2 28112140 101670.54
9
ESTADISTICA ------- REGRESION LINEAL SIMPLE
2000 2001 2002 2003 2004 2005 2006 2007 20080.0
20.0
40.0
60.0
80.0
100.0
120.0
140.0
f(x) = 4.34285714285714 x − 8582.88571428571R² = 0.988453989764212
INDICE DE PRECIOS
N = 7
MEDIA DE X =2004.000
MEDIA DE Y =120.200
Y=A+BX
B =4.3429
A =-8582.9
Y=4.33429X-8582.9
covarianza COVxy=121.6
coef. Correlación de Pearson r = 0.9942
copef. De determinación r*r = 0.9885
r es positiva, indica que tiene un a tendencia lineal positiva, a mayor X, mayor Y
r=0.6337>0.60, por lo tanto la recta de regresión es confiable para predecir.si, Y=150.57, entonces X=2011
% varianza total =100%
% var. Explicada por la RR =98.8%
% var. No explicada =1.2%
10