Estadistica y pronostico para la toma de decisiones s14

of 23 /23
Maestros Online www.maestronline.com Solicita una cotización a través de nuestros correos Maestros Online Estadística y pronóstico para la toma de decisiones Grupo de problemas Servicio de asesorías y solución de ejercicios Envía tus actividades a [email protected]

Transcript of Estadistica y pronostico para la toma de decisiones s14

Page 1: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

Solicita una cotización a través de nuestros

correos

Maestros Online

Estadística y pronóstico para la

toma de decisiones Grupo de

problemas

Servicio de asesorías y solución de ejercicios

Envía tus actividades a [email protected]

Page 2: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

Realiza lo siguiente:

1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que

no sea función de probabilidad explicar por qué no lo es.

a.

x 1 2 3 4

p(x) 0.4 0.2 0.3 0.2

c.

x -2 -1 1 2

p(x) 0.1 0.2 0.6 0.1

e.

x 0 2 4 6

p(x) -0.1 0.3 0.1 0.5

g.

x 1 2 3 4

p(x) 0.4 0.2 0 .3 0.2

2. El gerente de una planta utiliza datos históricos para construir una función de

distribución de probabilidad de X, el número de empleados ausentes en un día dado;

los datos se presentan a continuación:

x 0 1 2 3 4 5 6 7

p(x) 0.001 0.025 0.350 0.300 0.200 0.090 0.029 0.005

Determinar lo siguiente:

a. P(X=1)

b. P(X>5)

c. P(X≥5)

d. P(X=6)

Page 3: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

3. Supón que X representa el número de personas en una vivienda. La distribución de

probabilidad es como sigue:

X 1 2 3 4 5 6 7

p(x) 0.26 0.31 0.19 0.14 0.05 0.03 0.02

4.

a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga

menos de 3 personas?

b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5

personas?

c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre

2 y 4 (inclusive) personas? Determínese P (2≤X≤4).

Escribe con tus propias palabras el proceso de prueba de hipótesis y los

intervalos de confianza.

5. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los

datos son los siguientes:

3 6 3 5 6 2 6 5 5 4

a. Establecer un intervalo de confianza al 90%.

b. Establecer un intervalo de confianza al 95%.

c. Establecer un intervalo de confianza al 99%.

5. Del experimento para determinar los grados centígrados necesarios para llevar el

punto de ebullición un litro de agua, se obtuvieron los siguientes resultados:

100.0 100.2 99.7 99.5 99.5 100.3

99.0 99.4 99.9 100.2 100.1 99.8

a. Prueba la hipótesis de que la media es igual a 100 (H0: μ = 100) contra la

alternativa de que la media poblacional es diferente a 100 (Ha: μ ≠ 100). El

nivel de significancia es del 1% (α = 0.01). Realiza todas las etapas de una

prueba de hipótesis.

b. Establece intérprete el intervalo de confianza al 99% para la media de

ebullición μ.

Page 4: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

6. Por un período de varios años, un dentífrico ha recibido una puntuación media de 5.9,

en una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el

producto. Debido a un cambio no anunciado en el producto, existe la preocupación de

que quizás haya cambiado la satisfacción del cliente. Supón que las puntuaciones

para una muestra de 25 clientes tienen una media de 5.60 y una desviación estándar

de 0.87. ¿Indican estos datos que la satisfacción del cliente es diferente de 5.9?

a. Prueba la hipótesis con α = 0.05.

b. Obtén un intervalo de confianza al 95% para la media μ.

1. Describe con tus propias palabras qué significa una serie de tiempo.

2. Enlista y define las componentes de una serie de tiempo.

3. ¿Cuál de las cuatro componentes de una serie de tiempo se utilizaría para describir el

efecto de las ventas navideñas de una tienda departamental de menudeo?

4. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un

componente estacional que uno que posee un componente cíclico?

5. Los datos que se presentan a continuación corresponden al número de autos de

pasajeros (en miles) en Francia durante los años 1970 a 2006.

Año 1970 1975 1979 1980 1981 1982 1983 1984 1985 1986

Númer

o de

autos

(miles)

1247

0

1552

0

1844

0

1913

0

1975

0

2030

0

2060

0

2080

0

2109

0

2150

0

Año 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996

Númer

o de

autos

(miles)

2197

0

2252

0

2301

0

2355

0

2381

0

2402

0

2438

5

2490

0

2510

0

2550

0

Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

Page 5: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

Númer

o de

autos

(miles)

2609

0

2681

0

2748

0

2806

0

2870

0

2916

0

2956

0

2990

0

3010

0

3040

0

6. Grafica el número de autos contra los años (utiliza Excel o cualquier paquete

estadístico como Minitab).

7. ¿Qué componentes de la series de tiempo parecen estar presentes en esta serie?

8. Realiza los siguientes ejercicios.

Ejercicio 1

El gerente de un banco está interesado en reducir el tiempo que las personas esperan para ver a

su

asesor financiero. También le interesa la relación entre el tiempo de espera (Y) en minutos y el

número

de asesores atendiendo (X). Se registraron los siguientes datos:

X 2 3 5 4 2 6 1 3 4

Y 12.8 11.3 3.2 6.4 11.6 3.2 8.7 10.5 8.2

a. Calcula el coeficiente de correlación.

Una empresa refresquera está estudiando el efecto de su última campaña publicitaria. Se eligieron

personas al azar y se les llamó para preguntarles cuántas latas de su refresco habían comprado la

semana anterior y cuántos anuncios de su refresco habían leído o visto durante el periodo. Los

datos se

presentan a continuación:

X (número de anuncios) 3 7 4 2 0 4 1 2

Y (latas compradas) 11 18 9 4 7 6 3 8

a. Determina el coeficiente de correlación.

Ejercicio 2

Page 6: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com El siguiente conjunto de datos son las ventas semanales de un artículo de comida (en miles).

Determinen

el coeficiente de autocorrelación

1

r

y prueben la hipótesis de que:

Hipótesis nula:

H : 0

0 1

(la autocorrelación es igual a cero)

Hipótesis alternativa:

H : 0

a 1

(la autocorrelación es diferente de cero)

Donde

es el coeficiente de autocorrelación poblacional en el lapso k

Utiliza

Ventas

semanales

Yt

2.6

2.8

Page 7: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com 3.0

3.8

4.0

3.2

3.5

2.4

1.8

2.2

3.4

1.4Enseguida se presentan los precios diarios al cierre (en dólares por acción)

Período

t

t

Y

Precio,

1 82.87

2 83.00

3 83.61

4 83.15

5 82.84

6 83.99

7 84.55

8 84.36

9 85.53

10 86.54

11 86.89

Page 8: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com 12 87.77

13 87.29

14 87.99

15 88.80

16 88.80

17 89.11

18 89.10

19 88.90

20 89.21

a. Prueba si existe autocorrelación en estos datos. Utiliza:

¿Cuánto tiempo dedica una persona en promedio a Internet?

Para tener una idea de esto, realiza lo siguiente:

1. Pregunta de manera individual a 10 personas del género masculino y a 10 personas

del género femenino la siguiente información:

a. Su edad

b. Tiempo que dedica diariamente a Internet

2. Con una calculadora de bolsillo y con base en esta información determina:

a. En promedio, ¿quién dedica más tiempo a Internet, hombres o mujeres?

b. ¿Cuál es el promedio de edad de las mujeres?, ¿de los hombres?

c. Para los géneros por separado determina la mediana de la edad y del tiempo

dedicado a Internet.

d. Para el total de datos determina la varianza y la desviación estándar del tiempo

que dedican a Internet y de la edad.

3. Utiliza Excel para elaborar una base de datos donde incluyas toda la información. Con

una calculadora de bolsillo contesta lo siguiente:

a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado

a Internet como de la edad?

c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo

dedicado a Internet y para la edad?

Page 9: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

4. Verifica lo anterior utilizando herramientas de análisis de Excel.

5. Para finalizar, reflexiona sobre las siguientes preguntas y prepara un documento con

respuestas a manera de conclusiones.

6. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del

Banco de México y realiza lo que se indica:

a. Considera las últimas 12 cotizaciones de la TIIE

b. Determina el coeficiente de autocorrelación r1

c. Determina la prueba la hipótesis de que:

Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero)

Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero)

Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k

7. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del

Banco de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se

indica,

a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en

4to periodo, por medio de un promedio móvil de k= 3 meses.

b. Determina el valor de pronóstico para el rendimiento del bono para cada mes,

comenzando en el periodo 6, mediante un promedio móvil de k=5 meses.

c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α =

0.2 y un valor inicial igual a la primera lectura del TIIE 28 DÍAS.

d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media

(DAM), Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio

(EPAM) y Error Porcentual Medio (EPM).

e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica.

Para el total del conjunto de datos:

a. ¿Cuál es el promedio general, tanto del el tiempo dedicado a Internet como de la edad?

b. ¿Cuál es la desviación estándar para todo el conjunto de datos?

c. Supón que se tiene información de que el promedio que dedica una persona (sin

importar su género) es de 7 horas diarias; con los datos anteriores prueba las siguientes

hipótesis:

: 7 H0

Page 10: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com contra la alternativa de que

: 7 Ha

con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a internet diferente de 7?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Establece un resumen de los hallazgos.

Para los datos género masculino:

a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la desviación estándar para estos datos del género masculino?

c. Supón que se tiene información de que el promedio que dedican los hombres a Internet

es de 5 horas diarias. Con los datos para este género prueba las siguientes hipótesis:

: 5 H0

contra la alternativa de que

: 5 Ha

con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a internet diferente de 5 horas diarias?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Establece un resumen de los hallazgos.

Para los datos género femenino:

a. ¿Cuál es el promedio del tiempo dedicado a Internet y de la edad?

b. ¿Cuál es la desviación estándar para estos datos del género femenino?

Page 11: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com c. Supón que se tiene información de que el promedio que dedican las mujeres a Internet

es de 8 horas diarias; con los datos para este género prueba las siguientes hipótesis:

: 8 H0

contra la alternativa de que

: 8 Ha

con un nivel de significancia de 0.05.

Realiza todas las etapas de una prueba de hipótesis y concluye en el contexto del

problema ¿Es el tiempo promedio dedicado a internet diferente de 8 horas diarias?

d. Establece e interpreta el intervalo de confianza al 95%.

e. Establece un resumen de los hallazgos.

I. Realiza lo siguiente:

1. En un estudio de variables que afectan la productividad en el negocio de

abarrotes al menudeo, W. S. Good usa el valor agregado por hora de trabajo

para medir la productividad de tiendas de abarrotes al menudeo. Él define el

“valor agregado” como el “excedente [dinero generado por el negocio]

disponible para pagar mano de obra, muebles accesorios y equipo”. Los datos

de acuerdo con la relación del valor agregado por hora de trabajo Y y el

tamaño X de la tienda de abarrotes descrita en el artículo de Good para diez

tiendas de abarrotes ficticias se muestran enseguida. Se establecerá un

modelo para relacionar Y con X.

Datos en relación con el tamaño de tienda y el valor agregado

Tienda Valor agregado

por hora de trabajo

Y

Tamaño de la tienda

(miles de pies cuadrados)

X

1 6.08 23.0

Page 12: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

2 5.40 14.0

3 5.51 27.2

4 5.09 12.4

5 4.92 33.9

6 3.94 9.8

7 6.11 22.6

8 5.16 17.5

9 5.75 27.0

10 5.60 21.1

a. Realiza un diagrama de dispersión de los datos para Y contra X.

b. Calcula las rectas de mínimos cuadrados para Y contra X.

c. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea

por medio de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir

los datos? Éste es un ejemplo de análisis de residuales.

2. En un experimento con conejos se tomaron en cuenta las siguientes variables:

Y: Proporción del peso final al peso inicial.

X: Gramos diarios de alimento por kg de peso inicial.

Proporción de

peso final al

peso inicial

Y

Gramos diarios

de alimento por kg

de peso inicial

X

Proporción de peso final

al

peso inicial

Y

Gramos diarios de

alimento por kg de

peso

inicial

X

0.91 10 1.16 33

0.88 15 0.96 35

0.90 18 1.08 36

0.79 19 1.13 37

0.94 20 1.00 39

0.88 21 1.10 42

0.95 21 1.11 45

0.97 24 1.18 54

Page 13: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

0.88 25 1.26 56

1.01 27 1.29 56

0.95 28 1.36 59

0.95 30 1.40 59

1.05 30 1.32 60

1.05 31 1.47 64

a. Realiza un diagrama de dispersión de los datos para Y contra X.

b. Calcula las rectas de mínimos cuadrados para Y contra X.

c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las

etapas de la prueba de hipótesis (α = 0.01).

d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15,

25, 30, 35.5, 39, 45, 60, 70, 80, 90.

Calcula el intervalo de confianza de los valores particulares de Y para los valores

dados de X0 del inciso anterior.

Realiza los siguientes ejercicios (utiliza Excel o un paquete de software estadístico

como Minitab).

3. Una empresa ha estado buscando los factores que influyen en la cantidad de

acero (en millones de toneladas) que puede vender cada año. La

administración sospecha que los siguientes son los factores principales: la tasa

anual de inflación del país, el precio promedio por tonelada de acero importado

que acota los precios (en dólares) y el número de automóviles (en millones)

que los fabricantes de autos planean producir ese año. Se recolectaron los

datos de los últimos siete años:

Millones

de tons.

vendidas

Y

Tasa de

inflación X1

Cota de Importaciones

X2

Número de

automóviles (millones) X3

4.2 3.1 3.10 6.2

3.1 3.9 5.00 5.1

4.0 7.5 2.20 5.7

4.7 10.7 4.50 7.1

Page 14: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

4.3 15.5 4.35 6.5

3.7 13.0 2.60 6.1

3.5 11.0 3.05 5.9

a. Estima la ecuación de regresión múltiple.

b. Interpreta los coeficientes de regresión estimados.

4. Se llevó a cabo un conjunto de ensayos experimentales para determinar una

forma de predecir el tiempo de cocimiento en minutos Y a varios niveles de

amplitud del horno, pies X1 y temperatura de cocción, grados Celsius X2. Los

datos obtenidos fueron registrados como se muestra a continuación:

Tiempo de

cocimiento

Y

Niveles de amplitud

del horno, pies X1

Temperatura

en grados Cº

X2

6.40 1.32 1.15

15.05 2.69 3.40

18.75 3.56 4.10

30.25 4.41 8.75

44.85 5.35 14.82

48.94 6.20 15.15

51.55 7.12 15.32

61.50 8.87 18.18

100.44 9.80 35.19

111.42 10.65 40.40

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal

múltiple.

b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del

horno es de 5 pies y la temperatura de cocción es de 20 grados

Celsius.

b. El supervisor de una empresa está examinando la relación existente entre la

calificación que obtiene un empleado en una prueba de aptitud, su experiencia

previa y el éxito en el trabajo. Se estudia y se pondera la experiencia de un

Page 15: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

empleado en trabajos anteriores y se obtiene una calificación entre 2 y 12. La

medida del éxito en el empleo se basa en un sistema de puntuación que

incluye producción total y eficiencia, con valor máximo posible de 50. El

supervisor tomó una muestra de seis empleados con menos de un año de

antigüedad, y obtuvo lo siguiente:

Evaluación

del

desempeño

Y

Resultado de la

prueba

de aptitud X1

Experiencia en

trabajos

anteriores (años) X2

28 74 5

33 87 11

21 69 4

40 93 9

38 71 7

46 97 10

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal

múltiple.

b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una

experiencia en trabajos anteriores de 7 años, ¿qué evaluación de

desempeño puede esperar?

Realiza los siguientes ejercicios. Utiliza un Excel o cualquier otro paquete estadístico, como

Minitab.

Ejercicio 1

1. La energía eléctrica consumida Y cada mes por una planta química se considera

relacionada con la temperatura ambiente promedio en grados Fahrenheit X1, número

de días al mes X2, la pureza promedio del producto en porciento X3 y las toneladas

obtenidas del producto X4. Se dispone de los datos históricos del año anterior, lo

cuales se presentan enseguida:

Page 16: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

Y

Temperatura en

grados Fahrenheit

X1

Días

X2

Porcentaje de

pureza

X3

Toneladas

de producto

X4

240 25 24 91 100

236 31 21 90 95

290 45 24 88 110

274 60 25 87 88

301 65 25 91 94

316 72 26 94 99

300 80 25 87 97

296 84 25 86 96

267 75 24 88 110

276 60 25 91 105

288 50 25 90 100

261 38 23 89 98

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas

las etapas de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales; realiza

todas las etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

g. Pronostica la energía eléctrica consumida Y cuando la temperatura ambiente

promedio X1 es de 30, el número de días al mes X2 es de 25 grados

Fahrenheit, la pureza promedio del producto en porciento X3 es de 92 y las

toneladas obtenidas del producto X4 es de 95.

h. Calcula R2.

i. Construye un intervalo de confianza para las pendientes de la población β1, β2 ,

β3 y β4.

Ejercicio 2

Page 17: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

2. Un negocio de ventas por catálogo de computadoras

personales, software y hardware mantiene un almacén centralizado para la distribución

de los productos ordenados. La administración examina el proceso de distribución y

está interesada en examinar los factores que afectan los costos. En la actualidad, se

cobra una pequeña cuota por manejo, independiente del monto de la orden. Se

recolectaron datos de los últimos 24 meses, que indican los costos de distribución Y,

las ventas X1 y el número de órdenes recibidas X2. Los resultados son los siguientes:

Costo de

Distribución

(miles de dólares)

Y

Ventas

(miles de

dólares)

X1

Órdenes

X2

52.95 386 4015

71.66 446 3806

85.58 512 5309

63.69 401 4262

72.81 457 4296

68.44 458 4097

52.46 301 3213

70.77 484 4809

82.03 517 5237

74.39 503 4732

70.84 535 4413

54.08 353 2921

62.98 372 3977

72.30 328 4428

58.99 408 3964

79.38 491 4582

94.44 527 5582

59.74 444 3450

90.50 623 5079

93.24 596 5735

Page 18: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

69.33 463 4269

53.71 389 3708

89.18 547 5387

66.80 415 4161

Con base en los resultados obtenidos:

a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple.

b. Interpreta los coeficientes de regresión en el contexto del problema.

c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula e interpreta R2 en el contexto del problema.

f. Calcula el error estándar de estimación.

g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las

ventas son de 400,000 dólares y el número de órdenes es de 4,500.

h. Calcula R2ajustada.

i. Construye un intervalo de confianza para las pendientes de la población (β1 y β2).

Ejercicio 3

3. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas

como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia

ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos

se recolectaron en las doce semanas posteriores al inicio de la campaña de

publicidad.

Tiempo

Semanas

(X)

Ventas

(miles de dólares)

(Y)

1 4,618

2 3,741

3 5,836

4 4,367

5 5,118

6 8,887

Page 19: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

7 19,746

8 34,215

9 50,306

10 65,717

11 86,434

12 105,464

a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus

ventas.

b. Encuentra el coeficiente de determinación e interprétalo en el contexto del

problema.

c. ¿Estás satisfecho con el modelo como pronosticador de ventas Y? Explica.

Realiza todas las etapas de una prueba de hipótesis con α = 0.05.

d. Transforma la variable independiente X2, luego corre de nuevo el modelo con X

y X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste

para los datos? Explica. Realiza todas las etapas de una prueba de hipótesis

con α = 0.05.

e. Encuentra el coeficiente de determinación e interprétalo en el contexto del

problema. Compáralo con el obtenido en el inciso b, ¿cuál modelo prefieres?,

¿por qué?

Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que

te llevaron a la respuesta.

Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida

cotidiana. ¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este

módulo?

1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un

centro comercial y la distancia desde la casa en donde tú vives? Entrevista a 20

compañeros y pregúntales el tiempo que tardan en llegar al centro comercial y la

distancia a su casa. Después denomina a la variable tiempo en minutos como Y y a la

distancia en km como X.

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de

ambas variables. ¿Qué clase de relación crees que existe entre estas

dos variables? ¿A mayor distancia es mayor el tiempo?

ii. Calcula la recta de regresión de mínimos cuadrados.

Page 20: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

iii. ¿Existe evidencia que indique que a mayor distancia es mayor el

tiempo en llegar? Prueba la significancia de la recta de regresión con

un nivel de significancia α = 0.01.

iv. ¿Es significativa esta regresión? Realiza todas las etapas de una

prueba de hipótesis. Concluye en el contexto del problema.

v. Pronostica el tiempo en llegar al centro comercial si la distancia es de

3, 4 y 6 kilómetros de distancia.

vi. Calcula el coeficiente de correlación.

vii. Determina e interpreta el coeficiente de determinación en el contexto

del problema.

viii. Realiza un breve resumen de los hallazgos.

2. ¿Existe relación entre el peso de una persona y la medida de su cintura en

centímetros? Selecciona 10 personas del género masculino y 10 personas del género

femenino y pídeles que te den su peso en kilogramos y la medida de su cintura en

centímetros. Posteriormente denomina a la variable peso como Y y a la medida de la

cintura como X.

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de

ambas variables. ¿Qué clase de relación crees que existe entre estas

dos variables? ¿A mayor medida de la cintura es mayor el peso?

ii. Calcula la recta de regresión de mínimos cuadrados. ¿Existe evidencia

que indique que a mayor medida de la cintura es mayor el peso?

Prueba la significancia de la recta de regresión con un nivel de

significancia α = 0.01. ¿Es significativa esta regresión? Realiza todas

las etapas de una prueba de hipótesis. Concluye en el contexto del

problema.

iii. Pronostica el peso si las medidas de cintura son de 66, 80 y 86

centímetros.

iv. Calcula el coeficiente de correlación.

v. Determina e interpreta el coeficiente de determinación en el contexto

del problema.

vi. Realiza un breve resumen de los hallazgos.

3. Busca información de 20 casas en venta en donde las variables son Y (metros de

construcción) y X (metros de terreno), y realiza lo que se te indica:

a. Contesta lo siguiente:

i. Realiza el diagrama de dispersión y describe el comportamiento de

ambas variables.

ii. ¿Qué clase de relación crees que existe entre estas dos variables?

iii. Calcula la recta de regresión de mínimos cuadrados.

Page 21: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

iv. Prueba la significancia de la recta de regresión con un nivel de

significancia α = 0.01.

v. ¿Es significativa esta regresión? Explica. Concluye en el contexto del

problema. Realiza todas las etapas de una prueba de hipótesis.

vi. Pronostica los metros de construcción cuando los metros de terreno

son de 90, 100 y 150 metros.

vii. Calcula el coeficiente de correlación.

viii. Determina e interpreta el coeficiente de determinación en el contexto

del problema.

ix. Realiza un breve resumen de los hallazgos.

4. Revisa la siguiente información tomada de la sección de avisos de ocasión.

Precio

(miles de pesos)

Y

Metros de

terreno X1

Metros de

construcción X2

Número de

recámaras X3

2700 288 378 4

1895 160 252 4

1397 230 252 4

1795 234 167 2

650 72 124 4

850 128 262 4

3875 188 246 4

4300 390 380 3

11850 885 775 4

11900 885 775 3

3250 150 233 3

6700 406 420 3

5499 320 390 4

4250 170 244 4

4250 170 233 3

470 160 127 3

500 90 73 2

550 91 73 2

Page 22: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com

650 110 90 2

550 90 74 2

620 172 76 2

1700 189 374 4

2330 300 330 4

1600 136 140 3

1100 144 290 3

Información obtenida de: http://www.avisosdeocasion.com solo para fines educativos.

Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo siguiente:

a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de

regresión lineal múltiple.

b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las

etapas de una prueba de hipótesis.

c. Pronostica el precio para los siguientes datos:

Metros de

terreno

( X1 )

Metros de

construcción

(X2 )

Número de

recámaras

( X3 )

180 390 4

200 250 3

230 200 4

250 180 2

100 120 3

d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las

etapas de una prueba de hipótesis para cada uno de los coeficientes.

e. Calcula el error estándar de estimación.

f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3).

g. Calcula e interpreta R2 en el contexto del problema.

h. Calcula R2ajustada.

i. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el

modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad?

j. Finalmente prepara un documento presentando un resumen de tus hallazgos.

Page 23: Estadistica y pronostico para la toma de decisiones s14

Maestros Online www.maestronline.com